V tem vodniku vam bom predstavil funkcijo IMPORTXML v Google Sheets. Ta izjemno koristna funkcija vam omogoča, da izvlečete podatke iz poljubnega URL-ja. Ne glede na to, ali želite pridobiti trenutne finančne novice, borzne tečaje ali druge informacije s strukturiranih spletnih mest, vam bo funkcija IMPORTXML pomagala. V tem vadnici se bomo praktično lotili spletnega mesta finanzen.net in preizkusili nekaj primerov, da pojasnimo delovanje funkcije IMPORTXML.
Najpomembnejše ugotovitve
Funkcija IMPORTXML v Google Sheets vam omogoča, da uvozite strukturirane podatke s katerih koli spletnih mest v svoj list. S to funkcijo lahko ciljno izvlečete različne elemente, kot so naslovi, povezave ali drugi podatki.
Korak za korakom vodnik
Začnimo z uporabo funkcije IMPORTXML.
Najprej odprite spletno stran, s katere želite izvleči podatke. V našem primeru bomo uporabili stran finanzen.net. URL naslov lahko preprosto kopirate tako, da kliknete na naslovno vrstico svojega brskalnika in ga nato shranite v odložišče s kombinacijo tipk Ctrl + C.
Sedaj odprite prazen Google Sheet, da začnete postopek. Kliknite na celico, kamor želite uvoziti svoje podatke. Sedaj vnesite funkcijo IMPORTXML v celico.
Sintaksa za funkcijo IMPORTXML je naslednja: IMPORTXML(url; xpath), pri čemer je url naslov spletne strani, s katere želimo uvoziti, xpath pa določa specifično pot, ki jo želimo pridobiti.
Zdaj vnesite kopiran URL v funkcijo. Prepričajte se, da ste URL postavili v narekovaje, za katerimi sledi podpičje. Na primer: IMPORTXML("https://www.finanzen.net"; ...).
Nato lahko navedemo posamezne elemente, ki jih želimo pridobiti s funkcijo. Primer bi bil, če bi želeli izvleči vsa H2 elementa na strani. To storimo tako, da /H2 dodamo v narekovaje.
Ko smo funkcijo izvedli, bodo H2 elementi neposredno uvoženi v naš list. Prejeli boste seznam najnovejših finančnih novic ali člankov, ki so bili objavljeni na strani finanzen.net.
Ko ste uvozili H2 elemente, lahko naredite dodatne prilagoditve. Na primer, funkcijo lahko prilagodite tako, da pridobite vse povezave na strani. To dosežete tako, da dodate: //a v svoj XPath. Tako boste dobili vse povezave na strani.
Preprosto lahko preučite, kako je spletna stran zgrajena, če odprete orodja za razvijalce v brskalniku (tipka F12). To vam bo omogočilo vpogled v HTML kodo, da boste razumeli strukturo in ciljno pridobili podatke.
Ko sledite vsem tem korakom, boste videli najnovejše novice o podjetjih in borznih tečajih s strani finanzen.net neposredno v svojem Google Sheet. Te podatke lahko uporabite za analize ali pripravo poročil.
Lahko povzamemo, da vam funkcija IMPORTXML omogoča močan način za pridobivanje podatkov s spleta in njihovo uporabo v Google Sheets. To funkcijo je mogoče prilagoditi glede na potrebe za uvoz različnih vrst podatkov.
Povzetek
V tej vadnici ste se naučili, kako s funkcijo IMPORTXML ciljno izvlečete podatke iz spletnih mest. Spoznali ste, kako pravilno uporabiti funkcijo, uporabiti pravilno sintakso in uvoziti različne elemente s spletnega mesta.
Pogosta vprašanja
Kaj je funkcija IMPORTXML?Funkcija IMPORTXML je funkcija programa Google Sheets, ki omogoča izvlečenje podatkov s spletnih strani.
Kako uporabiti IMPORTXML?Funkcijo IMPORTXML lahko uporabite tako, da navedete URL strani in ustrezno pot XPath.
Ali lahko zajamem tudi druge elemente?Da, lahko zajamete različne elemente, kot so H1, H2, povezave ali slike, tako da uporabite ustrezno sintakso XPath.
Ali lahko pridobim podatke iz zaščitene spletne strani?Ne, funkcija IMPORTXML lahko pridobi le podatke s spletne strani, do katerih je javen dostop.