Selenium

Kako do trenutnog URL-a pomoću selena

Kako do trenutnog URL-a pomoću selena
Selen je alat za testiranje preglednika, automatizaciju weba i struganje weba. Dok radite na svojim projektima Selenium, možda ćete trebati znati URL stranice koju prikazuje vaš web preglednik pod nadzorom Selenium. Ove informacije mogu biti korisne za praćenje URL-a odakle ste izvukli neke podatke kako biste mogli automatski ažurirati podatke pomoću neke skripte.

U ovom članku pokazat ću vam kako doći do trenutnog URL-a preglednika pomoću selena. Pa, krenimo.

Preduvjeti:

Da biste isprobali naredbe i primjere ovog članka, morate ih imati,

1) Linux distribucija (po mogućnosti Ubuntu) instalirana na vašem računalu.
2) Python 3 instaliran na vašem računalu.
3) PIP 3 instaliran na vašem računalu.
4) Python virtualenv paket instaliran na vašem računalu.
5) Mozilla Firefox ili Google Chrome web preglednici instalirani na vašem računalu.
6) Morate znati kako instalirati Firefox Gecko Driver ili Chrome Web Driver.

Za ispunjavanje zahtjeva 4, 5 i 6, pročitajte moj članak Uvod u selenij s Pythonom 3 na Linuxhintu.com.

Na LinuxHintu možete pronaći mnogo članaka o ostalim temama.com. Svakako ih pregledajte ako trebate pomoć.

Postavljanje direktorija projekta:

Da biste sve organizirali, stvorite novi direktorij projekata selen-url / kako slijedi:

$ mkdir -pv selen-url / upravljački programi

Idite na selen-url / direktorij projekta kako slijedi:

$ cd selen-url /

Stvorite Python virtualno okruženje u direktoriju projekta kako slijedi:

$ virtualenv .venv

Aktivirajte virtualno okruženje na sljedeći način:

$ izvor .venv / bin / aktivirati

Instalirajte biblioteku Selenium Python u vaše virtualno okruženje koristeći PIP3 kako slijedi:

$ pip3 instaliraj selen

Preuzmite i instalirajte sve potrebne web upravljačke programe u vozači / direktorij projekta. U svom sam članku objasnio postupak preuzimanja i instaliranja web upravljačkih programa Uvod u selenij s Pythonom 3. Ako trebate pomoć, potražite LinuxHint.com za taj članak.

Za demonstraciju u ovom članku koristit ću web preglednik Google Chrome. Dakle, koristit ću kromedriver binarno sa selenom. Trebali biste koristiti geckodriver binarni ako želite koristiti web preglednik Firefox.

Dobivanje trenutačnog URL-a pomoću selena:

Stvorite Python skriptu ex01.py u direktorij vašeg projekta i u njega unesite sljedeće retke kodova.

s selena za uvoz webdrivera
od selena.mrežni pogonitelj.uobičajen.tipke uvoz ključeva
options = webdriver.ChromeOptions ()
mogućnosti.bez glave = Istina
preglednik = webdriver.Chrome (izvršna_puta = "./ drivers / chromedriver ", options = options)
preglednik.get ("https: // duckduckgo.com / ")
ispis (preglednik.trenutni_url)
preglednik.Zatvoriti()

Kad završite, spremite ex01.py Python skripta.

Ovdje red 1 i red 2 uvoze sve potrebne komponente iz Python biblioteke selena.

Redak 4 stvara objekt Chrome Options, a redak 5 omogućuje bezglav način rada za web preglednik Chrome.

Redak 7 stvara Chrome preglednik objekt pomoću kromedriver binarni iz vozači / direktorij projekta.

Redak 9 govori pregledniku da učita duckduckgo.com web mjesto.

Redak 10 ispisuje trenutni URL preglednika. Ovdje, preglednik.trenutni_url svojstvo koristi se za pristup trenutnom URL-u preglednika.

Redak 12 zatvara preglednik.

Pokrenite Python skriptu ex01.py kako slijedi:

$ python3 ex01.py

Kao što vidite, trenutni URL (https: // duckduckgo.com) otisnut je na konzoli.

U ranijem primjeru posjetio sam web mjesto duckduckgo.com i ispisao trenutni URL na konzoli. Ovo vraća URL stranice koju posjećujemo. Nije baš fensi, jer već znamo URL stranice. Potražimo sada nešto na DuckDuckGo i pokušajmo ispisati URL stranice rezultata pretraživanja na konzoli.

Stvorite Python skriptu ex02.py u direktorij vašeg projekta i u njega unesite sljedeće retke kodova.

s selena za uvoz webdrivera
od selena.mrežni pogonitelj.uobičajen.tipke uvoz ključeva
options = webdriver.ChromeOptions ()
mogućnosti.bez glave = Istina
preglednik = webdriver.Chrome (izvršna_puta = "./ drivers / chromedriver ", options = options)
preglednik.get ("https: // duckduckgo.com / ")
ispis (preglednik.trenutni_url)
searchInput = preglednik.find_element_by_id ('search_form_input_homepage')
searchInput.send_keys ('selenium hq' + tipke.UNESI)
ispis (preglednik.trenutni_url)
preglednik.Zatvoriti()

Kad završite, spremite ex02.py Python skripta.

Ovdje su retci 1-10 isti kao u ex01.py. Dakle, ne objašnjavam ih opet.

Redak 12 pronalazi okvir za pretraživanje i sprema ga u searchInput varijabilna.

Redak 13 šalje upit za pretraživanje selen hq u searchInput okvir za tekst i pritisne tipka pomoću Ključevi.UNESI.

Nakon učitavanja stranice za pretraživanje, preglednik.trenutni_url koristi se za pristup ažuriranom trenutnom URL-u.

Redak 15 ispisuje ažurirani trenutni URL na konzoli.

Redak 17 zatvara preglednik.

Pokrenite ex02.py Python skripta kako slijedi:

$ python3 ex02.py

Kao što vidite, Python skripta ex02.py ispisuje 2 URL-a.

Prvi je URL početne stranice tražilice DuckDuckGo.

Drugi je ažurirani trenutni URL nakon pretraživanja na pretraživaču DuckDuckGo pomoću upita selen hq.

Zaključak:

U ovom sam vam članku pokazao kako dobiti trenutni URL web preglednika pomoću biblioteke Selenium Python. Sada biste svoje projekte Selenium mogli učiniti zanimljivijima.

Najbolje igre naredbenog retka za Linux
Naredbeni redak nije samo vaš najveći saveznik pri korištenju Linuxa - on također može biti izvor zabave jer ga možete koristiti za igranje mnogih zab...
Najbolje aplikacije za mapiranje gamepada za Linux
Ako volite igrati igre na Linuxu s gamepadom umjesto tipičnim sustavom za unos tipkovnice i miša, za vas postoji nekoliko korisnih aplikacija. Mnoge r...
Korisni alati za Linux igrače
Ako volite igrati igre na Linuxu, velika je vjerojatnost da ste možda koristili aplikacije i uslužne programe poput Wine, Lutris i OBS Studio za pobol...