U ovom članku pokazat ću vam kako osvježiti stranicu bibliotekom Selenium Python. Pa, krenimo.
Preduvjeti:
Da biste isprobali naredbe i primjere ovog članka, morate ih imati,
1) Linux distribucija (po mogućnosti Ubuntu) instalirana na vašem računalu.
2) Python 3 instaliran na vašem računalu.
3) PIP 3 instaliran na vašem računalu.
4) Python virtualenv paket instaliran na vašem računalu.
5) Mozilla Firefox ili Google Chrome web preglednici instalirani na vašem računalu.
6) Morate znati kako instalirati Firefox Gecko Driver ili Chrome Web Driver.
Za ispunjavanje zahtjeva 4, 5 i 6 pročitajte moj članak Uvod u selenij s Pythonom 3 na Linuxhintu.com.
Na LinuxHintu možete pronaći mnogo članaka o ostalim temama.com. Svakako ih pregledajte ako trebate pomoć.
Postavljanje direktorija projekta:
Da biste sve organizirali, stvorite novi direktorij projekata selen-osvježi / kako slijedi:
$ mkdir -pv selenium-refresh / upravljački programi
Idite na selen-osvježi / direktorij projekta kako slijedi:
$ cd osvježavanje selenom /
Stvorite Python virtualno okruženje u direktoriju projekta kako slijedi:
$ virtualenv .venv
Aktivirajte virtualno okruženje na sljedeći način:
$ izvor .venv / bin / aktivirati
Instalirajte biblioteku Selenium Python koristeći PIP3 kako slijedi:
$ pip3 instaliraj selen
Preuzmite i instalirajte sve potrebne upravljačke programe u vozači / direktorij projekta. U svom sam članku objasnio postupak preuzimanja i instaliranja web upravljačkih programa Uvod u selenij s Pythonom 3. Ako trebate pomoć, potražite LinuxHint.com za taj članak.
1. metoda: Korištenje metode preglednika refresh ()
Prva metoda je najlakša i preporučena metoda osvježavanja stranice selenom.
Stvorite novu Python skriptu ex01.py u njega i unesite sljedeće retke kodova.
s selena za uvoz webdriveraod selena.mrežni pogonitelj.uobičajen.tipke uvoz ključeva
od vremena uvoz san
options = webdriver.ChromeOptions ()
mogućnosti.bez glave = Istina
preglednik = webdriver.Chrome (izvršna_puta = "./ drivers / chromedriver ", options = options)
preglednik.get ("https: // www.unixtimestamp.com / ")
vremenska oznaka = preglednik.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Trenutna vremenska oznaka:% s'% (vremenska oznaka.tekst.podijeliti (") [0]))
spavanje (5)
preglednik.osvježiti()
vremenska oznaka = preglednik.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Trenutna vremenska oznaka:% s'% (vremenska oznaka.tekst.podijeliti (") [0]))
preglednik.Zatvoriti()
Kad završite, spremite ex01.py Python skripta.
Linija 1 i 2 uvozi sve potrebne komponente selena.
Redak 3 uvozi funkciju sleep () iz knjižnice vremena. Koristit ću ovo da pričekam nekoliko sekundi da se web stranica ažurira kako bismo mogli dohvatiti nove podatke nakon osvježavanja web stranice.
Redak 5 stvara objekt Chrome Options, a red 6 omogućuje način bez glave za web preglednik Chrome.
Redak 8 stvara Chrome preglednik objekt pomoću kromedriver binarni iz vozači / direktorij projekta.
Redak 9 govori pregledniku da učita web stranicu unixtimestamp.com.
Redak 11 pronalazi element koji ima podatke vremenske oznake sa stranice pomoću XPath selektora i pohranjuje ga u vremenska oznaka varijabilna.
Redak 12 analizira podatke vremenske oznake iz elementa i ispisuje ih na konzoli.
Redak 14 koristi spavati() funkcija čeka 5 sekundi.
Redak 15 osvježava trenutnu stranicu pomoću preglednik.osvježiti() metoda.
Linija 17 i 18 jednaka je liniji 11 i 12. Pronalazi element vremenske oznake sa stranice i ispisuje ažuriranu vremensku oznaku na konzoli.
Redak 20 zatvara preglednik.
Pokrenite Python skriptu ex01.py kako slijedi:
$ python3 ex01.py
Kao što vidite, vremenska oznaka otisnuta je na konzoli.
Nakon 5 sekundi ispisa prve vremenske oznake, stranica se osvježava, a ažurirana vremenska oznaka ispisuje se na konzoli, kao što možete vidjeti na snimci zaslona u nastavku.
2. metoda: Ponovno posjećivanje istog URL-a
Druga metoda osvježavanja stranice je ponovno posjetiti isti URL pomoću preglednik.dobiti() metoda.
Stvorite Python skriptu ex02.py u direktorij vašeg projekta i u njega unesite sljedeće retke kodova.
s selena za uvoz webdriveraod selena.mrežni pogonitelj.uobičajen.tipke uvoz ključeva
od vremena uvoz san
options = webdriver.ChromeOptions ()
mogućnosti.bez glave = Istina
preglednik = webdriver.Chrome (izvršna_puta = "./ drivers / chromedriver ", options = options)
preglednik.get ("https: // www.unixtimestamp.com / ")
vremenska oznaka = preglednik.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Trenutna vremenska oznaka:% s'% (vremenska oznaka.tekst.podijeliti (") [0]))
spavanje (5)
preglednik.get (preglednik.trenutni_url)
vremenska oznaka = preglednik.find_element_by_xpath ("// h3 [@ class = 'text-danger'] [1]")
print ('Trenutna vremenska oznaka:% s'% (vremenska oznaka.tekst.podijeliti (") [0]))
preglednik.Zatvoriti()
Kad završite, spremite ex02.py Python skripta.
Sve je isto kao u ex01.py. Jedina razlika je u retku 15.
Evo, koristim preglednik.dobiti() metoda za posjet URL-u trenutne stranice. URL-u trenutne stranice može se pristupiti pomoću preglednik.trenutni_url imovine.
Pokrenite ex02.py Python skripta kako slijedi:
$ python3 ex02.py
Kao što vidite, Pythion skripta ex02.py ispisuje istu vrstu podataka kao u ex01.py.
Zaključak:
U ovom sam vam članku pokazao 2 načina osvježavanja trenutne web stranice pomoću biblioteke Selenium Python. Sad biste mogli biti u mogućnosti raditi zanimljivije stvari sa Selenijem.