Znanost o podacima

Python Plotly Tutorial

Python Plotly Tutorial
Plotly je analitička tvrtka poznata po razvoju alata za analitiku, statistiku i grafike u stvarnom vremenu za web-bazirane aplikacije i samostalne Python skripte. U ovoj ćemo lekciji pogledati osnovne primjere s Plotly-om i izgraditi jednostavne i intuitivne grafikone podataka vremenskih serija koji će biti 100% interaktivne prirode, a opet jednostavni za dizajniranje. Ti se grafovi mogu koristiti u prezentacijama jer su potpuno interaktivni i spremni za igru.

Postoji i mogućnost spremanja dizajna grafikona izvan mreže kako bi se mogli lako izvesti. Postoje mnoge druge značajke koje čine knjižnicu vrlo jednostavnom:

Da bismo počeli koristiti paket Plotly, moramo se registrirati za račun na prethodno spomenutom web mjestu kako bismo dobili valjano korisničko ime i API ključ pomoću kojih možemo početi koristiti njegove funkcionalnosti. Srećom, za Plotly je dostupan plan besplatnih cijena s kojim dobivamo dovoljno značajki za izradu grafikona proizvodnog razreda.

Instaliranje Plotly

Samo napomenu prije početka, za ovu lekciju možete koristiti virtualno okruženje koje možemo napraviti slijedećom naredbom:

python -m virtualenv zacrtano
izvor numpy / bin / activate

Jednom kada je virtualno okruženje aktivno, možete instalirati knjižnicu Plotly unutar virtualne env tako da se mogu izvršavati primjeri koje sljedeći kreiramo:

pip instalirati smišljeno

U ovoj ćemo lekciji koristiti Anacondu i Jupyter. Ako ga želite instalirati na svoj stroj, pogledajte lekciju koja opisuje „Kako instalirati Anaconda Python na Ubuntu 18.04 LTS ”i podijelite svoje povratne informacije ako se suočite s bilo kojim problemom. Da biste Plotly instalirali s Anacondom, upotrijebite sljedeću naredbu u terminalu iz Anaconde:

conda install -c planski spletkano

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Nakon što se instaliraju i dovrše svi potrebni paketi, možemo započeti s korištenjem knjižice Plotly sa sljedećom izjavom o uvozu:

platno uvoziti

Nakon što napravite račun na Plotlyju, trebat će vam dvije stvari - korisničko ime računa i API ključ. Svakom računu može pripadati samo jedan API ključ. Zato ga čuvajte negdje na sigurnom, jer ako ga izgubite, morat ćete regenerirati ključ i sve stare aplikacije koje koriste stari ključ prestat će raditi.

U svim Python programima koje pišete spomenite vjerodajnice kako biste započeli rad s Plotlyjem:

spletkasto.alata.set_credentials_file (korisničko ime = 'korisničko ime', api_key = 'vaš-api-ključ')

Krenimo sada s ovom knjižnicom.

Početak rada s Plotlyjem

U našem programu koristit ćemo sljedeći uvoz:

uvoziti pande kao pd
uvoz numpy kao np
uvoz scipy kao sp
platno uvoziti.zacrtano kao py

Koristimo:

Za neke od primjera poslužit ćemo se vlastitim Plotlyjevim skupovima podataka dostupnim na Githubu. Na kraju, imajte na umu da možete izvanmrežni način rada omogućiti i za Plotly kada trebate pokretati Plotly skripte bez mrežne veze:

uvoziti pande kao pd
uvoz numpy kao np
uvoz scipy kao sp
platno uvoziti
spletkasto.offline.init_notebook_mode (spojeno = True)
platno uvoziti.offline kao py

Možete pokrenuti sljedeću izjavu da biste testirali instalaciju Plotly:

ispis (zavjetno.__verzija__)

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Napokon ćemo preuzeti paket podataka s Pandama i vizualizirati ga kao tablicu:

platno uvoziti.figura_fabrika kao ff
df = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master / school_
zarada.csv ")
tablica = ff.stvoriti_tablu (df)
py.iplot (tablica, naziv datoteke = 'tablica')

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Izgradimo sada a Trakasti grafikon za vizualizaciju podataka:

platno uvoziti.graph_objs kako ide
podaci = [go.Traka (x = df.Škola, y = df.Žene)]
py.iplot (podaci, naziv datoteke = 'žene-bar')

Nešto slično vidimo kad izvršimo gornji isječak koda:

Kada vidite gornji grafikon s Jupyterovom bilježnicom, prikazat će vam se razne mogućnosti Povećavanja / smanjivanja određenog odjeljka grafikona, Box & Lasso select i još mnogo toga.

Grupirane trakaste karte

Višestruke trakasti grafikoni mogu se svrstati u svrhe usporedbe vrlo lako s Plotlyjem. Iskoristimo za to isti skup podataka i pokažimo varijacije prisutnosti muškaraca i žena na sveučilištima:

žene = ići.Traka (x = df.Škola, y = df.Žene)
muškarci = idi.Traka (x = df.Škola, y = df.Muškarci)
podaci = [muškarci, žene]
raspored = krenuti.Izgled (barmode = "group")
fig = ići.Slika (podaci = podaci, izgled = izgled)
py.iplot (smokva)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Iako ovo izgleda dobro, naljepnice u gornjem desnom kutu nisu, točno! Ispravimo ih:

žene = ići.Traka (x = df.Škola, y = df.Žene, ime = "Žene")
muškarci = idi.Traka (x = df.Škola, y = df.Muškarci, ime = "Muškarci")

Graf sada izgleda mnogo opisnije:

Pokušajmo promijeniti barmode:

izgled = krenuti.Izgled (barmode = "relativni")
fig = ići.Slika (podaci = podaci, izgled = izgled)
py.iplot (smokva)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Kružne ljestvice s Plotlyjem

Sada ćemo pokušati napraviti tortni grafikon s Plotlyjem koji uspostavlja osnovnu razliku između postotka žena na svim sveučilištima. Naziv sveučilišta bit će oznake, a stvarni brojevi će se koristiti za izračun postotka cjeline. Evo isječka koda za isto:

trag = ići.Pita (oznake = df.Škola, vrijednosti = df.Žene)
py.iplot ([trag], naziv datoteke = 'pita')

Nešto slično vidimo kad izvršimo gornji isječak koda:

Dobra stvar je što Plotly dolazi s mnogim značajkama zumiranja i smanjenja i mnogim drugim alatima za interakciju s izgrađenim grafikonom.

Vizualizacija podataka vremenskih serija s Plotlyjem

Vizualizacija podataka vremenskih serija jedan je od najvažnijih zadataka s kojim se susrećete kada ste analitičar podataka ili inženjer podataka.

U ovom ćemo primjeru upotrijebiti zasebni skup podataka u istom spremištu GitHub jer raniji podaci nisu posebno sadržavali vremenski označene podatke. Kao i ovdje, zacrtati ćemo varijacije dionica Appleovog tržišta tijekom vremena:

financijski = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master /
financije-ljestvice-jabuka.csv ")
podaci = [go.Raspršeni (x = financijski.Datum, y = financijski ['AAPL.Zatvoriti'])]
py.iplot (podaci)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Jednom kada zadržite pokazivač miša iznad linije varijacije grafikona, možete odrediti pojedinosti o točkama:

Pomoću gumba za zumiranje i smanjivanje možemo vidjeti i podatke specifične za svaki tjedan.

OHLC grafikon

OHLC (Open High Low close) grafikon koristi se za prikaz varijacije entiteta kroz vremenski raspon. To je lako konstruirati pomoću PyPlota:

od datetime uvoz datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
visoki_podatci = [33.1, 36.3, 33.6, 33.2, 34.8]
niski_podatci = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
datumi = [datum i vrijeme (godina = 2013, mjesec = 10, dan = 10),
datum i vrijeme (godina = 2013, mjesec = 11, dan = 10),
datum i vrijeme (godina = 2013, mjesec = 12, dan = 10),
datum i vrijeme (godina = 2014, mjesec = 1, dan = 10),
datum i vrijeme (godina = 2014, mjesec = 2, dan = 10)]
trag = ići.Ohlc (x = datumi,
open = open_data,
visoki = visoki_podaci,
nisko = niski_podatci,
close = close_data)
podaci = [trag]
py.iplot (podaci)

Ovdje smo naveli nekoliko uzoraka podataka koji se mogu izvesti na sljedeći način:

A sada, pokrenimo isječak koda koji smo naveli gore. Nešto slično vidimo kad izvršimo gornji isječak koda:

Ovo je izvrsna usporedba načina uspostavljanja vremenskih usporedbi entiteta sa vlastitim i uspoređivanja s visokim i niskim postignućima.

Zaključak

U ovoj smo lekciji pogledali još jednu biblioteku za vizualizaciju, Plotly koja je izvrsna alternativa Matplotlibu u aplikacijama stupnja produkcije koje su izložene kao web aplikacije, Plotly je vrlo dinamična i značajkama bogata biblioteka za upotrebu u proizvodne svrhe, tako da je ovo definitivno vještina koju trebamo imati ispod pojasa.

Pronađite sve izvorne kodove korištene u ovoj lekciji na Githubu. Molimo podijelite svoje povratne informacije o lekciji na Twitteru s @sbmaggarwal i @LinuxHint.

Korisni alati za Linux igrače
Ako volite igrati igre na Linuxu, velika je vjerojatnost da ste možda koristili aplikacije i uslužne programe poput Wine, Lutris i OBS Studio za pobol...
HD Remastered igre za Linux koje ranije nisu imale Linux izdanje
Mnogi programeri i izdavači igara dolaze s HD remasterom starih igara kako bi produžili životni vijek franšize, molimo obožavatelje da zatraže kompati...
Kako koristiti AutoKey za automatizaciju Linux igara
AutoKey je uslužni program za automatizaciju radne površine za Linux i X11, programiran na Python 3, GTK i Qt. Koristeći njegovu skriptiranje i MACRO ...