Znanost o podacima

Python Plotly Tutorial

Python Plotly Tutorial
Plotly je analitička tvrtka poznata po razvoju alata za analitiku, statistiku i grafike u stvarnom vremenu za web-bazirane aplikacije i samostalne Python skripte. U ovoj ćemo lekciji pogledati osnovne primjere s Plotly-om i izgraditi jednostavne i intuitivne grafikone podataka vremenskih serija koji će biti 100% interaktivne prirode, a opet jednostavni za dizajniranje. Ti se grafovi mogu koristiti u prezentacijama jer su potpuno interaktivni i spremni za igru.

Postoji i mogućnost spremanja dizajna grafikona izvan mreže kako bi se mogli lako izvesti. Postoje mnoge druge značajke koje čine knjižnicu vrlo jednostavnom:

Da bismo počeli koristiti paket Plotly, moramo se registrirati za račun na prethodno spomenutom web mjestu kako bismo dobili valjano korisničko ime i API ključ pomoću kojih možemo početi koristiti njegove funkcionalnosti. Srećom, za Plotly je dostupan plan besplatnih cijena s kojim dobivamo dovoljno značajki za izradu grafikona proizvodnog razreda.

Instaliranje Plotly

Samo napomenu prije početka, za ovu lekciju možete koristiti virtualno okruženje koje možemo napraviti slijedećom naredbom:

python -m virtualenv zacrtano
izvor numpy / bin / activate

Jednom kada je virtualno okruženje aktivno, možete instalirati knjižnicu Plotly unutar virtualne env tako da se mogu izvršavati primjeri koje sljedeći kreiramo:

pip instalirati smišljeno

U ovoj ćemo lekciji koristiti Anacondu i Jupyter. Ako ga želite instalirati na svoj stroj, pogledajte lekciju koja opisuje „Kako instalirati Anaconda Python na Ubuntu 18.04 LTS ”i podijelite svoje povratne informacije ako se suočite s bilo kojim problemom. Da biste Plotly instalirali s Anacondom, upotrijebite sljedeću naredbu u terminalu iz Anaconde:

conda install -c planski spletkano

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Nakon što se instaliraju i dovrše svi potrebni paketi, možemo započeti s korištenjem knjižice Plotly sa sljedećom izjavom o uvozu:

platno uvoziti

Nakon što napravite račun na Plotlyju, trebat će vam dvije stvari - korisničko ime računa i API ključ. Svakom računu može pripadati samo jedan API ključ. Zato ga čuvajte negdje na sigurnom, jer ako ga izgubite, morat ćete regenerirati ključ i sve stare aplikacije koje koriste stari ključ prestat će raditi.

U svim Python programima koje pišete spomenite vjerodajnice kako biste započeli rad s Plotlyjem:

spletkasto.alata.set_credentials_file (korisničko ime = 'korisničko ime', api_key = 'vaš-api-ključ')

Krenimo sada s ovom knjižnicom.

Početak rada s Plotlyjem

U našem programu koristit ćemo sljedeći uvoz:

uvoziti pande kao pd
uvoz numpy kao np
uvoz scipy kao sp
platno uvoziti.zacrtano kao py

Koristimo:

Za neke od primjera poslužit ćemo se vlastitim Plotlyjevim skupovima podataka dostupnim na Githubu. Na kraju, imajte na umu da možete izvanmrežni način rada omogućiti i za Plotly kada trebate pokretati Plotly skripte bez mrežne veze:

uvoziti pande kao pd
uvoz numpy kao np
uvoz scipy kao sp
platno uvoziti
spletkasto.offline.init_notebook_mode (spojeno = True)
platno uvoziti.offline kao py

Možete pokrenuti sljedeću izjavu da biste testirali instalaciju Plotly:

ispis (zavjetno.__verzija__)

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Napokon ćemo preuzeti paket podataka s Pandama i vizualizirati ga kao tablicu:

platno uvoziti.figura_fabrika kao ff
df = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master / school_
zarada.csv ")
tablica = ff.stvoriti_tablu (df)
py.iplot (tablica, naziv datoteke = 'tablica')

Otprilike ovako vidimo kad izvršimo gornju naredbu:

Izgradimo sada a Trakasti grafikon za vizualizaciju podataka:

platno uvoziti.graph_objs kako ide
podaci = [go.Traka (x = df.Škola, y = df.Žene)]
py.iplot (podaci, naziv datoteke = 'žene-bar')

Nešto slično vidimo kad izvršimo gornji isječak koda:

Kada vidite gornji grafikon s Jupyterovom bilježnicom, prikazat će vam se razne mogućnosti Povećavanja / smanjivanja određenog odjeljka grafikona, Box & Lasso select i još mnogo toga.

Grupirane trakaste karte

Višestruke trakasti grafikoni mogu se svrstati u svrhe usporedbe vrlo lako s Plotlyjem. Iskoristimo za to isti skup podataka i pokažimo varijacije prisutnosti muškaraca i žena na sveučilištima:

žene = ići.Traka (x = df.Škola, y = df.Žene)
muškarci = idi.Traka (x = df.Škola, y = df.Muškarci)
podaci = [muškarci, žene]
raspored = krenuti.Izgled (barmode = "group")
fig = ići.Slika (podaci = podaci, izgled = izgled)
py.iplot (smokva)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Iako ovo izgleda dobro, naljepnice u gornjem desnom kutu nisu, točno! Ispravimo ih:

žene = ići.Traka (x = df.Škola, y = df.Žene, ime = "Žene")
muškarci = idi.Traka (x = df.Škola, y = df.Muškarci, ime = "Muškarci")

Graf sada izgleda mnogo opisnije:

Pokušajmo promijeniti barmode:

izgled = krenuti.Izgled (barmode = "relativni")
fig = ići.Slika (podaci = podaci, izgled = izgled)
py.iplot (smokva)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Kružne ljestvice s Plotlyjem

Sada ćemo pokušati napraviti tortni grafikon s Plotlyjem koji uspostavlja osnovnu razliku između postotka žena na svim sveučilištima. Naziv sveučilišta bit će oznake, a stvarni brojevi će se koristiti za izračun postotka cjeline. Evo isječka koda za isto:

trag = ići.Pita (oznake = df.Škola, vrijednosti = df.Žene)
py.iplot ([trag], naziv datoteke = 'pita')

Nešto slično vidimo kad izvršimo gornji isječak koda:

Dobra stvar je što Plotly dolazi s mnogim značajkama zumiranja i smanjenja i mnogim drugim alatima za interakciju s izgrađenim grafikonom.

Vizualizacija podataka vremenskih serija s Plotlyjem

Vizualizacija podataka vremenskih serija jedan je od najvažnijih zadataka s kojim se susrećete kada ste analitičar podataka ili inženjer podataka.

U ovom ćemo primjeru upotrijebiti zasebni skup podataka u istom spremištu GitHub jer raniji podaci nisu posebno sadržavali vremenski označene podatke. Kao i ovdje, zacrtati ćemo varijacije dionica Appleovog tržišta tijekom vremena:

financijski = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master /
financije-ljestvice-jabuka.csv ")
podaci = [go.Raspršeni (x = financijski.Datum, y = financijski ['AAPL.Zatvoriti'])]
py.iplot (podaci)

Nešto slično vidimo kad izvršimo gornji isječak koda:

Jednom kada zadržite pokazivač miša iznad linije varijacije grafikona, možete odrediti pojedinosti o točkama:

Pomoću gumba za zumiranje i smanjivanje možemo vidjeti i podatke specifične za svaki tjedan.

OHLC grafikon

OHLC (Open High Low close) grafikon koristi se za prikaz varijacije entiteta kroz vremenski raspon. To je lako konstruirati pomoću PyPlota:

od datetime uvoz datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
visoki_podatci = [33.1, 36.3, 33.6, 33.2, 34.8]
niski_podatci = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
datumi = [datum i vrijeme (godina = 2013, mjesec = 10, dan = 10),
datum i vrijeme (godina = 2013, mjesec = 11, dan = 10),
datum i vrijeme (godina = 2013, mjesec = 12, dan = 10),
datum i vrijeme (godina = 2014, mjesec = 1, dan = 10),
datum i vrijeme (godina = 2014, mjesec = 2, dan = 10)]
trag = ići.Ohlc (x = datumi,
open = open_data,
visoki = visoki_podaci,
nisko = niski_podatci,
close = close_data)
podaci = [trag]
py.iplot (podaci)

Ovdje smo naveli nekoliko uzoraka podataka koji se mogu izvesti na sljedeći način:

A sada, pokrenimo isječak koda koji smo naveli gore. Nešto slično vidimo kad izvršimo gornji isječak koda:

Ovo je izvrsna usporedba načina uspostavljanja vremenskih usporedbi entiteta sa vlastitim i uspoređivanja s visokim i niskim postignućima.

Zaključak

U ovoj smo lekciji pogledali još jednu biblioteku za vizualizaciju, Plotly koja je izvrsna alternativa Matplotlibu u aplikacijama stupnja produkcije koje su izložene kao web aplikacije, Plotly je vrlo dinamična i značajkama bogata biblioteka za upotrebu u proizvodne svrhe, tako da je ovo definitivno vještina koju trebamo imati ispod pojasa.

Pronađite sve izvorne kodove korištene u ovoj lekciji na Githubu. Molimo podijelite svoje povratne informacije o lekciji na Twitteru s @sbmaggarwal i @LinuxHint.

Kako obrnuti smjer pomicanja miša i dodirnih pločica u sustavu Windows 10
Miš i Dodirna pločaRačunarstvo ne samo da olakšava, već i učinkovitije i oduzima puno vremena. Ne možemo zamisliti život bez ovih uređaja, ali činjeni...
Kako promijeniti pokazivač miša i veličinu, boju i shemu pokazivača na sustavu Windows 10
Pokazivač i pokazivač miša u sustavu Windows 10 vrlo su važni aspekti operativnog sustava. To se može reći i za druge operativne sustave, tako da u is...
Besplatni i otvoreni kodni pokretački programi za razvoj Linux igara
Ovaj će članak pokriti popis besplatnih i open source pokretačkih igara koje se mogu koristiti za razvoj 2D i 3D igara na Linuxu. Brojni su takvi moto...