pande

Kako koristiti Boxplot u Pythonu

Kako koristiti Boxplot u Pythonu
Grafikon okvira koristi se za sažimanje skupova podataka pomoću metode grafikona okvira i brkova. Ova funkcija pomaže korisnicima da pravilno razumiju sažetak podataka. Grafički prikaz okvira može biti vrlo koristan kada želimo znati kako se podaci distribuiraju i šire. Za grafikovanje podataka koriste se tri vrste kvartila u grafičkoj prikazu. Te vrijednosti uključuju srednje vrijednosti, maksimalne, minimalne, statističke vrijednosti gornjeg i donjeg kvartila. Grafički prikaz sažeto prikazuje ove podatke u 25th, 50th, i 75th percentili. Ovaj vodič će vam pokazati kako stvoriti grafičke okvire na temelju zadanog skupa podataka pomoću pande i pomorski knjižnice Pythona.

Preduvjet

Ako ste novi korisnik Pythona, prvo ćete morati postaviti okruženje za prikaz rezultata crtanja okvira. Za izvršavanje koda možete koristiti bilo koji Python interpreter. U ovom uputstvu koristit ću špijun3 za izvršenje koda. Ako niste instalirali pande i pomorski knjižnice prije, tada biste trebali pokrenuti sljedeću naredbu s terminala da biste instalirali ove knjižnice:

$ pip3 instaliraj pande seaborn

Parcele u kutijama s pandama

The kutija zemljište() metoda pande koristi se za generiranje slika crteža okvira na temelju okvira podataka. Ova metoda sadrži mnogo argumenata; neki od ovih argumenata koriste se u primjerima u nastavku. Ovaj će dio tutorijala sadržavati dva primjera koji će vam pokazati kako stvoriti grafičke okvire u pande. Možete generirati slučajno generirane podatke u NumPy knjižnici ili podatke iz CSV datoteke za generiranje okvira okvira u pande.

Primjer 1: Grafički prikaz na temelju slučajnih vrijednosti

Grafikoni okvira u sljedećem primjeru generirani su pomoću NumPy i pande. Knjižnica NumPy koristi se u skripti za stvaranje objekta okvira podataka generiranjem dvodimenzionalnog niza slučajnih vrijednosti koji sadrže 5 redaka i 5 stupaca. Sadržaj okvira podataka ispisat će se pomoću Glava() metoda. Dalje, kutija zemljište() metoda koristi se za generiranje grafikona okvira s plavom bojom, veličinom fonta 10 i kutom rotacije od 30 stupnjeva za prikaz vrijednosti stupaca.

#!/ usr / bin / env python3
# Uvezi knjižnicu pandi
uvoziti pande kao pd
# Uvezite NumPy biblioteku za stvaranje slučajnih brojeva za niz
uvoz numpy kao np
"
Generirajte skup podataka na temelju nasumično stvorenog polja NumPy
i pet stupca vrijednosti
"
okvir podataka = pd.DataFrame (np.slučajno.randn (5,5), stupci = ['2016', '2017', '2018',
'2019', '2020'])
 
# Ispišite vrijednosti podatkovnog okvira
ispis (okvir podataka.glava ())
# Prikažite grafikon okvira na temelju vrijednosti okvira podataka
podatkovni okvir.boxplot (grid = 'false', color = 'blue', fontsize = 10, rot = 30)

Izlaz

Sljedeći će se izlaz pojaviti nakon izvršavanja koda.

Primjer 2: Okviri na osnovi CSV podataka

Grafikoni okvira u sljedećem primjeru generirani su iz CSV podataka. Stvorite CSV datoteku s imenom banka.csv koristeći sljedeće podatke.

banka.csv

SL, naziv klijenta, vrsta računa, spol, stanje
1, Maria Hernandez, štednja, žena, 120000
2, Mary Smith, Current, žensko, 40000
3, David Smith, Current, muški, 379000
4, Maria Rodriguez, štednja, žena, 56000
5, Mark Lee, Spremanje, muški, 93500
6, Jonathan Bing, Current, muški, 5900
7, Daniel Williams, Saving, muški, 2300
8, Mike Brown, Current, muški, 124888
9, Paul Smith, Current, muški, 59450
10, Maria Lopez, štednja, žena, 487600

U sljedećoj skripti, matplotlib knjižnica je korištena za postavljanje veličine slike plohe okvira i za prikaz izlaza u redu. Svi zapisi o banka.csv datoteka učitana je pomoću read_csv () metoda pande. Prvih 8 zapisa podatkovnog okvira potom je ispisano pomoću glava () metoda. The kutija zemljište() metoda korištena je u sljedećoj izjavi za crtanje crteža okvira pomoću crvene boje na temelju 'Vrsta računa' sa stupcem nazvanim 'Ravnoteža.'

#!/ usr / bin / env python3
# Uvoz pandi za generiranje kutijice
uvoziti pande kao pd
# Uvezite matplotlib da biste postavili veličinu slike plohe okvira
uvoz matplotlib.pyplot kao plt
# Uvezite get_ipython za formatiranje izlaza u obliku
iz IPython uvoza get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Postavite veličinu slike
plt.rcParams ['slika.figsize '] = (8,4)
# Učitajte skup podataka iz CSV datoteke
df = pd.read_csv ("banka.csv ")
# Ispišite prvih 8 redaka učitanih podataka
ispis (df.glava (8))
# Prikažite grafikone okvira na temelju korištenog parametra
df.boxplot (prema = 'Account_Type', grid = 'True', column = ['Saldo'], color = 'red')

Izlaz

Sljedeći će se izlaz pojaviti nakon izvršavanja koda.

Parcele u kutiji s morem

Druga knjižnica Pythona koja se obično koristi za crtanje kutijastih ploča je knjižnica pomorski.  Jedna od važnih značajki ove knjižnice je da ima mnogo ugrađenih uzoraka skupova podataka za testiranje različitih zadataka. Sljedeća dva primjera pokrivat će upotrebu dva različita skupa podataka za crtanje kutijastih crteža pomoću pomorski knjižnica.

Primjer 3: Grafički prikaz na osnovi x parametra

Sljedeći primjer koristi uzorak skupa podataka, nazvan 'dijamant,' iz morski rođeni knjižnica za generiranje okvira okvira. Ovdje se stil mreže definira pomoću set_style () metoda. The load_dataset () metoda se koristi za učitavanje podataka 'dijamant' skup podataka. Prvih pet zapisa ispisuje se iz skupa podataka i kutija zemljište() metoda se zatim koristi za crtanje okvira okvira na temelju stupca, imenovanog 'dubina,'s plavom bojom.

# Uvezite knjižnicu s morskim plodovima da biste generirali kutiju
uvoziti seaborn kao sns
# Uvezite matplotlib da biste postavili veličinu slike plohe okvira
uvoz matplotlib.pyplot kao plt
# Uvezite get_ipython za formatiranje izlaza u obliku
iz IPython uvoza get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Postavite stil mreže
sns.set_style ("bijela mreža")
# Postavite veličinu slike
plt.rcParams ['slika.figsize '] = (8,4)
# Učitajte uzorak skupa podataka
diamond_dataset = sns.load_dataset ('dijamanti')
# Prikažite prvih 5 zapisa skupa podataka
ispis (diamond_dataset.glava ())
# Nacrtajte sliku crteža okvira
sns.ploča (x = diamond_dataset ['dubina'], boja = 'plava')

Izlaz

Sljedeći će se izlaz pojaviti nakon izvršavanja koda.

Primjer 4: Grafički prikaz temeljen na x i y parametrima

Sljedeći primjer koristi uzorak skupa podataka s nazivom 'letovi'za crtanje kutijice. Ovdje su i x i y parametri ploča kutije () metode koriste se za crtanje lika. Ostale su izjave slične prethodnom primjeru.

# Uvezite knjižnicu s morskim plodovima kako biste generirali kutiju
uvoziti seaborn kao sns
# Uvezite matplotlib da biste postavili veličinu slike plohe okvira
uvoz matplotlib.pyplot kao plt
# Uvezite get_ipython za formatiranje izlaza u obliku
iz IPython uvoza get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Postavite stil mreže
sns.set_style ("darkgrid")
# Postavite veličinu slike
plt.rcParams ['slika.figsize '] = (12,4)
 
# Učitajte uzorak skupa podataka
let_data podataka = sns.load_dataset ('letovi')
# Prikažite prvih 5 zapisa skupa podataka
ispis (flight_dataset.glava ())
 
# Nacrtajte sliku crteža okvira
sns.boxplot (x = 'mjesec', y = 'putnici', podaci = let_data podataka, boja = 'plavo')

Izlaz

Sljedeći će se izlaz pojaviti nakon izvršavanja koda.

Zaključak

Kada radite s velikom količinom podataka, možda biste trebali sažeti podatke pomoću dijagrama, kao što je okvir polja. Ovaj je vodič koristio nekoliko primjera kako bi vam pokazao kako generirati grafičke okvire s dvije Python knjižnice.

Najbolji Linux Distros za igre na sreću 2021. godine
Linux operativni sustav daleko je prevalio svoj izvorni, jednostavni izgled zasnovan na poslužitelju. Ovaj se OS posljednjih godina izuzetno poboljšao...
Kako snimiti i struji svoju igraću sesiju na Linuxu
U prošlosti se igranje igara smatralo samo hobijem, ali s vremenom je igračka industrija zabilježila ogroman rast u pogledu tehnologije i broja igrača...
Najbolje igre za ručno praćenje
Oculus Quest nedavno je predstavio sjajnu ideju ručnog praćenja bez kontrolera. Sa sve većim brojem igara i aktivnosti koje izvršavaju podršku bilo fo...