ML i AI

Top 20 najboljih R paketa za strojno učenje koje možete odmah pogledati

Top 20 najboljih R paketa za strojno učenje koje možete odmah pogledati

Gotovo svi novi znanstvenici i programeri strojnog učenja zbunjeni su odabirom programskog jezika. Uvijek se pitaju koji će programski jezik biti najbolji za njihov projekt strojnog učenja i znanosti o podacima. Ili ćemo se odlučiti za python, R ili MatLab. Pa, izbor programskog jezika ovisi o preferencijama programera i sistemskim zahtjevima. Između ostalih programskih jezika, R je jedan od najperspektivnijih i najsjajnijih programskih jezika koji ima nekoliko R paketa strojnog učenja za ML, AI i projekte znanosti o podacima.

Kao posljedicu, svoj projekt možete razviti bez napora i učinkovito koristeći ove R pakete strojnog učenja. Prema istraživanju tvrtke Kaggle, R je jedan od najpopularnijih jezika strojnog učenja s otvorenim kodom.

Najbolji paketi R strojnog učenja


R je jezik otvorenog koda tako da ljudi mogu dati svoj doprinos s bilo kojeg mjesta na svijetu. U svom kodu možete koristiti crni okvir koji je napisao netko drugi. U R-u se ovaj crni okvir naziva paketom. Paket nije ništa drugo do unaprijed napisani kôd koji se može više puta koristiti. U nastavku prikazujemo top 20 najboljih paketa R strojnog učenja.

1. ZNAK ZA UMETANJE


Paket CARET odnosi se na klasifikacijski i regresijski trening. Zadatak ovog CARET paketa je integrirati obuku i predviđanje modela. To je jedan od najboljih paketa R-a za strojno učenje, kao i za znanost o podacima.

Parametri se mogu pretraživati ​​integriranjem nekoliko funkcija za izračunavanje ukupnih performansi određenog modela korištenjem metode pretraživanja mreže u ovom paketu. Nakon uspješnog završetka svih pokusa, pretraživanje mreže napokon pronalazi najbolje kombinacije.

Nakon instalacije ovog paketa, programer može pokrenuti imena (getModelInfo ()) kako bi vidio 217 mogućih funkcija koje se mogu pokrenuti kroz samo jednu funkciju. Za izgradnju prediktivnog modela, paket CARET koristi funkciju train (). Sintaksa ove funkcije:

vlak (formula, podaci, metoda)

Dokumentacija

2. randomForest


RandomForest jedan je od najpopularnijih R paketa za strojno učenje. Ovaj paket R strojnog učenja može se koristiti za rješavanje regresijskih i klasifikacijskih zadataka. Uz to, može se koristiti za trening nedostajućih vrijednosti i odstupanja.

Ovaj paket strojnog učenja s R obično se koristi za generiranje višestrukog broja stabala odluka. U osnovi se uzimaju slučajni uzorci. A zatim se zapažanja daju u stablo odluke. Konačno, zajednički izlaz koji dolazi iz stabla odlučivanja krajnji je rezultat. Sintaksa ove funkcije:

randomForest (formula =, podaci =)

Dokumentacija

3. e1071


Ovaj e1071 jedan je od najčešće korištenih R paketa za strojno učenje. Koristeći ovaj paket, programer može implementirati vektorske strojeve potpore (SVM), izračunavanje najkraće staze, klasteriranje u vrećama, Naive Bayesov klasifikator, kratkotrajnu Fourierovu transformaciju, nejasno klasteriranje itd.

Kao primjer, za IRIS podatke SVM sintaksa je:

svm (Vrste ~ Sepal.Duljina + Sepal.Širina, podaci = iris)

Dokumentacija

4. Rpart


Rpart označava rekurzivni trening podjele i regresije. Ovaj R paket za strojno učenje može obavljati oba zadatka: klasifikaciju i regresiju. Djeluje pomoću dvostupanjskog koraka. Izlazni model binarnog stabla. Funkcija plot () koristi se za crtanje izlaznog rezultata. Također, postoji alternativna funkcija, funkcija prp (), koja je fleksibilnija i moćnija od osnovne funkcije plot ().

Funkcija rpart () koristi se za uspostavljanje veze između neovisnih i ovisnih varijabli. Sintaksa je:

rpart (formula, podaci =, metoda =, kontrola =)

gdje je formula kombinacija neovisnih i ovisnih varijabli, podaci su naziv skupa podataka, metoda je cilj, a kontrola vaš sistemski zahtjev.

Dokumentacija

5. KernLab


Ako svoj projekt želite razviti na temelju algoritama strojnog učenja temeljenog na jezgri, tada možete koristiti ovaj R paket za strojno učenje. Ovaj se paket koristi za SVM, analizu značajki jezgre, algoritam rangiranja, primitivne točke točkica, Gaussov postupak i mnoge druge. KernLab se široko koristi za SVM implementacije.

Dostupne su razne funkcije jezgre. Ovdje su spomenute neke funkcije jezgre: polydot (polinomna funkcija jezgre), tanhdot (hiperbolična tangentna funkcija jezgre), laplacedot (laplacijanska funkcija jezgre) itd. Te se funkcije koriste za izvođenje problema s prepoznavanjem uzoraka. Ali korisnici mogu koristiti svoje funkcije jezgre umjesto unaprijed definiranih funkcija jezgre.

Dokumentacija

6. nnet


Ako želite razviti svoju aplikaciju za strojno učenje pomoću umjetne neuronske mreže (ANN), ovaj vam nnet paket može pomoći. To je jedan od najpopularnijih i najjednostavnijih implementacijskih paketa neuronskih mreža. Ali ograničenje je to što se radi o jednom sloju čvorova.

Sintaksa ovog paketa je:

nnet (formula, podaci, veličina)

Dokumentacija

7. dplyr


Jedan od najčešće korištenih R paketa za znanost o podacima. Također, nudi neke jednostavne, brze i dosljedne funkcije za manipulaciju podacima. Hadley Wickham piše ovaj r programski paket za znanost o podacima. Ovaj se paket sastoji od skupa glagola i.e., mutirati (), odabrati (), filtrirati (), sažeti () i organizirati ().

Da biste instalirali ovaj paket, morate napisati ovaj kod:

instalirati.paketi ("dplyr")

A da biste učitali ovaj paket, morate napisati ovu sintaksu:

knjižnica (dplyr)

Dokumentacija

8. ggplot2


Još jedan od najelegantnijih i najestetičnijih grafičkih okvira R paketa za znanost o podacima je ggplot2. To je sustav za stvaranje grafike koji se temelji na gramatici grafike. Sintaksa instalacije za ovaj paket znanosti o znanosti je:

instalirati.paketi (“ggplot2”)

Dokumentacija

9. Oblak riječi


Kada se jedna slika sastoji od tisuća riječi, tada se naziva Wordcloud. U osnovi, to je vizualizacija tekstualnih podataka. Ovaj paket za strojno učenje pomoću R koristi se za stvaranje reprezentacije riječi, a programer može prilagoditi Wordcloud prema svojim željama, poput raspoređivanja riječi slučajno ili riječi iste frekvencije zajedno ili riječi visoke frekvencije u centru itd.

U jeziku strojnog učenja R dostupne su dvije knjižnice za stvaranje oblaka riječi: Wordcloud i Worldcloud2. Ovdje ćemo prikazati sintaksu za WordCloud2. Da biste instalirali WordCloud2, morate napisati:

1. zahtijeva (devtools)
2. install_github (“lchiffon / wordcloud2”)

Ili ga možete koristiti izravno:

knjižnica (wordcloud2)

Dokumentacija

10. uredno


Još jedan široko korišten r paket za znanost o podacima je tidyr. Cilj ovog r programiranja za znanost o podacima jest sređivanje podataka. U urednom stanju, varijabla se stavlja u stupac, promatranje se stavlja u red, a vrijednost je u ćeliji. Ovaj paket opisuje standardni način sortiranja podataka.

Za instalaciju možete koristiti ovaj fragment koda:

instalirati.paketi ("uredno")

Za učitavanje, kôd je:

knjižnica (uredno)

Dokumentacija

11. sjajan


Paket R, Shiny, jedan je od okvira web aplikacija za znanost o podacima. Pomaže u stvaranju web aplikacija iz R bez napora. Bilo programer može instalirati softver na svaki klijentski sustav ili u kabini smjestiti web stranicu. Također, programer može izraditi nadzorne ploče ili ih ugraditi u R Markdown dokumente.

Uz to, sjajne aplikacije mogu se proširiti raznim skriptnim jezicima poput html dodataka, CSS tema i JavaScript radnji. Jednom riječju, možemo reći da je ovaj paket kombinacija računske snage R s interaktivnošću modernog weba.

Dokumentacija

12. tm


Nepotrebno je reći da je rudarenje teksta danas nova aplikacija strojnog učenja. Ovaj paket R strojnog učenja pruža okvir za rješavanje zadataka za rukovanje tekstom. U aplikaciji za rukovanje tekstom, tj.e., analizu osjećaja ili klasifikaciju vijesti, programer ima razne vrste zamornih poslova poput uklanjanja neželjenih i nebitnih riječi, uklanjanja interpunkcijskih znakova, uklanjanja zaustavnih riječi i mnogih drugih.

Paket tm sadrži nekoliko fleksibilnih funkcija za rad bez napora poput removeNumbers (): uklanjanje brojeva iz datog tekstualnog dokumenta, weightTfIdf (): za pojam Frekvencija i inverzna učestalost dokumenta, tm_reduce (): za kombiniranje transformacija, removePunctuation () u uklonite interpunkcijske znakove iz datog tekstualnog dokumenta i još mnogo toga.

Dokumentacija

13. MICE paket


Paket strojnog učenja s R, MICE odnosi se na multivarijacijsku imputaciju putem lančanih sekvenci. Gotovo cijelo vrijeme programer projekta suočava se s uobičajenim problemom skupa podataka strojnog učenja koji nedostaje. Ovaj se paket može koristiti za imputiranje vrijednosti koje nedostaju pomoću više tehnika.

Ovaj paket sadrži nekoliko funkcija kao što su pregled obrazaca nedostajućih podataka, dijagnosticiranje kvalitete imputiranih vrijednosti, analiza dovršenih skupova podataka, spremanje i izvoz imputiranih podataka u različitim formatima i još mnogo toga.

Dokumentacija

14. igraf


Paket mrežne analize, igraph, jedan je od moćnih R paketa za znanost o podacima. To je kolekcija moćnih, učinkovitih, jednostavnih za upotrebu i prijenosnih alata za analizu mreže. Također, ovaj je paket otvoren i besplatan. Uz to, igraphn se može programirati na Pythonu, C / C ++ i Mathematici.

Ovaj paket ima nekoliko funkcija za generiranje slučajnih i regularnih grafova, vizualizaciju grafa itd. Također, možete raditi sa svojim velikim grafom pomoću ovog R paketa. Postoje neki zahtjevi za upotrebu ovog paketa: za Linux su potrebni kompajler C i C ++.

Instalacija ovog R programskog paketa za znanost o podacima je:

instalirati.paketi ("igraph")

Za učitavanje ovog paketa morate napisati:

knjižnica (igraph)

Dokumentacija

15. ROCR


Paket R za znanost o podacima, ROCR, koristi se za vizualizaciju izvedbe bodovanja klasifikatora. Ovaj je paket fleksibilan i jednostavan za upotrebu. Potrebne su samo tri naredbe i zadane vrijednosti za neobavezne parametre. Ovaj se paket koristi za razvoj 2D krivulja parametarskih parametara. U ovom paketu postoji nekoliko funkcija poput predviđanja (), koje se koriste za stvaranje objekata predviđanja, izvedbe () koje se koriste za stvaranje objekata izvedbe itd.

Dokumentacija

16. DataExplorer


Paket DataExplorer jedan je od najopsežnijih R-paketa za znanost o podacima koji se lako koriste. Među brojnim zadacima znanosti o podacima, istraživačka analiza podataka (EDA) jedan je od njih. U istraživačkoj analizi podataka, analitičar podataka mora posvetiti više pažnje u podacima. Nije jednostavan posao provjeriti ili ručno obrađivati ​​podatke ili koristiti loše kodiranje. Potrebna je automatizacija analize podataka.

Ovaj R paket za znanost o podacima pruža automatizaciju istraživanja podataka. Ovaj se paket koristi za skeniranje i analizu svake varijable te njihovu vizualizaciju. Korisno je kada je skup podataka masivan. Dakle, analiza podataka može učinkovito i bez napora izvući skriveno znanje iz podataka.

Paket se može instalirati iz CRAN-a izravno pomoću donjeg koda:

instalirati.paketi (“DataExplorer”)

Da biste učitali ovaj R paket, morate napisati:

knjižnica (DataExplorer)

Dokumentacija

17. mlr


Jedan od najnevjerojatnijih paketa R strojnog učenja je mlr paket. Ovaj paket šifrira nekoliko zadataka strojnog učenja. To znači da možete izvršiti nekoliko zadataka samo pomoću jednog paketa, a za tri različita zadatka ne trebate koristiti tri paketa.

Pakiranje mlr sučelje je za brojne tehnike klasifikacije i regresije. Tehnike uključuju strojno čitljive opise parametara, grupiranje, generičko ponovno uzorkovanje, filtriranje, izdvajanje značajki i još mnogo toga. Također se mogu raditi paralelne operacije.

Za instalaciju morate koristiti donji kod:

instalirati.pakiranja („mlr“)

Da biste učitali ovaj paket:

knjižnica (mlr)

Dokumentacija

18. rule


Paket, u skladu s pravilima (pravila udruživanja rudnika i česti skupovi predmeta), široko je korišten paket R strojnog učenja. Korištenjem ovog paketa može se izvršiti nekoliko operacija. Operacije su predstavljanje i analiza transakcija podataka i obrazaca te manipulacija podacima. Dostupne su i C implementacije algoritama rudarstva Apriori i Eclat.

Dokumentacija

19. mboost


Još jedan R paket strojnog učenja za znanost o podacima je mboost. Ovaj paket za poticanje zasnovan na modelu ima algoritam funkcionalnog gradijentnog spuštanja za optimizaciju općih funkcija rizika korištenjem regresijskih stabala ili procjena najmanjih kvadrata po komponentama. Također, pruža model interakcije s potencijalno visokodimenzionalnim podacima.

Dokumentacija

20. Zabava


Još jedan paket u strojnom učenju s R-om je party. Ovaj računski alatni okvir koristi se za rekurzivno particioniranje. Glavna funkcija ili jezgra ovog paketa strojnog učenja je ctree (). Opsežno se koristi funkcija koja smanjuje vrijeme treninga i pristranost.

Sintaksa ctree () je:

 ctree (formula, podaci)

Dokumentacija

Završavajući misli


R je tako istaknuti programski jezik koji koristi statističke metode i grafikone za istraživanje podataka. Nepotrebno je reći da ovaj jezik ima nekoliko brojeva R paketa strojnog učenja, nevjerojatan RStudio alat i lako razumljivu sintaksu za razvoj naprednih projekata strojnog učenja. U pakiranju od R ml postoje neke zadane vrijednosti. Prije nego što ga primijenite na svoj program, morate detaljno znati razne mogućnosti. Korištenjem ovih paketa za strojno učenje svatko može izgraditi učinkovit model strojnog učenja ili znanosti o podacima. Na kraju, R je jezik otvorenog koda i njegovi paketi neprestano rastu.

Ako imate prijedloga ili pitanja, ostavite komentar u našem odjeljku za komentare. Ovaj članak također možete podijeliti s prijateljima i obitelji putem društvenih mreža.

Luke komercijalnih igara s otvorenim kodom
Besplatne igre s otvorenim kodom i više platformi mogu se koristiti za igranje starih, kao i nekih prilično nedavnih naslova igara. U ovom će se člank...
Najbolje igre naredbenog retka za Linux
Naredbeni redak nije samo vaš najveći saveznik pri korištenju Linuxa - on također može biti izvor zabave jer ga možete koristiti za igranje mnogih zab...
Najbolje aplikacije za mapiranje gamepada za Linux
Ako volite igrati igre na Linuxu s gamepadom umjesto tipičnim sustavom za unos tipkovnice i miša, za vas postoji nekoliko korisnih aplikacija. Mnoge r...