Koja je najbolja grafička kartica za dubinsko učenje?

Ako je CPU mozak računala, onda je GPU duša. Iako većina računala može raditi bez dobrog GPU-a, dubinsko učenje nije moguće bez njega. To je zato što duboko učenje zahtijeva složene operacije poput manipulacije matricom, iznimne računske preduvjete i značajnu računalnu snagu.

Iskustvo je vitalno za razvijanje vještina potrebnih za primjenu dubokog učenja na nova pitanja. Brzi GPU znači brzo stjecanje praktičnog iskustva neposrednim povratnim informacijama. GPU-ovi sadrže više jezgri za bavljenje paralelnim proračunima. Oni također uključuju opsežnu propusnost memorije za lako upravljanje tim informacijama.

Naš najbolji preporučeni izbor za najbolju grafičku karticu za dubinsko učenje je Nvidia Geforce RTX 2080 Founders Edition. Kupite ga odmah za 1.940 USD na Amazonu

Imajući ovo na umu, nastojimo odgovoriti na pitanje: „Koja je najbolja grafička kartica za AI, strojno učenje i duboko učenje?”Pregledom nekoliko grafičkih kartica koje su trenutno dostupne 2021. godine. Kartice pregledane:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Slijede rezultati:

AMD RX Vega 64

Radeon RX Vega 64

Značajke

Datum izlaska: 14. kolovoza 2017
Vega Arhitektura
PCI Express sučelje
Takt: 1247 MHz
Stream procesori: 4096
VRAM: 8 GB
Propusnost memorije: 484 GB / s

Pregled

Ako vam se ne sviđaju NVIDIA GPU-ovi ili vam proračun ne dopušta da potrošite više od 500 USD na grafičku karticu, tada AMD ima pametnu alternativu. Smještajući pristojnu količinu RAM-a, brzu propusnost memorije i više nego dovoljno stream procesora, AMD-ov RS Vega 64 vrlo je teško zanemariti.

Arhitektura Vega nadogradnja je s prethodnih RX kartica. Po performansama je ovaj model blizak GeForce RTX 1080 Ti, jer oba ova modela imaju sličan VRAM. Štoviše, Vega podržava izvornu polupreciznost (FP16). ROCm i TensorFlow rade, ali softver nije zreo kao na NVIDIA grafičkim karticama.

Sve u svemu, Vega 64 pristojan je GPU za duboko učenje i AI. Ovaj model košta znatno ispod 500 USD i posao završava za početnike. Međutim, za profesionalne aplikacije preporučujemo da se odlučite za NVIDIA karticu.

AMD RX Vega 64 Pojedinosti: Amazon

NVIDIA Tesla V100

Tesla V100

Značajke:

Datum izlaska: 7. prosinca 2017
Arhitektura NVIDIA Volta
PCI-E sučelje
112 TFLOPS izvedba tenzora
640 jezgri tenzora
5120 Jezgre NVIDIA CUDA®
VRAM: 16 GB
Propusnost memorije: 900 GB / s
Računarski API-ji: CUDA, DirectCompute, OpenCL ™, OpenACC®

Pregled:

NVIDIA Tesla V100 nevjerojatna je i jedna od najboljih grafičkih kartica za AI, strojno učenje i duboko učenje. Ova je kartica potpuno optimizirana i isporučuje se u paketu sa svim dodacima koji će vam trebati u tu svrhu.

Tesla V100 dolazi u memoriji od 16 GB i 32 GB. Uz obilje VRAM-a, AI ubrzanja, veliku propusnost memorije i specijalizirane tenzorske jezgre za duboko učenje, možete biti sigurni da će svaki vaš model treninga raditi glatko - i za manje vremena. Točnije, Tesla V100 može pružiti 125TFLOPS performansi dubokog učenja i za trening i za zaključivanje [3], što je omogućila NVIDIA-ina arhitektura Volta.

Pojedinosti o NVIDIA Tesli V100: Amazon, (1)

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Značajke:

Datum izlaska: kolovoz 2018
Turingova arhitektura
576 jezgre tenzora
Jezgre CUDA: 4.608
VRAM: 48 GB
Propusnost memorije: 672 GB / s
16.3 TFLOPSA
Sučelje sustava: PCI-Express

Pregled:

Quadro RTX 8000 je posebno izrađena za matricu aritmetike i izračunavanja matrice dubokog učenja, vrhunska grafička kartica. Budući da se ova kartica isporučuje s velikim VRAM kapacitetom (48 GB), ovaj se model preporučuje za istraživanje izuzetno velikih računalnih modela. Kada se koristi u paru s NVLinkom, kapacitet se može povećati na do 96 GB VRAM-a. Što je puno!

Kombinacija 72 RT i 576 tenzorskih jezgri za poboljšane tijekove rada rezultira s preko 130 TFLOPS performansi. U usporedbi sa najskupljom grafičkom karticom s našeg popisa - Teslom V100 - ovaj model potencijalno nudi 50 posto više memorije i još uvijek uspijeva koštati manje. Čak i na instaliranoj memoriji, ovaj model ima izuzetne performanse dok radi s većim skupnim veličinama na jednom GPU-u.

Opet, poput Tesle V100, ovaj je model ograničen samo vašom cijenom. Međutim, ako želite ulagati u budućnost i u visokokvalitetno računanje, nabavite RTX 8000. Tko zna, možete voditi istraživanje o AI. Tesla V100 temelji se na Turingovoj arhitekturi, gdje se V100 temelji na Volta arhitekturi, pa se Nvidia Quadro RTX 8000 može smatrati nešto modernijim i nešto moćnijim od V100.

Nvidia Quadro RTX 8000 Detalji: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 Founders Edition

Značajke:

Datum izlaska: 20. rujna 2018
Turing GPU arhitektura i RTX platforma
Takt: 1350 MHz
Jezgre CUDA: 4352
11 GB ultrabrze GDDR6 memorije sljedeće generacije
Propusnost memorije: 616 GB / s
Snaga: 260W

Pregled:

GeForce RTX 2080 Ti proračunska je opcija idealna za malo opterećenje modeliranjem, a ne za obuku velikih razmjera. To je zato što ima manju GPU memoriju po kartici (samo 11 GB). Ograničenja ovog modela postaju očitija kada se treniraju neki moderni NLP modeli. Međutim, to ne znači da se ova karta ne može natjecati. Dizajn puhala na RTX 2080 omogućuje daleko gušće konfiguracije sustava - do četiri GPU-a unutar jedne radne stanice. Uz to, ovaj model trenira neuronske mreže na 80 posto brzina Tesle V100. Prema LambdaLabsovim mjerilima performansi dubokog učenja, u usporedbi s Teslom V100, RTX 2080 je 73% brzine FP2 i 55% brzine FP16.

U međuvremenu, ovaj model košta gotovo 7 puta manje od Tesle V100. I sa stajališta cijene i performansi, GeForce RTX 2080 Ti izvrstan je GPU za duboko učenje i razvoj AI.

GeForce RTX 2080 Ti Pojedinosti: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX grafika

Značajke:

Datum izlaska: 18. prosinca 2018
Pokreće je NVIDIA Turing ™ arhitektura dizajnirana za AI
576 tenzorskih jezgri za ubrzanje AI
130 teraFLOPS (TFLOPS) za duboko učenje
Jezgre CUDA: 4608
VRAM: 24 GB
Propusnost memorije: 672 GB / s
Preporučeno napajanje 650 vata

Pregled:

NVIDIA Titan RTX je još jedan GPU srednje klase koji se koristi za složene operacije dubokog učenja. 24 GB VRAM-a ovog modela dovoljno je za rad s većinom serija. Međutim, ako želite obučiti veće modele, uparite ovu karticu s NVLink mostom kako biste učinkovito imali 48 GB VRAM-a. Taj bi iznos bio dovoljan čak i za velike NLP modele transformatora. Štoviše, Titan RTX omogućuje cjelovitu obuku mješovite preciznosti za modele (tj.e., FP 16 zajedno s akumulacijom FP32). Kao rezultat, ovaj model izvodi otprilike 15 do 20 posto brže u operacijama u kojima se koriste jezgre tenzora.

Jedno ograničenje NVIDIA Titan RTX je dizajn dvostrukog ventilatora. To otežava složenije konfiguracije sustava jer se ne može spakirati u radnu stanicu bez značajnih izmjena rashladnog mehanizma, što se ne preporučuje.

Sve u svemu, Titan je izvrstan, višenamjenski GPU za gotovo svaki zadatak dubokog učenja. U usporedbi s drugim grafičkim karticama opće namjene, zasigurno je skupa. Zbog toga se ovaj model ne preporučuje igračima. Ipak, istraživači koji koriste složene modele dubokog učenja vjerojatno će cijeniti dodatni VRAM i poboljšanje performansi. Cijena Titan RTX-a je značajno niža od V100 prikazane gore i bio bi dobar izbor ako vaš proračun ne dopušta da V100 cijene dublje učenje ili ako vam radno opterećenje ne treba više od Titan-a RTX (pogledajte zanimljive referentne vrijednosti)

NVIDIA Titan RTX Detalji: Amazon

Odabir najbolje grafičke kartice za AI, strojno učenje i duboko učenje

AI, zadaci strojnog učenja i dubokog učenja obrađuju gomilu podataka. Ti zadaci mogu biti vrlo zahtjevni za vaš hardver. Ispod su značajke koje morate imati na umu prije kupnje GPU-a.

Jezgre

Kao jednostavno pravilo, što je veći broj jezgri, to će veća biti izvedba vašeg sustava. Treba uzeti u obzir i broj jezgri, posebno ako imate posla s velikom količinom podataka. NVIDIA je svoje jezgre nazvala CUDA, dok AMD njihove jezgre naziva stream procesorima. Idite na najveći broj procesorskih jezgri koje vam dopušta proračun.

Procesorska snaga

Procesorska snaga GPU-a ovisi o broju jezgri unutar sustava pomnoženoj s taktovima na kojima radite jezgre. Što je veća brzina i veći je broj jezgri, veća će biti procesorska snaga na kojoj vaš GPU može izračunati podatke. Ovo također određuje koliko će brzo vaš sustav izvršiti zadatak.

VRAM

Video RAM ili VRAM mjeri količinu podataka koje vaš sustav može odjednom obraditi. Viši VRAM je presudan ako radite s različitim modelima Computer Visiona ili izvodite bilo koja CV Kaggle natjecanja. VRAM nije toliko važan za NLP niti za rad s ostalim kategorijskim podacima.

Propusnost memorije

Propusnost memorije je brzina kojom se podaci čitaju ili pohranjuju u memoriju. Jednostavno rečeno, to je brzina VRAM-a. Mjereno u GB / s, veća propusnost memorije znači da kartica može izvući više podataka za manje vremena, što rezultira bržim radom.

Hlađenje

Temperatura GPU-a može biti značajno usko grlo što se tiče performansi. Moderni grafički procesori povećavaju brzinu na maksimum dok pokreću algoritam. No čim se dostigne određeni temperaturni prag, GPU smanjuje brzinu obrade kako bi se zaštitio od pregrijavanja.

Dizajn ventilatora za hladnjake zraka potiskuje zrak izvan sustava, dok ventilatori bez puhala usisavaju zrak. U arhitekturi u kojoj se više grafičkih procesora nalazi jedan pored drugog, ventilatori koji ne puše više će se zagrijavati. Ako koristite zračno hlađenje u postavkama s 3 do 4 grafička procesora, izbjegavajte ventilatore koji ne puše.

Hlađenje vodom je još jedna mogućnost. Iako je skupa, ova metoda je mnogo tiša i osigurava da čak i najkvalitetnije GPU postavke ostanu hladne tijekom rada.

Zaključak

Za većinu korisnika koji se zalažu za duboko učenje, RTX 2080 Ti ili Titan RTX pružit će najveći udarac za vaš novac. Jedini nedostatak RTX 2080 Ti je ograničena VRAM veličina od 11 GB. Trening s većim serijama omogućuje modelima da treniraju brže i puno preciznije, štedeći puno vremena korisnika. To je moguće samo ako imate Quadro GPU ili TITAN RTX. Korištenje polupreciznosti (FP16) omogućuje ugradnju modela u GPU-ove s nedovoljnom veličinom VRAM-a [2]. Međutim, za naprednije korisnike trebate uložiti Tesla V100. To je naš najbolji izbor za najbolju grafičku karticu za AI, strojno učenje i duboko učenje. To je sve za ovaj članak. Nadamo se da vam se svidjelo. Do sljedećeg puta!

Reference

Najbolji GPU-ovi za AI, strojno učenje i dubinsko učenje u 2020
Najbolji GPU za duboko učenje u 2020
NVIDIA AI INFERENCE PLATFORMA: Veliki skokovi u izvedbi i učinkovitosti za AI usluge, od podatkovnog centra do ruba mreže
GPU NVIDIA V100 TENSOR CORE
Mjerila dubinskog učenja Titan RTX