Iskustvo je vitalno za razvijanje vještina potrebnih za primjenu dubokog učenja na nova pitanja. Brzi GPU znači brzo stjecanje praktičnog iskustva neposrednim povratnim informacijama. GPU-ovi sadrže više jezgri za bavljenje paralelnim proračunima. Oni također uključuju opsežnu propusnost memorije za lako upravljanje tim informacijama.
Imajući ovo na umu, nastojimo odgovoriti na pitanje: „Koja je najbolja grafička kartica za AI, strojno učenje i duboko učenje?”Pregledom nekoliko grafičkih kartica koje su trenutno dostupne 2021. godine. Kartice pregledane:
- AMD RX Vega 64
- NVIDIA Tesla V100
- Nvidia Quadro RTX 8000
- GeForce RTX 2080 Ti
- NVIDIA Titan RTX
Slijede rezultati:
AMD RX Vega 64
Radeon RX Vega 64
Značajke
- Datum izlaska: 14. kolovoza 2017
- Vega Arhitektura
- PCI Express sučelje
- Takt: 1247 MHz
- Stream procesori: 4096
- VRAM: 8 GB
- Propusnost memorije: 484 GB / s
Pregled
Ako vam se ne sviđaju NVIDIA GPU-ovi ili vam proračun ne dopušta da potrošite više od 500 USD na grafičku karticu, tada AMD ima pametnu alternativu. Smještajući pristojnu količinu RAM-a, brzu propusnost memorije i više nego dovoljno stream procesora, AMD-ov RS Vega 64 vrlo je teško zanemariti.
Arhitektura Vega nadogradnja je s prethodnih RX kartica. Po performansama je ovaj model blizak GeForce RTX 1080 Ti, jer oba ova modela imaju sličan VRAM. Štoviše, Vega podržava izvornu polupreciznost (FP16). ROCm i TensorFlow rade, ali softver nije zreo kao na NVIDIA grafičkim karticama.
Sve u svemu, Vega 64 pristojan je GPU za duboko učenje i AI. Ovaj model košta znatno ispod 500 USD i posao završava za početnike. Međutim, za profesionalne aplikacije preporučujemo da se odlučite za NVIDIA karticu.
AMD RX Vega 64 Pojedinosti: Amazon
NVIDIA Tesla V100
Tesla V100
Značajke:
- Datum izlaska: 7. prosinca 2017
- Arhitektura NVIDIA Volta
- PCI-E sučelje
- 112 TFLOPS izvedba tenzora
- 640 jezgri tenzora
- 5120 Jezgre NVIDIA CUDA®
- VRAM: 16 GB
- Propusnost memorije: 900 GB / s
- Računarski API-ji: CUDA, DirectCompute, OpenCL ™, OpenACC®
Pregled:
NVIDIA Tesla V100 nevjerojatna je i jedna od najboljih grafičkih kartica za AI, strojno učenje i duboko učenje. Ova je kartica potpuno optimizirana i isporučuje se u paketu sa svim dodacima koji će vam trebati u tu svrhu.
Tesla V100 dolazi u memoriji od 16 GB i 32 GB. Uz obilje VRAM-a, AI ubrzanja, veliku propusnost memorije i specijalizirane tenzorske jezgre za duboko učenje, možete biti sigurni da će svaki vaš model treninga raditi glatko - i za manje vremena. Točnije, Tesla V100 može pružiti 125TFLOPS performansi dubokog učenja i za trening i za zaključivanje [3], što je omogućila NVIDIA-ina arhitektura Volta.
Pojedinosti o NVIDIA Tesli V100: Amazon, (1)
Nvidia Quadro RTX 8000
Nvidia Quadro Rtx 8000
Značajke:
- Datum izlaska: kolovoz 2018
- Turingova arhitektura
- 576 jezgre tenzora
- Jezgre CUDA: 4.608
- VRAM: 48 GB
- Propusnost memorije: 672 GB / s
- 16.3 TFLOPSA
- Sučelje sustava: PCI-Express
Pregled:
Quadro RTX 8000 je posebno izrađena za matricu aritmetike i izračunavanja matrice dubokog učenja, vrhunska grafička kartica. Budući da se ova kartica isporučuje s velikim VRAM kapacitetom (48 GB), ovaj se model preporučuje za istraživanje izuzetno velikih računalnih modela. Kada se koristi u paru s NVLinkom, kapacitet se može povećati na do 96 GB VRAM-a. Što je puno!
Kombinacija 72 RT i 576 tenzorskih jezgri za poboljšane tijekove rada rezultira s preko 130 TFLOPS performansi. U usporedbi sa najskupljom grafičkom karticom s našeg popisa - Teslom V100 - ovaj model potencijalno nudi 50 posto više memorije i još uvijek uspijeva koštati manje. Čak i na instaliranoj memoriji, ovaj model ima izuzetne performanse dok radi s većim skupnim veličinama na jednom GPU-u.
Opet, poput Tesle V100, ovaj je model ograničen samo vašom cijenom. Međutim, ako želite ulagati u budućnost i u visokokvalitetno računanje, nabavite RTX 8000. Tko zna, možete voditi istraživanje o AI. Tesla V100 temelji se na Turingovoj arhitekturi, gdje se V100 temelji na Volta arhitekturi, pa se Nvidia Quadro RTX 8000 može smatrati nešto modernijim i nešto moćnijim od V100.
Nvidia Quadro RTX 8000 Detalji: Amazon
GeForce RTX 2080 Ti
Geforce RTX 2080 Founders Edition
Značajke:
- Datum izlaska: 20. rujna 2018
- Turing GPU arhitektura i RTX platforma
- Takt: 1350 MHz
- Jezgre CUDA: 4352
- 11 GB ultrabrze GDDR6 memorije sljedeće generacije
- Propusnost memorije: 616 GB / s
- Snaga: 260W
Pregled:
GeForce RTX 2080 Ti proračunska je opcija idealna za malo opterećenje modeliranjem, a ne za obuku velikih razmjera. To je zato što ima manju GPU memoriju po kartici (samo 11 GB). Ograničenja ovog modela postaju očitija kada se treniraju neki moderni NLP modeli. Međutim, to ne znači da se ova karta ne može natjecati. Dizajn puhala na RTX 2080 omogućuje daleko gušće konfiguracije sustava - do četiri GPU-a unutar jedne radne stanice. Uz to, ovaj model trenira neuronske mreže na 80 posto brzina Tesle V100. Prema LambdaLabsovim mjerilima performansi dubokog učenja, u usporedbi s Teslom V100, RTX 2080 je 73% brzine FP2 i 55% brzine FP16.
U međuvremenu, ovaj model košta gotovo 7 puta manje od Tesle V100. I sa stajališta cijene i performansi, GeForce RTX 2080 Ti izvrstan je GPU za duboko učenje i razvoj AI.
GeForce RTX 2080 Ti Pojedinosti: Amazon
NVIDIA Titan RTX
NVIDIA Titan RTX grafika
Značajke:
- Datum izlaska: 18. prosinca 2018
- Pokreće je NVIDIA Turing ™ arhitektura dizajnirana za AI
- 576 tenzorskih jezgri za ubrzanje AI
- 130 teraFLOPS (TFLOPS) za duboko učenje
- Jezgre CUDA: 4608
- VRAM: 24 GB
- Propusnost memorije: 672 GB / s
- Preporučeno napajanje 650 vata
Pregled:
NVIDIA Titan RTX je još jedan GPU srednje klase koji se koristi za složene operacije dubokog učenja. 24 GB VRAM-a ovog modela dovoljno je za rad s većinom serija. Međutim, ako želite obučiti veće modele, uparite ovu karticu s NVLink mostom kako biste učinkovito imali 48 GB VRAM-a. Taj bi iznos bio dovoljan čak i za velike NLP modele transformatora. Štoviše, Titan RTX omogućuje cjelovitu obuku mješovite preciznosti za modele (tj.e., FP 16 zajedno s akumulacijom FP32). Kao rezultat, ovaj model izvodi otprilike 15 do 20 posto brže u operacijama u kojima se koriste jezgre tenzora.
Jedno ograničenje NVIDIA Titan RTX je dizajn dvostrukog ventilatora. To otežava složenije konfiguracije sustava jer se ne može spakirati u radnu stanicu bez značajnih izmjena rashladnog mehanizma, što se ne preporučuje.
Sve u svemu, Titan je izvrstan, višenamjenski GPU za gotovo svaki zadatak dubokog učenja. U usporedbi s drugim grafičkim karticama opće namjene, zasigurno je skupa. Zbog toga se ovaj model ne preporučuje igračima. Ipak, istraživači koji koriste složene modele dubokog učenja vjerojatno će cijeniti dodatni VRAM i poboljšanje performansi. Cijena Titan RTX-a je značajno niža od V100 prikazane gore i bio bi dobar izbor ako vaš proračun ne dopušta da V100 cijene dublje učenje ili ako vam radno opterećenje ne treba više od Titan-a RTX (pogledajte zanimljive referentne vrijednosti)
NVIDIA Titan RTX Detalji: Amazon
Odabir najbolje grafičke kartice za AI, strojno učenje i duboko učenje
AI, zadaci strojnog učenja i dubokog učenja obrađuju gomilu podataka. Ti zadaci mogu biti vrlo zahtjevni za vaš hardver. Ispod su značajke koje morate imati na umu prije kupnje GPU-a.
Jezgre
Kao jednostavno pravilo, što je veći broj jezgri, to će veća biti izvedba vašeg sustava. Treba uzeti u obzir i broj jezgri, posebno ako imate posla s velikom količinom podataka. NVIDIA je svoje jezgre nazvala CUDA, dok AMD njihove jezgre naziva stream procesorima. Idite na najveći broj procesorskih jezgri koje vam dopušta proračun.
Procesorska snaga
Procesorska snaga GPU-a ovisi o broju jezgri unutar sustava pomnoženoj s taktovima na kojima radite jezgre. Što je veća brzina i veći je broj jezgri, veća će biti procesorska snaga na kojoj vaš GPU može izračunati podatke. Ovo također određuje koliko će brzo vaš sustav izvršiti zadatak.
VRAM
Video RAM ili VRAM mjeri količinu podataka koje vaš sustav može odjednom obraditi. Viši VRAM je presudan ako radite s različitim modelima Computer Visiona ili izvodite bilo koja CV Kaggle natjecanja. VRAM nije toliko važan za NLP niti za rad s ostalim kategorijskim podacima.
Propusnost memorije
Propusnost memorije je brzina kojom se podaci čitaju ili pohranjuju u memoriju. Jednostavno rečeno, to je brzina VRAM-a. Mjereno u GB / s, veća propusnost memorije znači da kartica može izvući više podataka za manje vremena, što rezultira bržim radom.
Hlađenje
Temperatura GPU-a može biti značajno usko grlo što se tiče performansi. Moderni grafički procesori povećavaju brzinu na maksimum dok pokreću algoritam. No čim se dostigne određeni temperaturni prag, GPU smanjuje brzinu obrade kako bi se zaštitio od pregrijavanja.
Dizajn ventilatora za hladnjake zraka potiskuje zrak izvan sustava, dok ventilatori bez puhala usisavaju zrak. U arhitekturi u kojoj se više grafičkih procesora nalazi jedan pored drugog, ventilatori koji ne puše više će se zagrijavati. Ako koristite zračno hlađenje u postavkama s 3 do 4 grafička procesora, izbjegavajte ventilatore koji ne puše.
Hlađenje vodom je još jedna mogućnost. Iako je skupa, ova metoda je mnogo tiša i osigurava da čak i najkvalitetnije GPU postavke ostanu hladne tijekom rada.
Zaključak
Za većinu korisnika koji se zalažu za duboko učenje, RTX 2080 Ti ili Titan RTX pružit će najveći udarac za vaš novac. Jedini nedostatak RTX 2080 Ti je ograničena VRAM veličina od 11 GB. Trening s većim serijama omogućuje modelima da treniraju brže i puno preciznije, štedeći puno vremena korisnika. To je moguće samo ako imate Quadro GPU ili TITAN RTX. Korištenje polupreciznosti (FP16) omogućuje ugradnju modela u GPU-ove s nedovoljnom veličinom VRAM-a [2]. Međutim, za naprednije korisnike trebate uložiti Tesla V100. To je naš najbolji izbor za najbolju grafičku karticu za AI, strojno učenje i duboko učenje. To je sve za ovaj članak. Nadamo se da vam se svidjelo. Do sljedećeg puta!
Reference
- Najbolji GPU-ovi za AI, strojno učenje i dubinsko učenje u 2020
- Najbolji GPU za duboko učenje u 2020
- NVIDIA AI INFERENCE PLATFORMA: Veliki skokovi u izvedbi i učinkovitosti za AI usluge, od podatkovnog centra do ruba mreže
- GPU NVIDIA V100 TENSOR CORE
- Mjerila dubinskog učenja Titan RTX