Poređenje potrošnje energije u grafičkim procesorima i koje od njih štede najviše

  • Energetska efikasnost GPU-a zavisi i od njegove arhitekture i proizvodnog čvora, kao i od specifičnog ograničenja snage koje postavlja svaki model.
  • U serverima i umjetnoj inteligenciji, grafički procesori poput NVIDIA H100 ili Intel Gaudi 3 nude brutalne performanse po cijenu ogromne potrošnje energije, što direktno utiče na globalnu potrošnju energije.
  • U segmentu igraćih i kućnih računara, modeli poput GTX 1650, RTX 4060, RTX 5060 ili RX 7600 ističu se dobrim odnosom performansi i potrošnje energije i umjerenim zahtjevima za napajanjem.
  • Da bi se zaista uporedila potrošnja energije, ključno je analizirati performanse po vatu u određenim konfiguracijama, umjesto da se fokusiramo samo na naziv brenda grafičke kartice.

koja potrošnja energije GPU-a

Izbor grafičke kartice ovih dana više nije samo stvar broja FPS-ova koje postiže u vašoj omiljenoj igri. To je sve važnije. koliko električne energije je potrebno za dobar radOvo je važno i zbog računa za struju i toplote koju generiše, kao i zbog njenog uticaja na okolinu. I tu dolazi do izražaja dobro poređenje potrošnje energije, u rasponu od skromnih grafičkih procesora za Ryzen 5 7600 do računarskih snaga za vještačku inteligenciju.

U sljedećim redovima naći ćete vrlo kompletan vodič gdje se dva svijeta presijecaju: s jedne strane, GPU-ovi male snage, visoke efikasnosti S jedne strane, postoje GPU-ovi za igranje i kućne računare, a s druge strane, zvijeri za servere i podatkovne centre koje treniraju AI modele i troše vate kao da nema sutra. Ideja je da shvatite šta čini GPU efikasnim, kako se energetska efikasnost promijenila kod AMD-a i NVIDIA-e i koji specifični modeli trenutno nude najbolji odnos performansi po vatu.

Zašto je energetska efikasnost GPU-a toliko važna?

Kada govorimo o potrošnji energije grafičkih kartica, obično se pozivamo na TGP ili TDP, tj. približna maksimalna snaga koju GPU može potrošiti Pod opterećenjem. Ova vrijednost utiče na nekoliko stvari: veličinu i kvalitet napajanja, količinu generisane toplote, buku ventilatora i, naravno, račun za struju ako mnogo koristite opremu.

U praksi, čak i dva GPU-a istog brenda mogu se ponašati vrlo različito, jer Proizvođači postavljaju različita ograničenja snage ovisno o modelu i dizajnu hladnjaka. Nije neuobičajeno vidjeti, na primjer, mobilnu RTX 4050 koja radi na 35W i drugu na 115W; naziv je isti, ali Performanse se radikalno mijenjaju s tim ograničenjem potrošnjeZbog toga su poređenja prilično komplikovana ako se podaci o snazi ​​ne uzmu u obzir.

Najbolje aplikacije za streaming i snimanje zasnovane na GPU-u za Windows 11
Vezani članak:
Najbolje aplikacije za streaming i snimanje zasnovane na GPU-u za Windows 11

Nadalje, svaki GPU se napaja putem PCI Express magistrala i dodatni konektori za napajanje sa 6, 8 ili 16 pinova, što nameće uravnotežen arhitektonski dizajn s jasnim ciljem: postići veće performanse uz održavanje ili smanjenje potrošnje energije konfigurirajte profile performansiPosljednjih godina postignut je veliki napredak u ovoj oblasti, kako u oblasti igara, tako i u oblasti servera sa GPU-ovima za AI i HPC (visokoperformansno računarstvo).

Evolucija energetske efikasnosti kod AMD i NVIDIA gejming GPU-ova

Ako se osvrnemo desetak godina unazad, naći ćemo generacije poput ATI Radeon HD 5000 (Terascale 2) i NVIDIA GTX 400Tada su performanse po vatu bile daleko od onoga što imamo danas. Od tada, svaka nova arhitektura je dodatno zatezala energetsku efikasnost.

Jedan od najupečatljivijih skokova dogodio se sa NVIDIA GTX 900Bila je to prva generacija NVIDIA GPU-ova koja je jasno usvojila napredne tehnike rasterizacije zasnovane na pločicama, što je pomoglo u mnogo boljem iskorištavanju potrošene energije. AMD je obećao nešto slično sa svojom DSBR tehnologijom u Vega GPU-ovima, ali zaista robusna implementacija nije stigla sve do 2000-ih. prva RDNA (RX 5000) i njena evolucija RDNA 2 (RX 6000)gdje se balans performansi/potrošnje značajno poboljšao.

Što se tiče performansi po vatu, AMD-ovi napori sa RDNA bili su toliko značajni da su, u određenim asortimanima proizvoda, Uspjeli su se pozicionirati iznad NVIDIA RTX 30Ovome moramo dodati i faktor cijene: tradicionalno su AMD kartice bile nešto jeftinije od svojih NVIDIA ekvivalenata, što ih je činilo privlačnim mnogim korisnicima, iako je ta niža cijena također odražavala to AMD je donekle zaostajao po pitanju čistih performansi nekoliko generacija..

Još jedan ključni aspekt bio je proizvodni čvor. Dok se AMD kladio na TSMC-ov 7nm u svojim najnovijim generacijamaNVIDIA-ina tehnologija se kretala od TSMC-ovog 12nm procesa (RTX 20 serija) do Samsungovog 8nm procesa (RTX 30 serija). Ovo je AMD-u dalo prednost u gustoći tranzistora i efikasnosti koja nije uvijek očigledna kada se gledaju samo tehničke specifikacije. Korištenje naprednijeg čvora omogućava... smjestiti više tranzistora na manji prostor i potrošiti manje energije sa jednakim performansama, tako da poređenje između arhitektura nije bilo sasvim fer.

S dolaskom novih generacija, očekuje se da će i AMD i NVIDIA usvojiti naprednije čvorove (kao što je TSMC-ov 5nm proces u novijim arhitekturama), koji... To će mnogo više izjednačiti uslove igre. i to će nam omogućiti da uporedimo efikasnost gotovo pod jednakim uslovima, čineći kvalitet čistog arhitektonskog dizajna jasnijim.

GPU-ovi za servere i AI: ekstremna snaga i prekomjerna potrošnja

Potrošnja energije grafičkog procesora

Drugi veliki front na kojem se vodi bitka za efikasnost je onaj GPU-ovi za servere i podatkovne centreCilj ovdje nije postizanje visokog FPS-a u igrama, već ubrzanje modela umjetne inteligencije, velikih podataka i izuzetno složenih naučnih simulacija. I dok je efikasnost prioritet, apsolutna potrošnja energije raste do zapanjujućih brojki.

NVIDIA H100: Zvijer umjetne inteligencije koja proždire vate

La NVIDIA H100 Do danas je to jedan od najmoćnijih GPU-ova u NVIDIA-inom katalogu za AI i HPC. Baziran je na Hopper arhitekturi i dizajniran je za organizacije kojima su potrebne izuzetne performanse za... obučavanje i pokretanje modela umjetne inteligencije sljedeće generacije, veliki jezički modeli i složene naučne simulacije.

Među njegovim tehničkim karakteristikama ističu se sljedeće: 4nm napredna proizvodna tehnologija (TSMC)Kompatibilan je s do 80 GB HBM3 memorije i ima ogromnu računarsku snagu: desetine TFLOPS-a u FP64 i preko 1000 TFLOPS-a koristeći Tensor jezgre u malom formatu. Također uključuje podršku za tipovi podataka kao što je FP8koji omogućavaju značajno poboljšanje efikasnosti treniranja velikih modela bez prevelikog gubitka tačnosti.

Zahvaljujući NVLinku četvrte generacije, H100 može međusobno povezivanje s drugim GPU-ima formirati istinski visokoperformansne klastere, umnožavajući računarski kapacitet. Cijena svega ovoga je ogromna potrošnja električne energije: u konfiguracijama umjetne inteligencije govorimo o oko 700 vati po GPU-uDa bismo to stavili u kontekst, to je više nego što troše mnogi kompletni desktop računari, i više nego nekoliko vrhunskih grafičkih kartica za igranje zajedno.

Kada tu potrošnju pomnožite sa milioni jedinica koje se očekuju da će biti korištene u narednim godinamaGodišnja potrošnja energije dostiže nivoe uporedive s potrošnjom električne energije cijelih zemalja. Procjenjuje se da bi se, samo s projektima H100, lako moglo premašiti 13.000 GWh godišnje, što je više od ukupne potrošnje zemalja poput Gvatemale ili Litvanije. To povećava... ozbiljna ekološka i energetska pitanja na porastu umjetne inteligencije.

NVIDIA A30: balansiranje performansi i potrošnje energije za inferenciju

Ispred H100, NVIDIA A30 To je uravnoteženiji serverski GPU, zasnovan na Ampere arhitekturi. Namijenjen je preduzećima kojima je potrebno Dobre performanse, ali i pažnja prema potrošnji i budžetu.To je široko korištena opcija za zaključivanje o umjetnoj inteligenciji (korištenjem prethodno obučenih modela), umjereni HPC i virtualizaciju.

Proizveden u 7 nm tehnološkom procesu od strane TSMC-a, A30 nudi do 10 TFLOPS-a u FP64 i oko 165 TFLOPS-a u Tensor jezgrimasa 24 GB HBM2 memorije i mogućnošću povezivanja do dvije kartice putem NVLink-a. Njegova glavna prednost je što Postiže značajnu računarsku snagu uz relativno nisku potrošnju energije.Zbog toga je veoma atraktivna za podatkovne centre koji traže operativnu efikasnost i razumne troškove električne energije.

Intel Gaudi 2: solidna alternativa NVIDIA-i za vještačku inteligenciju

Intel je, preko Habana Labsa, razvio Gaudijevi akceleratori kao alternativa NVIDIA GPU-ima za AI opterećenja. Model Gaudi 2 Posebno je dizajniran za treniranje neuronskih mreža, sa 24 Tensor jezgre i vrlo jasnim fokusom na maksimiziranje performansi i efikasnosti u ovoj vrsti zadatka.

Proizvedeno u 7 nm, Gaudi 2 uključuje 96 GB HBM2e memorije i otvoreni softverski ekosistem. Njegova najveća snaga je integracija tehnologija kao što su RDMA i RoCE, koje omogućavaju direktan pristup memoriji između čvorova i poboljšana skalabilnost kada se više akceleratora koristi paralelno. Iako se o njegovoj tačnoj potrošnji snage ne raspravlja toliko kao u slučaju H100, njegov dizajn je usmjeren na ponudu vrlo konkurentan odnos performansi i potrošnje.

Intel Gaudi 3: Veće performanse i bolja efikasnost u velikim razmjerima

El Intel Gaudi 3 To je prirodna evolucija Gaudija 2 i predstavlja značajan skok u performansama i skalabilnosti za generativnu umjetnu inteligenciju, modele proširenog jezika (LLM) i obradu slika. Sa 5nm čvorom i arhitekturom optimiziranom za FP8, može postići do 1,835 PFLOPS-a u tom formatui podržava do 120 GB HBM2e memorije.

Njegova poboljšana infrastruktura za međusobno povezivanje omogućava efikasnije gradite velike klastereOvo je ključno pri obučavanju gigantskih modela. U komparativnim LLM testovima obuke, Gaudi 3 može biti do 1,7 puta brži od dobro utvrđenih alternativa, što se prevodi u manje vremena za računanje i bolja energetska efikasnost potrebno za postizanje određenog nivoa performansi.

Utjecaj na okoliš i potreba za čistijom energijom

Rast upotrebe GPU-ova za umjetnu inteligenciju i podatkovne centre doveo je do potrošnja energije ove infrastrukture naglo rasteNe radi se samo o snazi ​​koju zahtijevaju akceleratori poput H100 ili Gaudi 3, već i o ostatku pratećeg hardvera i, prije svega, o sistemima hlađenja potrebnim da ih održe unutar svojih termalnih ograničenja.

Velike tehnološke kompanije poput Mete, OpenAI-a i sličnih već su priznale da će, kako bi nahranile svoju AI infrastrukturu potrebne su ogromne količine energije...do te mjere da se otvoreno raspravlja o namjenskim nuklearnim elektranama ili masovnim ulaganjima u obnovljive izvore energije. Ovo je izazvalo ozbiljnu zabrinutost zbog utjecaja razvoja umjetne inteligencije na klimu, posebno zato što mnoge od ovih aplikacija dolaze do krajnjih korisnika kao naizgled besplatne usluge.

S obzirom na ovaj scenario, postaje neophodno da Kompanije koje dizajniraju grafičke procesore (GPU) trebale bi poboljšati i efikasnost i izvor energije koja ih napaja.Malo je koristi da GPU bude 20% efikasniji ako se ukupan broj raspoređenih akceleratora udeseterostruči, a fosilna goriva se i dalje koriste. Ovdje poređenje potrošnje i efikasnosti prestaje biti samo pitanje računa za struju i postaje pitanje ekološke odgovornosti.

Grafičke kartice niske potrošnje energije za kućne računare i igranje

U području kućnih računara i igara, slika je drugačija. Za mnoge korisnike, imati efikasnu grafičku karticu znači uštedite na napajanju, smanjite toplinu u kućištu i izbjegnite prekomjernu buku...pored toga što plaćaju nešto manje na kraju mjeseca. Grafičke kartice male snage ostaju vrlo zanimljiva kategorija, posebno u srednjem i... Optimizacija i upravljanje igrama na Steamu.

GPU se generalno smatra niskoenergetskim ako Ne prelazi oko 150W pod stvarnim opterećenjemA u najgorem slučaju, potreban mu je samo jedan 8-pinski konektor ili čak nijedan, a napajanje se crpi isključivo iz PCI Express slota. To mu omogućava besprijekorno funkcioniranje u sistemima s napajanjima od 300 do 400 W, što je idealno za... sastavite jeftine računare ili nadogradite stare mašine bez potrebe za promjenom pola platforme.

Kako smanjiti napon modernih procesora
Vezani članak:
Dijagnostika CPU i GPU pomoću CPU-Z / GPU-Z / HWiNFO

Šta GPU niske potrošnje energije donosi pravom računaru?

Tipičan primjer bi bio računar sa Ryzen 5 5600X, 16 GB DDR4 RAM memorije, PCIe SSD i 240 mm AIO hladnjakAko u taj sistem instalirate efikasnu grafičku karticu poput RTX 4060 ili buduće RTX 5060, ukupna potrošnja energije sistema pod opterećenjem obično se kreće između 280 i 320 W, ostavljajući napajanje od 400 W sa više nego dovoljno prostora. Nadalje, pravilno Optimizacija performansi u Windowsu 11 To pomaže u kontroli tih nivoa potrošnje.

Štaviše, ove grafičke kartice, Ne zahtijevaju vrhunske CPU-e za dobre performanse.Stoga se mogu upariti s relativno jeftinim procesorima bez straha od ozbiljnog uskog grla. Također su obično kompaktni i jednostavni za hlađenje, s ventilatorima koji se ne moraju okretati maksimalnom brzinom, što se prevodi u hladnija i tiša oprema.

Specifični modeli efikasnih grafičkih procesora i njihova potrošnja energije

GeForce GTX 1650 GDDR6: vrlo ekonomična i štedljiva opcija

La GeForce GTX 1650 sa GDDR6 memorijom To je jedna od najboljih opcija ako tražite vrlo jeftin polovni model za revitalizaciju starijeg računara. Ima TGP od samo 75W i napaja se... isključivo sa PCI Express porta u mnogim verzijama i može bez problema raditi sa starijim napajanjima od 300 W.

Što se tiče performansi, ovaj GPU se ponaša slično kao GeForce GTX 970 ili Radeon RX 570Međutim, ima prednost korištenja modernije arhitekture (Turing) i podrške za trenutne drajvere. I dalje je sposoban pokretati nezahtjevne ili starije igre u 1080p rezoluciji s prihvatljivim kvalitetom, što ga čini vrlo zanimljivim za sisteme kojima je potrebno samo skromno grafičko poboljšanje.

GeForce RTX 4060: Odlična efikasnost za 1080p

La NVIDIA GeForce RTX 4060 To je visoko cijenjena kartica, cijenjena zbog svog balansa između performansi i potrošnje energije. Bazirana na Ada Lovelace arhitekturi (AD107 jezgro), nudi više nego dovoljno snage za reproducirajte u 1080p rezoluciji s visokim ili vrlo visokim kvalitetom u trenutnim naslovima, uz podršku za tehnologije kao što je DLSS.

Njegov TGP je otprilike 115 W i koristi jedan 8-pinski konektorStoga, odlično radi sa napajanjima od 350-400W, pod uslovom da ostatak sistema nije previše gladan energije. Dolazi sa 3.072 shadera, 8GB GDDR6 memorije na 17Gbps, 128-bitnom magistralom i dobrim brojem Tensor i RT jezgara. Njegova cijena je obično ispod 300€, što ga, s obzirom na potrošnju energije i iskustvo igranja koje nudi, čini odličnom opcijom. jedna od najefikasnijih grafičkih kartica koje je NVIDIA izdala u posljednjih nekoliko godina.

GeForce RTX 5060: Skok u performansama uz nisku potrošnju energije

La GeForce RTX 5060 Predstavlja još jedan korak u performansama, uključujući Blackwell arhitekturu (GB206 jezgro) i vrlo brzu GDDR7 memoriju. Povećava broj shadera na 3.840 i poboljšava performanse u poređenju sa RTX 4060, stavljajući je u praktičnom smislu... na nivou 8GB RTX 4060 Ti u sirovoj snazi.

Njegov TGP raste na 145 WI dalje ostaje u okviru onoga što se može smatrati umjerenom potrošnjom energije. Zahtijeva 8-pinski konektor, a s tipičnom konfiguracijom Ryzen 5 5600X, 16 GB RAM-a i SSD-a, kompletan sistem ne bi trebao prelaziti 320 W pod opterećenjem. Njegovih 8 GB GDDR7 i podrška za tehnike generiranja okvira sljedeće generacije daju mu... Dug vijek trajanja pri 1080p i ulazu do 1440pbez vrtoglavog porasta potrošnje.

AMD Radeon RX 7600: efikasna alternativa za RTX 4060

Za one koji preferiraju AMD, Radeon RX 7600 To je zanimljiv kandidat u srednjem rangu. Baziran na RDNA 3 (Navi 33), ima 2.048 shadera, 8 GB GDDR6 memorije na 18 Gbps i 128-bitnu magistralu, kao i 32 namjenske jedinice za praćenje zraka. Što se tiče performansi, Performanse su mu vrlo slične RTX 4060 na 1080p., što ga čini dobrom opcijom za tu rezoluciju.

Njegov TGP je otprilike 165 W i zahtijeva 8-pinski konektorU standardnom sistemu sa Ryzen 5 5600X i balansiranom konfiguracijom, ostaje savršeno održiv sa kvalitetnim napajanjem od 400W. Ono gdje posebno blista je u... ravnoteža između potrošnje i performansi sada kada mu je cijena palaAko ga pronađete za oko 260 eura ili manje, to je obično prilično razumna kupovina.

GeForce RTX 5060 Ti 16 GB: Visoka snaga bez prevelike potrošnje

Idući jednu stepenicu gore, nalazimo GeForce RTX 5060 Ti 16GBOva kartica se približava vrhunskim performansama uz održavanje razumne potrošnje energije. Sa Blackwell arhitekturom i GB206 jezgrom, nudi 4.608 shadera, 16 GB GDDR7 memorije pri 28 Gbps, 128-bitnu magistralu i dobar broj Tensor i RT jezgara.

Njegov TGP je oko 180 WIpak, i dalje uspijeva nadmašiti Radeon RX 7700 XT, koji ima TGP od 245W. Potreban mu je samo jedan 8-pinski konektor, što znatno pojednostavljuje instalaciju. U računaru sa Ryzen 5 7600, 32 GB DDR5 memorije, NVMe SSD i 240 mm hladnjakUkupna potrošnja energije je oko 360W pod opterećenjem s ovom grafičkom karticom. Idealno bi bilo da se u ovom slučaju odlučite za... kvalitetna napajanja od 450-500W da ima dovoljno prostora i da izvor bude u zoni maksimalne efikasnosti.

GeForce RTX 4070: gornja granica "razumne potrošnje energije"

Konačno, model koji se graniči s onim što neki više ne bi smatrali niskom potrošnjom energije, ali je i dalje prilično skroman u usporedbi s vrhunskim karticama: GeForce RTX 4070Sa Ada Lovelace arhitekturom (AD104), 5.888 shadera, 12 GB GDDR6 memorije pri 21 Gbps i 192-bitnom magistralom, to je GPU dizajniran za... Igraj u 1440p sa svim postavkama na maksimumu pa čak i pogledajte 4K.

Njegov TGP je otprilike 200 Wi obično zahtijeva dva 8-pinska konektora ili jedan 16-pinski konektor, ovisno o modelu. U tipičnoj konfiguraciji s Ryzen 5 7600, 32 GB DDR5 RAM-a i tekućim hlađenjem, kompletan sistem troši oko 380-390 W pod opterećenjem. Za ovu kombinaciju preporučuje se sljedeće: dobro napajanje od 500-600Wšto omogućava marginu i osigurava visoku efikasnost samog napajanja.

Poređenja zasnovana na potrošnji u stvarnom svijetu: veliki izazov

Problem koji se ponavlja prilikom poređenja GPU-ova je taj što se većina web stranica fokusira na rezultati grupiranja poređenja po modeluOvo se radi bez uzimanja u obzir tačne izlazne snage svake verzije, posebno kod laptopa. To dovodi do obmanjujućih poređenja gdje se, na primjer, mobilna RTX 3050 Ti ograničena na 35W pojavljuje pomiješana s drugim varijantama od 60 ili 80W, što iskrivljuje percepciju njene stvarne efikasnosti.

Idealno bi bilo da se prilikom poređenja potrošnje energije može birati ne samo model GPU-a već i njegovo specifično ograničenje snage (na primjer, RTX 3050 Ti na 35W u odnosu na RTX 4050 na 45W) i pogledajte relativne performanse u svakom slučaju. Iako postoje baze podataka i liste koje rangiraju GPU-ove po snazi, i za desktop i za laptop računare, Oni ne uvijek integriraju rezultate performansi povezane sa svakom konfiguracijom napajanja.što nam zaista omogućava da procijenimo efikasnost.

Štaviše, to se mora imati na umu Isti silicijum se može ponašati vrlo različito ovisno o dizajnu proizvođača. (VRM, hlađenje, ograničenja snage), posebno kod laptopa, gdje varijanta sa niskom potrošnjom energije ima za cilj produžiti vijek trajanja baterije i smanjiti zagrijavanje, dok varijanta sa većom snagom daje prioritet sirovim performansama. Stoga, prilikom analize potrošnje energije, samo gledanje tehničkih specifikacija nije dovoljno: Bitno je uzeti u obzir testove opterećenja i tačne uslove svakog modela. i napravite a dubinsko čišćenje sistema pre merenja.

Cijela ova slika, od štedljivih grafičkih kartica poput GTX 1650 GDDR6 do monstruma poput NVIDIA H100 ili Intel Gaudi 3, pokazuje da je energetska efikasnost postala središnji fokus dizajna i odabira grafičkih kartica.

Kako da znam da li imam namjensku grafičku ili integriranu grafičku karticu u sistemu Windows 11
Vezani članak:
Kako da znam da li imam namjensku grafičku ili integriranu grafičku karticu u sistemu Windows 11

Razumijevanje kako se potrošnja, arhitektura, proizvodni čvor, performanse i specifični slučajevi upotrebe preklapaju omogućava donošenje mnogo razumnijih odluka, bilo da se radi o izgradnji pristupačnog gejming računara sa dobrim odnosom performansi i snage ili dimenzioniranju AI klastera koji neće pretvoriti račun za struju u trajni šok. Podijelite ovu informaciju kako bi više ljudi moglo saznati o ovoj temi.