Izberite Stran

Preizkusil: AMD GCN - Predstavljamo Radeon HD 7970 in HD 7950

Prišel je čas, da končno predstavimo arhitekturo AMD GCN (Graphics Core Next) in njena dva najmočnejša predstavnika, Radeon HD 7970 in Radeon HD 7950.

Logotipi člankov GCN

Od HD 7950 smo se dvema takoj poklonili, zato smo imeli tudi priložnost preizkusiti CrossFireX, z obema karticama pa smo opravili tudi uglašene meritve. Seveda smo na dva nova topa poslali tudi številne dirkače, da bi ugotovili, koliko so se kartice pospešile v primerjavi s prejšnjo generacijo GeForces in Radeons. 


Preden vstopimo v udeležence in teste, si bomo podrobneje ogledali arhitekturo GCN in prevzeli funkcije HD 7970 in HD 7950.

 vsekartice 2k

 Grafično jedro Naprej

Maja 2007 je AMD predstavil grafično kartico Radeon HD 2900 XT, ki je bila že zgrajena na enotni senčniški arhitekturi. Kot se je izkazalo, je imel dizajn vrsto pomanjkljivosti, vendar so bile težave skoraj popolnoma odpravljene v času serije Radeon HD 4000, s čimer se je podjetje uveljavilo na trgu namiznih grafičnih kartic. Na tej točki je bilo videti, da so zdaj potrebne korenite spremembe. Serija HD 6900 "Cayman" velja za prvi korak. Tu so prejšnje 5-smerne super skalarne procesorje (VLIW5) zamenjali 4-smerni procesorji (VLIW4), Cayman pa je bil prvi čip, ki je obdeloval več neodvisnih tokov ukazov. Druga velika novost je bila uvedba dveh »grafičnih mehanizmov«, ki sta podvojila zmogljivost nastavitve trikotnika - s povečanjem moči tesselacije - in število nekaterih elementov (Rasterizer, Hierarchical Z, Tessellator). Danes je postal predmet našega naslednjega preizkusa. Zahvaljujoč arhitekturi, imenovani Graphics Core Next (GCN), so osenčevalni nizi, ki delujejo z do zdaj uporabljenimi navodili VLIW, zastareli in jih nadomestili tako imenovani Compute Units (CU). GCN je debitiral v družini Radeon HD 7900 "Tahiti".

19 m

Zanimivo, a ne preseneča, da so grafični procesorji Tahiti dosegli izjemno gostoto tranzistorjev zahvaljujoč tehnologiji izdelave pasovne širine TSMC 28 nm - vsebujejo 365 milijarde tranzistorjev na 4,3 kvadratnih milimetrov. Ena računska enota vsebuje štiri SIMD in eno skalarno enoto. AMD-ov vodilni Radeon HD 7970 “Tahiti XT” deluje z 32 aktivnimi CU-ji, ob predpostavki, da je vsega skupaj 2048 shader procesorjev (štirje 16-smerni SIMD-ji, 64 ALU-jev). Glede na dosedanji napredek generacij se to na prvi pogled ne zdi izjemna vrednost, a zaradi boljše učinkovitosti in izkoriščenosti želimo poudariti, da ni vredno po naključju iz tega izhajati daljnosežnih zaključkov en tehnični kazalnik. Teoretično lahko CU deluje enako kot ena enota Cayman SIMD. Glavna težava prejšnjih generacij je odvisnost od podatkov (zaporedna navodila so odvisna od podatkov), zaradi česar je uporaba močno nihala. Arhitektura GCN je tudi korak naprej na tem področju, saj z obdelavo tokov odpravlja prej izkušene odvisnosti. Prednosti so samo v ključnih besedah: razporejanje, odpravljanje napak, ocenjevanje pričakovane zmogljivosti in razvoj gonilnikov so postali tudi bistveno enostavnejši in preglednejši. 

24

36 mCU ne vsebuje samo štirih enot SIMD, ampak ima tudi svoj načrtovalnik, 340 KB vmesnega pomnilnika in gručo za teksturiranje. To je vsota 4 × 64 KB vektorskega registra, 64 KB skupne rabe lokalnih podatkov, 4 KB skalarnega registra in 16 KB predpomnilnika na prvi ravni. Na zgornji sliki je prikazana še ena komponenta, ki jo je vsekakor vredno omeniti, in sicer tako imenovana „Branch & Message Unit“, ki igra vlogo pri učinkovitejšem nadzoru programa.
Ko imamo doslej informacije, si oglejmo še enkrat ključne parametre grafičnega procesorja „Tahiti XT“: 32 CU (2048 senčnih procesorjev, 128 SIMD-jev), 128 teksturnih enot, 512 enot za nalaganje in skupno 8,2 MB predpomnilnika. Tako je bil položaj deklice takoj drugačen, čeprav smo se šele začeli "slačiti".

35 mFront-end

Kar zadeva prednji del, lahko opazimo pomembne razlike v primerjavi z arhitekturo NVIDIA GF110. Upravljanje v bistvu ne poteka na ravni CU. To nalogo izvajata ukazni procesor in asinhroni računalniški mehanizem (ACE). Čip je dobil dva geometrijska motorja, ki poleg Geometry-Assembler, Vertex-Assembler, prilagajata tudi enoti tessellatorjev devete generacije. Komunikacijo s CU olajšuje Global Data Share (GDS), prek katere si lahko te enote izmenjujejo podatke med seboj. Sprednji del vsebuje dva rastrizatorja - postavitev si lahko ogledate spodaj.

37

ROP-ji in pomnilniški vmesnik
AMD Tahiti vsebuje 8 ROP gruč - v tem trenutku smo našli ujemanje s čipom Cayman. Vsaka taka "matrika" vsebuje štiri enote ROP in 16 Z vzorčevalnikov. Pomembno je omeniti, da je vsaka grozd dobila svoj predpomnilnik. Zgodila se je še ena velika sprememba: ni več neposredne povezave s krmilnikom pomnilnika. Ta poteza je namenjena izboljšanju prilagodljivosti in uporabnosti, kar lahko vidimo v kontekstu Pitcairna ... ROP-ji lahko pišejo v predpomnilnik L768 2 KB, ki ga nato lahko bere več enot. Pomnilniški vmesnik prejme veselo sliko. Šest 64-bitnih pomnilniških krmilnikov ima skupno zmogljivost 384 bitov. Temu bi dodali samo besedo. Končno! Privzeta velikost video pomnilnika je 3072 MB, teoretično pa je možnih tudi 1536 MB in 6 GB.

Upamo, da ga naši bralci ne bodo sprejeli s slabim imenom, toda na tem mestu bi izrazili svoje osebno mnenje o zalednem območju. Razmerje med Bartsom, ki se je izkazal zares dobro, in čipom Cayman, ki kaže razmeroma skromne rezultate, kaže na to, da je "splošna težava" čipov AMD tesna zmogljivost ROP. Tudi na Tahitiju ni bilo napredka, medtem ko bi o drugih novostih čipa z nekaj pretiravanja še vedno lahko pisali strani. Vloga ROP-jev je še posebej vidna med igrami, med nalogami in aplikacijami GPGPU postanejo drugi violinisti. Prav tako je gotovo, da ta odsek porabi veliko število tranzistorjev, kar se seveda odraža tudi v velikosti čipa.

 

Dosedanje izboljšave AMD so v veliki meri zadovoljile potrebe igralcev. Zdaj je prišlo do obrata za vsaj 90 stopinj in postalo je močno križišče za poklicne potrebe in širšo uporabo GPU. Seveda to ni problem, saj v bistvu govorimo o zelo grobi ravni zmogljivosti, ki bo nekaj let zagotovo zdržala preizkušnje sodobnih iger. Po govoricah ne samo AMD, temveč tudi NVIDIA s Keplerjem tesno obravnava ROP.

Razširitev pomnilniškega vodila je bil hvalevreden korak. Pravzaprav oblikovalci niso imeli veliko izbire. Ure ni mogoče več bistveno povečati, vendar je čip lačen podatkov. Po našem mnenju bi lahko samo ta poteza povečala zmogljivost med igrami do 15 odstotkov.

44DirectX 11.1 in PCI Express 3.0
Standard PCI-Express 3.0 poveča hitrost s 16 GB na sekundo na 32 GB / sekundo, kar podvoji hitrost prenosa podatkov pri PCIe 2.0. Proizvajalci matičnih plošč so takoj "zagrizeli", vendar ne glede na to, koliko si želijo, stikalo trenutno ne ponuja pomembne prednosti. PCIe 3.0 je s tržnega vidika pomembno orožje, obvezen standard za AMD in NVIDIA ter še ena "denarna past" za uporabnike.
DirectX 11.1 lahko svojo osvajanje začne z naslednjim operacijskim sistemom Windows, ki vsebuje manjše popravke in optimizacije. Glede na uradno gradivo lahko od novega API-ja pričakujemo izvorno stereo 3D podporo in učinkovitejšo rastrizacijo. Na žalost morda najbolj zanimiva točka, ki govori o tem, kako je mogoče izboljšati prilagodljivost in široko uporabnost grafične strojne opreme, ni podrobno opisana.

31 m

Arhitektura Graphics-Core-Next izgleda na splošno tako. Seveda čip ne služi samo potrebam igralcev, temveč ima tudi prostor za profesionalne naloge. Tahitijeva teoretična računska največja zmogljivost (za izračune z dvojno natančnostjo) je 947 GFLOP, kar je štirikrat več za operacije s plavajočo vejico z eno natančnostjo. Poleg tega imajo spomini podporo za ECC in GPU je dobro seznanjen z API-ji DirectCompute 11.1, OpenCL 1.2 C ++ AMP.27 Nove funkcije: Zero-Core
Vrhunski plenilci na ravni Radeon HD 7900 so navadno vajeni kot tabu tema, toda inženirji AMD nimajo iznajdljivosti. Ideja je preprosta, a odlična, vendar ne nova. Če računalnik zapustite dlje časa, vendar ga iz nekega razloga ne želite izklopiti, lahko monitor pustite samo v stanju pripravljenosti. Zahvaljujoč tehnologiji ZeroCore Power lahko z izklopljenim zaslonom celoten grafični krmilnik izklopite in v tej obliki ni potrebno aktivno hlajenje. Prednosti so prepričljive: nič hrupa, 3 vati porabe energije. Za marsikoga bo to nepomemben dejavnik, vendar postopek za štirismerne sisteme Crossfire zaustavi neprimarne grafične kartice in znatno zmanjša vaš račun za elektriko - čeprav kdorkoli, ki razmišlja o takem sestavu, malo prispeva k energetski učinkovitosti.

21a

20

Eyefinity 2.0
Ena izmed zanimivih lastnosti nove različice je, da omogoča vodenje konferenčnih pogovorov z več monitorji z večpasovnim zvokom. Uradno ime postopka je Discrete Digital Multi-Point (DDM) Audio. Radeon HD 7970 je mogoče hkrati priključiti na tri zaslone, ki lahko sprejmejo osemkanalni avdio tok. To morda ne zanima posebej za domače uporabnike, je pa dober primer, na koliko področjih je mogoče uporabiti novi top. Pogon Catalyst se prav tako razvija, na primer olajša namestitev pladnja in vam omogoča sestavljanje ločljivosti po meri. Omeniti velja, da si lahko stereo 3D vsebine Full HD ogledate tudi v načinu Eyefinity. 

29 m

UVD in VCE
UVD 3.0 že ponuja strojno pospeševanje za vsebino DivX / Xvid, MPEG-4 2. del MVC, Video Code Engine (VCE) pa je tako rekoč AMD-ov ekvivalent Intel Quick Sync Video. VCE je samostojna strojna oprema in je zasnovana samo za pospešitev prekodiranja videoposnetkov H.264. Motor je počasnejši od senčnih procesorjev v grafičnem procesorju, a veliko bolj energetsko učinkovit. Uporabnikom sta na voljo dva načina. Sprva deluje samo VCE, ki je sam po sebi hitrejši od večine CPU-jev. V tem primeru ne bomo opazili upočasnitve, brez težav lahko naložimo grafično kartico ali centralno enoto. Druga možnost je hibridni način. Aritmetično-logične enote VCE in GPU skupaj skočijo na nalogo. Ta "poroka" očitno dobro vpliva na hitrost kodiranja, vendar v tem primeru ne bodite presenečeni, če vaša najljubša igra preklopi v način "diaprojekcije".

32

Zdaj, ko smo seznanjeni s teorijo in številkami, se na testu seznanimo s tremi modeli GCN!