Izberite Stran

Na preizkusni mizi smo preizkusili Bulldozer: FX-8150 in tri matične plošče 990FX

Na preizkusni mizi smo preizkusili Bulldozer: FX-8150 in tri matične plošče 990FX

TECHNOLOGIA

Čipi so narejeni na 32nm SHP vozlišču GlobalFoundries. Za Buldožerje je bil predhodno uveden SOI združen z Intelovim HKMG (High-K Metal Gate), ki lahko pomaga pri boju proti uhajanju toka. Arhitektura je dobro zasnovana za doseganje visokih taktnih frekvenc ("Speed ​​racer"), zaradi česar je modelna paleta verjetno popolnoma brez izdelkov pod 3 GHz. Vse osrednje enote v starem jeziku so črna izdaja, zato zdaj ni posebej označena.

Na tem mestu se malo zavijmo in si oglejmo tudi drugo plat medalje. Najhitrejši štirijedrni procesor Phenom II dosega frekvenco 3,7 GHz, šestjedrni Thuban 1100T na čipu pa 3,3 GHz. Za primerjavo, osnovni posnetek 32nm AMD FX-8150 je skoraj razočarajoče nizek in sprejemljiv je le 4,2 GHz "nivo" Turbo Core, kar takoj obljublja 10-15% presežka moči (ne). XbitLabs je pred letom dni prezračil, da je Buldožer prehodil uro 3,5 GHz, ki se je sestavila, a kljub vrsti zdrsov. Pravilno se zdi domnevati, da še vedno obstajajo resni problemi s proizvodnjo in proizvodnjo novega topa, kar pomembno vpliva na zmogljivost.

amd_buldozer_hatekonysag
Drugo celo število le poveča velikost modula za 12 odstotkov. [+]

Na podlagi dolgoletnih izkušenj se je rodil celo osnovni koncept, ki je temeljil na naslednjem: centralne enote opravljajo operacije s fiksno točko s povprečno stopnjo nad 80 odstotkov. Iz tega je razvidno, da so izračuni s plavajočo vejico veliko manj prisotni v življenju "stonog". Pri načrtovanju sta torej povezani dve celi jedri, ki imata svoj predpomnilnik prve stopnje, vendar morata že deliti predpomnilnik druge stopnje in enoto s plavajočo vejico. AMD je enoto imenoval kot modul.

amd_bulldozer_one_module
En modul [+]

Glede na notranje meritve drugo celo število v bistvu poveča velikost modula za zanemarljivo velikost, v nasprotju s tem pa lahko v idealnem primeru povzroči povečanje zmogljivosti do 80%. Del primarnega predpomnilnika, ki je odgovoren za podatke, je neposredno povezan s procesorji (velikost 16 Kbyte, zakasnitev 4 ure), vendar je 64 Kbyte predpomnilnik, namenjen shranjevanju navodil, že v skupni rabi med integrali.

1_modul_kateri_kateri
Kopanje globlje [+]

Na podlagi rezultatov testa predpomnilnik podatkov L1 ni le premajhen, temveč celo počasen, zato ni zelo dobra kombinacija. Velikost pomnilnika druge stopnje v skupni rabi znotraj modula je zadovoljiva, vendar je njegova zakasnitev velika, 25–27 ciklov. Lahko si predstavljamo, da bi večji predpomnilnik L1 in hitrejši L2 (12–15 ciklov) izboljšali zmogljivost procesorja za 10–20%.

Ni presenetljivo, da tudi doseganje 8 MB L3 ni s svetlobno hitrostjo (65 ciklov). Če povzamemo, sistem predpomnilnika Buldožer ne bo osmo čudo sveta.

navodila
V naboru navodil labirint [+]

Buldožer ima trenutno najširši nabor podpore z navodili: MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, AVX, AES, FMA4, XOP, PCLMULQDQ in seveda 64-bitno razširitev. Od dveh novosti (FMA4, XOP) je FMA4 zelo pomemben na trgu HPC, XOP pa ponuja majhno prednost pred multimedijskimi aplikacijami. Kolikor vemo, najnovejša različica x264 že podpira nove nabore navodil. Zastarelo 3DZdaj! podpora je bila ukinjena, mislim, da mnogim bralcem ne povzroča neprespanih noči.

Znano je, da uporabljate Intel VT za dostop do navideznega pomnilnika x86. IOMMU znatno poveča zmogljivost virtualizacije sistema, vendar presenetljivo Intelove vrhunske rešitve (Core i5-2600K, i7-2600K) te tehnologije ne podpirajo in ta "črni krog" vključuje trenutne rešitve Sandy Bridge E. Spet dodatna storitev v primerjavi z neposredno konkurenco, čeprav je njena uporabnost za povprečnega uporabnika vprašljiva.

40
Turbo jedro v teoriji [+]

Izboljšano je bilo tudi Turbo Core, ki deluje z več urami in se še bolje prilagaja različnim stopnjam uporabe. Če so vsa jedra aktivna, enote s plavajočo vejico pa trenutno niso v uporabi, začne veljati ura Turbo Core 2.0. Postopek dinamično spreminja urne signale jeder v odvisnosti od obremenitve, neaktivni viri, moduli in komponente znotraj modula se lahko odklopijo, zato na tem področju ne bi razumeli pritožbe na sprednji del hiše. Na žalost vas programska stran stvari temeljito vrže v juho.

v praksi
Praktična izvedba [+]

Načrtovalnik sistema Windows 7, milo rečeno, ni najučinkovitejši način dodeljevanja nalog, ker pogosto dodeljuje naloge med jedri. Naslednja različica operacijskega sistema bo odpravila težavo in kmalu bo popravljena za ta sistem, zato bomo - v skrajnih primerih lahko 15-25 odstotkov - kmalu dobili 2-10% večjo zmogljivost. Druga zelo lepa prednost bo ta, da se lahko poraba v prostem teku zmanjša za 4-5 vatov, ker lahko moduli ostanejo dlje časa "v teku".

buldožerwin8_and_bf3
"Ne glejte na svoje zobe za darilo predstave" [+]

buldožerbf3betafx

"Preobrazba" med Battlefield 3 [+]

Battlefield 3 prav tako dobro pokaže, kako nekaj optimizacije pomaga procesorju. V tej igri lahko trenutno najmočnejši procesor serije FX doseže zmogljivost Core i7-2600k.

Procesorji serije FX so opremljeni z ohišjem Socket AM3 + in so nameščeni v matičnih ploščah AMD z 9-serijskim naborom čipov. Usmerjenost olajša tudi barva vtičnice, ki je večinoma črna. Da bo platforma Scorpius neskončno zvočna, potrebujemo procesor serije FX, matično ploščo z naborom čipov serije 9 in grafično kartico serije Radeon HD 6000. Buldožer ima dvokanalni pomnilniški krmilnik DDR1866, ki podpira 3 MHz module.

fenomu_folulk

AMD FX-8150 s Phenom II X4 970 BE - od zgoraj [+]

Za zaključek bi radi dodali še en zanimiv dodatek. Resne polemike so vzbudile dejstvo, da so dela na uro (navodila na cikel), ki so jih opravili procesorji s sistemom Bulldozer, v povprečju nekoliko upadla v primerjavi s predhodnikom. Nekateri takoj predvidevajo padec arhitekture, drugi naštevajo podobne primere iz preteklosti. Glede tega se, kot vedno, omejimo na dejstva. Programerji danes vse bolj spoznavajo prednosti večjedrne optimizacije. Z 8-valjnim motorjem, ki v osnovi zagotavlja dobre zmogljivosti, redko pomislimo, kaj zmore z 1 valjem.

fenomualniulk

AMD FX-8150 s Phenom II X4 970 BE - spodaj [+]

Primer ni najboljši, lahko pa osvetli bistvo. Ne trdimo, da bomo na gosto optimalno uporabili osem celih jeder, vendar Turbo Core 2.0 cilja na najvišji možni taktni signal (4,2 GHz). Kar je na voljo samo v primeru K10.5 po ceni "krvavega znoja", se tukaj šteje za "osnovno uro". Prav tako ni dvoma, da je izvedba AVX, FMA in XOP stala pomemben nabor tranzistorjev. Osnove arhitekture se uporabljajo v več segmentih (strežnik, namizni računalnik), zato se je to zdelo obvezen korak, danes pa vidimo še manj njegovih prednosti (zlasti v namiznem okolju).

socket_2k

Leži v postelji [+]

V idealnem primeru (FMA4 + AVX) se Buldožer res počuti zelo osnovno, prinaša presenetljivo zmogljivost in stvari takoj postavi v drugačno luč. Po meritvah nemškega HT4U AMD FX-1.1 med aplikacijo upodabljanja C-Ray 8150 deluje v istih 15 sekundah kot Intel Core i7 990X. To je natanko polovica časa, ko je procesor AMD Phenom II X6 1100T opravil svoje delo. V oklepajih bi ugotovili, da smo tehtali tudi drugo skrajnost, Super PI.