Weboldalak

Az Nvidia bemutatja a következő Fermi-architektúrát

Hogyan működik a processzor (magyar felirattal)

Hogyan működik a processzor (magyar felirattal)
Anonim

konferencia a "GPU Technology Conference" -hez, de ez még mindig az Nvidia bemutatója. A Jen-Hsun Huang elnök-vezérigazgatója egy kis időt vállalt, hogy bemutassa a vállalat következő nagy GPU-architektúráját, a kódot "Fermi" -ként. Ez a chip grafika rajongói hívták GT300, a generációs utódja a GT200 chip, amely képes a kártyákat, mint a GeForce GTX 285.

A chip óriás nagyon óvatos, hogy helyezze a chip, mint nem egy új grafikus chip, hanem egy új " számíts és grafikus" chipet, ebben a sorrendben (dőltbánya). Valójában szinte minden, ami az új chipről szól, a számítógépes funkciókhoz kapcsolódik, nem pedig a hagyományosan grafikailag orientált dolgok, mint a textúraegységek és a visszaadási célok. Tudjuk, hogy a chip nagyjából 3,0 milliárd tranzisztort tartalmaz, és a TSMC 40nm-es folyamatán fog előállítani. Ez körülbelül 40 százalékkal több tranzisztor, mint az RV870 chip az új Radeon 5800 sorozatú DirectX 11 kártyák által csak megjelent a rivális AMD. A chipnek 512 feldolgozóegysége van (az Nvidia hívja őket CUDA magoknak), melyek mindegyike 32 processzoros processzor többszörös processzora. Ez több mint kétszerese a 240-es magnak a GT200-ban, és a magok jelentős javulást mutatnak. A chip egy 384 bites GDDR5 memória interfészt használ.

Néhány fontosabb pont:

Third Generation Streaming Multiprocessor (SM)

  • 32 CUDA mag / SM, 4x GT200 fölött
  • 8x a csúcs kettős pontosságú lebegőpontos teljesítmény a GT200
  • Dual Warp Scheduler alatt, amely 32 láncszálat
  • óránként
  • 64 KB RAM memóriával és megosztott memóriával és L1 gyorsítótárral

Második Párhuzamos szálfuttatás ISA

  • Unified Address Space teljes C ++ támogatással
  • OpenCL és DirectCompute optimalizált
  • Teljes IEEE 754-2008 32 bites és 64 bites pontosság
  • Teljes 32 bites teljes elérési út 64
  • Memóriabeviteli utasítások a 64 bites címzésre való átmenet támogatásához
  • Továbbfejlesztett teljesítmény a predikálással

Javított memória alrendszer

  • NVIDIA párhuzamos adatkiszolgáló hierarchia konfigurálható L1 és Unified L2
  • Gyorsítótár
  • Első GPU ECC memória támogatással
  • Nagymértékben javult atommemória művelet teljesítmény

NVIDIA GigaThread Engine

  • 10x gyorsabb alkalmazások kontextusátkapcsolása
  • Egyidejű kernel végrehajtása
  • Rendezetlen szál blokk végrehajtás
  • Kettős átfedésű memóriaátviteli motorok

ennek a chipnek a teljesítménye a stream-számítási feladatokban, mint például a sokkal gyorsabb kétpontosságú lebegőpontos számítási arány. A jelenlegi Nvidia GPU-k két pontos pontossággal számolnak az egypontos műveletek sebességének töredékével. A dupla pontosságú lebegőpontos műveleteknek most már csak az egypontosságú teljesítmény fele kell, hogy legyen, ami óriási javulás. A gyorsítótárban és az ütemezésben is jelentős javulások tapasztalhatók. Az Nvidia új Fermi oldaláról olvashat bővebben az architektúráról, amely egy PDF fehérlapot is tartalmaz.

Tehát mikor lesz képes vásárolni egy grafikus kártyát, amely ezt a chipet használja? Az Nvidia nem mondja. A cég képviselői azt mondták, hogy jelenleg "felhozzák a chipet", ami azt jelenti, hogy a működő minták csak nemrég jöttek vissza a gyártási üzemből. A múltbéli történelemből kitalált tévhitekből azt mondhatjuk, hogy december egy optimista megjelenési dátum, és a 2010. első negyedévben a szélesebb körű elérhetőség valószínűbb. Várja, hogy a táblák drágák legyenek. Az Nvidia nem hozza nyilvánosságra a chip méretét, de a tranzisztorszám alapján ítéljük meg 450 és 500 mm 2 között. A 384 bites memóriainterfész fedélzeti költségeivel párhuzamosan és a kihívásoknak köszönhetően a viszonylag új 40nm-es gyártási folyamat során az ilyen hatalmas chipekből jó hozamok jönnek létre, és olyan kártyákat nézel, amelyek valószínűleg erősebbek lesznek és drágább, mint az AMD Radeon 5800 sorozatú kártyái.

Kövesse Jason Cross-t twitteren, vagy látogasson el blogjára.