Radeon R700

Radeon R700
Specifikace
Řada graf. karet:Radeon HD 4000
Vydáno:2008
Navrhl:AMD
Vyrobil:TSMC
Vydal:AMD
DirectX:10.1
OpenGL:3.3
OpenCL:Nepodporuje
Vyšší třída:RV770, RV790
Střední třída:RV730, RV740
Nižší třída:RV710
Předchozí řada:R680
Následující řada:R800
Frekvence:850 MHz
Proces:40 a 55 nm
Tranzistorů:1 miliarda
Plocha:282 mm2

Radeon R700 je inženýrské označení pro GPU vyvíjené firmou AMD a je pájen na grafické karty řady Radeon HD 4000. Jádro RV770 bylo uvedeno na trh 25. června 2008, RV710, RV730, RV740, RV770 LE a RV790 XT byly vypuštěny později. Jádro je vyrobeno 55 nm technologií stejně jako R680, ale s vyšší hustotou tranzistorů. Podporuje DirectX 10.1, Shader model 4.1 a OpenGL 3.3.

Byla zvýšena plocha o 33% a hustota tranzistorů o 7,7% u RV770 oproti RV670. U RV790 byly hodnoty o 47% a -2%. U RV740 byla zvýšena hustota tranzistorů o 62% oproti RV770, oproti RV670 to bylo o 74%.

AMD počítá hodně s technologií CrossFire (propojení více GPU). Už u této řady se snažila s ní počítat při návrhu.

Jádro

Stavba

Jádro staví na už starším, ale do budoucna prospěšném jádru R600 použitém na grafické kartě Radeon HD 2900 XT, která měla na svoji dobu některé velmi inovativní technologie, ale jako prodejní kus nebyla úspěšná jako třeba HD 3870 nebo jiné. ATI se povedlo vyvinout a AMD dále vylepšovat dost flexibilní jádro, které je velmi dobře modulovatelné a i řešení není špatné. Ale čím dál víc je orientována na technologii CrossFireX (propojení více grafických karet). Nejvyšší model RV770 XT obsahuje 800 5D unifikovaných jednotek, uskupených v 10 blocích a jádro dále obsahuje 40 TMUs jednotek a 16 ROPs jednotek. Unifikované shadery jsou taktovány stejně jako jádro, na rozdíl od čipů G80 (a jeho nástupců) firmy NVIDIA, které používají podstatně výše taktované unifikované shadery. Proto stejný počet jednotek se nerovná stejný výkon.

Reálně obsahuje nejvyšší verze jádra R700 pouze 160 unifikovaných shaderů, ale protože se skládá z 5 jednodušších jednotek, tak se většinou udává, že má 800 SP uspořádaných v 10 SIMD blocích. Nejvyšší verze obsahuje 956 milionů tranzistorů.

RV770 obsahuje 10 TMU, které umí obsloužit 4 adresy, 16 FP32 (floating-point) vzorků a 4 FP32 filtrovací funkce za 1 takt.

  • 64bitové filtrování je proti R600 prováděno s poloviční rychlostí
  • Dispatcher (UTDP) je vylepšen

RV790

Jádro RV790 obsahuje navíc Decap Ring, což je část okolo jádra pro lepší stabilitu jádra. Zvětšuje chladicí plochu a snižuje šum v jádru. Tato úprava si vyžádala 3 miliony tranzistorů navíc a plocha se zvětšila z 260 na 280 mm2.

Typy

  • RV710
    • nižší třída
    • TDP do 25 W
    • 55 nm proces, vyráběno u TSMC
    • 16 5D jednotek (80 SP)
    • 64bitová paměťová sběrnice
  • RV730
    • nižší střední třída
    • TDP do 50 W
    • 55 nm proces, vyráběno u TSMC
    • 64 5D (320 SP)
    • 128bitová paměťová sběrnice
  • RV740
    • střední třída
    • TDP do 80 W
    • 40 nm proces, vyráběno u TSMC
    • 128 5D jednotek (640 SP)
    • 128bitová paměťová sběrnice
  • RV770
    • varianty: RV770 CE, RV770 LE, RV770
    • vyšší střední třída
    • TDP do 180 W
    • 55 nm proces, vyráběno u TSMC
    • 128, 160 5D jednotek (640/800 SP)
    • 128, 256bitová paměťová sběrnice
  • RV790
    • vyšší střední třída
    • TDP do 180 W
    • 55 nm proces, vyráběno u TSMC
    • 160 5D jednotek (800 SP)
    • 256bitová paměťová sběrnice
    • vylepšené jádro RV770

Podrobnější info

  • 1 Zařazení je bráno v době vydání nebo po dobu kdy nebylo nic novějšího.
  • 2 Rozděleno na počet SM bloků v jádru, počet Shader jednotek v 1 SM bloku a počet jednotek v 1 Shader jednotce
  • 3 GFLOPS = FMAD
Připojitelné rozhraníPodpora APIJádro
DirectXShader modelOpenGLUVDSM bloky2
Shader jednotkyJednotek
PCIe 2.0 x1610.14.13.3UVD 2
UVD 2.2
165
NázevVydánoModely karetČást trhu 1JádroFrekvence (MHz)VýkonPaměťová částTDP (W)
JádroKódové označeníPočet jaderProces (nm)Počet tranzistorů (miliónů)Plocha jádra (mm2)SM bloky2ShaderyTMUROPPoměr jednotekČipPamětiTeoretický v Single Precision (GFLOPS)3FillratePaměť (MiB)Typ pamětíPropustnost (GB/s)Šířka sběrnice (bit)3D
Počet5D jednotekJednotekNa jádroCelkověcolor ROPZ/Stencil ROPReálnáEfektivníTexture (GT/s)Pixel (GP/s)Z/Stencil (GSamples/s)Propustnost geometrie (Mpolygon/s)
Na jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkově
RV710--30. září 2008HD 4350Nejnižší155242731168084164:2:1:45755001000924,62,39,2575256
512
1024
DDR286420
--HD 45506006001200964,82,49,6600DDR39,625
8001600GDDR312,8
RV730Pro-10. září 2008HD 4650Nižší514146464320328328:4:1:4600500100038419,24,819,2600256
512
1024
DDR2166448
650700140041620,85,220,8650GDDR322,4128
9001800GDDR428,8
XT-HD 4670Střední750900180048024624750512
1024
DDR328,859
10002000GDDR332
11002200GDDR435,2
RV740-22. dubna 2009HD 4770Střední4082613781286403216648:2:1:47508003600960241248750512GDDR551,212880
RV770CE-10. září 2008HD 4730Střední559562568128640328328:4:1:4700900360089622,45,622,4700512GDDR557,6128110
750826,324624750
LE-21. října 2008HD 4830Střední16648:2:1:4575900180073618,49,236,8575512GDDR3
GDDR4
57,625695
PRO-19. června 2008HD 4850Vyšší1016080040166410:2,5:1:462599319861000251040625512
1024
2048
GDDR3
GDDR4
63,55110
XT-25. června 2008HD 4870Vyšší10:2,5:1:475090036001200301248750GDDR5115,2150
XTR7007. listopadu 2008HD 4850 X2Nejvyšší22× 9562× 25610201603208001600408016326412810:2,5:1:462599319861000200025501020408062512502× 512
2× 1024
GDDR32× 63,552× 256250
12. října 2008HD 4870 X27509003600120024003060122448967501500GDDR52× 115,2286
RV790XT-2. dubna 2009HD 4890Vyšší19592821016080040166410:2,5:1:4850975390013603413,654,48501024
2048
GDDR5124,8256190
JádroKódové označeníVydánoModely karetČást trhu 1Počet jaderProces (nm)Počet tranzistorů (miliónů)Plocha jádra (mm2)Na jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověPoměr jednotekČipReálnáEfektivníNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověNa jádroCelkověPaměť (MiB)Typ pamětíPropustnost (GB/s)Šířka sběrnice (bit)3D
Počet5D jednotekJednotekcolor ROPZ/Stencil ROPTeoretický v Single Precision (GFLOPS)3Texture (GT/s)Pixel (GP/s)Z/Stencil (GSamples/s)Propustnost geometrie (Mpolygon/s)
SM bloky2ShaderyTMUROPPamětiFillrate
NázevJádroFrekvence (MHz)VýkonPaměťová částTDP (W)

Programování pro GPU

AMD vyměnila uzavřený jazyk Close to Metal za jazyk OpenCL, který je otevřený standard.

GPU komunikace/propojení

GPU obsahuje komunikační port pro přímou komunikace s druhým GPU na PCB, který se jmenuje CrossFireX SidePort (zkráceně SIDEPORT). Díky němu nemusí zatěžovat čip PLX PEX 8647 pro PCI-E 2.0 16x. Ale je na výrobcích, jestli SIDEPORT zapojí a zatím nenašel uplatnění z důvodů nesnížení výkonu, ale v budoucnu by mohl mít větší využití. Je pouze u čipu RV770 a jeho variant.

Paměťový řadič na GPU

Paměťový řadič je až 256bitový. 1 ROPs jednotka je spárována s 16bitovou sběrnicí, díky tomu je u 256bitové sběrnice 16 ROPs jednotek, 128bitové sběrnice 8 ROPs jednotek a 64bitové sběrnice pouze 4 ROPs jednotky.

Byl změněn typ řadiče z interního ring bus na kombinovaný křížený a interní hub.

Řadič je uzpůsoben pro práci s DDR, DDR2, DDR3, GDDR3, GDDR4 a GDDR5, neboli umí pracovat se všemi DDR/GDDR variantami pamětí.

Při použití s GDDR5, které dosahují standardně taktů 3,6 GHz (4×0,9 GHz), se dostáváme na 115,2 GB/s, to by mělo stačit. Ale architektura pamětí by měla umožnit jít až k 5 GHz (4×1,25 GHz), kde se dostáváme k 160 GB/s. Do budoucna je GDDR5 prezentováno i ve spojení s 128bitovou sběrnicí pro postupné snižování cen, a to bychom měli 57,6 - 80 GB/s. Těchto přenosových propustností dnes dosahují karty střední třídy za použití GDDR3 (běžně 64 GB/s).

Multimédia

R700 čip má implementován UVD2 a díky tomu je schopen akcelerovat MPEG-2, H.264/MPEG-4 AVC a VC-1 s minimálním zatížením CPU. GPU je schopno za běhu upravovat kontrast, barvy a další složky videa.

Podpora

Podporuje DirectX 10.1, Shader model 4.1 a OpenGL 3.3. Čip podporuje sběrnici PCI-E 2.0 16x (je kompatibilní s verzí 1.1). Dále podporuje CrossFireX, který umožňuje zapojení až 4 čipů a teoreticky zvýšení výkonu až 4×, ale běžně to je zhruba do 2,5×.

Obchodní trh

Započatá agresivní politiky pro dosažení co nejnižších cen a co nejvyššího poměru výkon/cena stále platí. AMD se tak snaží získat větší část trhu. Ve 4Q 2008 byl podíl AMD na trhu prodejů zhruba 40 % v segmentu grafických karet do PC.

Jádra podrobně

Podrobně

  • PCI-E x16 2.0 kompatibilní.
  • Podpora DirectX 10.1.
    • Shader model 4.1
    • 32bitové filtrování textur v plovoucí desetinné čárce.
  • Podpora OpenGL 3.3.
  • Vyhlazovací funkce (Anti-aliasing).
    • Vícevzorkové vyhlazování (Multi-sample Anti-aliasing).
      • 2, 4, nebo 8 vzorků na pixel.
    • Až 12× volitelný filtr vyhlazování pro lepší kvalitu (CFAA = Custom Filter Anti-Aliasing).
    • Adaptive super-sampling a multi-sampling.
    • Korekce gammy.
    • Super AA (pouze v konfiguraci ATI CrossFireX™)
    • Všechny vyhlazovací funkce jsou kompatibilní s HDR renderováním.
  • ATI PowerPlay™ technologie.
    • Pokročilá správa napájení pro optimální výkon a úsporu energie.
    • Pouze požadovaný výkon (Performance-on-Demand)
      • Neustále monitoruje vytížení GPU a dynamicky podle toho upravuje frekvenci a napětí podle nastavení uživatele.
      • Snižování frekvence jádra a pamětí.
      • Změna napětí.
    • Centrální správa teploty - senzor na čipu (on-chip) snímající teplotu GPU a udržující ji v optimálních hodnotách.
      • Většinou to je okolo 60-80 °C.

RV710

Základní parametry

  • Podpora 1080p formátu
  • UVD 2 (Unified Video Decoder 2)
    • Přebírá přehrávání videa z CPU na GPU a tím i zatížení CPU.
  • HDMI
    • Podporuje poslední zvukové technologie, HDMI podporuje až 7.1 prostorový zvuk. Podporuje u xcYCC, která umožňuje využít širokou možnost barev s kompatibilním HDTV.
  • Integrována DisplayPort technologie se zvukem
    • DisplayPort je inovativní digitální řešení, které podporuje poslední LCD technologie a grafiku.
  • 80 stream zpracovávacích jednotek
    • Dostatek výkonu pro běžné programy a nenáročné hry.
  • Rozšířené vyhlazování (AA) a Anizotropní filtrování (AF)
    • Vysoký výkon v anizotropním filtrování a vyhlazování (4x AA), vyhlazení hranatých hran a vytvoření grafiky z "reálného života", funguje od trávy po obličeje.
    • V reálu výkon v AA stačí pouze pro starší a méně náročné hry. Záleží hlavně na rozlišení.
  • ATI CrossFireX™ technologie
    • Podporuje dobré škálování výkonu.
    • V praxi je výkon až 2,5x vyšší, záleží hlavně na enginu hry.
  • Spotřeba do 20 W při plném vytížení
    • Ideální volba pro méně náročné práce.
  • Dynamická správa napájení
    • Grafické karty HD 4350 obsahují funkci ATI PowerPlay™, která podle vytížení jádra upravuje napájení GPU, pro maximální šetření energie a snížení teploty.
  • Využit energeticky efektivní výrobní proces
    • Druhá generace 55nm čipu využívá energeticky efektivní výrobní proces.
  • Stabilita a Spolehlivost
    • ATI Catalyst software a ovladače jsou psány pro maximální stabilitu a spolehlivost.
  • Inovativní technická podpora
    • Uživatelé s certifikovanými grafickými produkty (kartami) mají volný přístup k online databázi a technické podpoře

Požadavky

  • Volný slot PCI Express® x16 na základní desce.
  • Minimálně 300W zdroj nebo výkonnější, pro CrossFireX je potřeba minimálně 350W.
    • Na sestavě s malou spotřebou může stačit i menší zdroj.
  • Certifikovaný zdroj je doporučený.[1]
  • Doporučeno minimálně 1 GB operační paměti.
    • Záleží na operačním systému a nárocích uživatele.
  • Pro instalaci ovladačů mít optickou mechaniku (CD/DVD).
    • Je možné stáhnout ovladače z internetu.
  • Pro DVD video přehrávání mít DVD mechaniku.
  • Pro Blu-ray™ video přehrávání mít Blu-ray mechaniku a pro plný 1080p obraz mít monitor splňující 1080p.
  • Pro DirectX® 10.1 podporu je potřeba mít nainstalovaný Windows Vista® se Service Pack 1
  • Pro aktivní CrossFireX™ technologii je potřeba mít 2x HD 4350 a základní desku podporující technologii CrossFireX.
    • Je možné zapojit i HD 4350 + HD 4670 a další, ale omezovala by se víc výkonná karta méně výkonnou.

Podrobně

  • Čip je osazován na HD 4350 a HD 4550
  • 242 miliónů tranzistorů, vyráběných 55nm procesem u TSMC.
  • Podpora GDDR3/DDR3/DDR2 pamětí a 64bitová sběrnice.
  • Unifikovaná superskalární architektura shaderu.
    • 80 stream zpracovávacích jednotek.
      • Shadery jsou flexibilně rozdělovány mezi vertex, geometry a pixel jednotky. (Shadery jsou programovatelné)
    • 128bitová přesnost plovoucí desetinné čárky pro všechny instrukce.
    • Bezpečnostní čip proti přehřátí GPU.
    • Shader instrukce a cache pro konstanty.
    • Načtení až 32 textur na frekvenci.
    • Až 128 textur na pixel.
    • DXTC a 3Dc+ komprese textur.
    • Podpora vysokého rozlišení textur (až 8192 x 8192).
    • Bezztrátová Z & stencil komprese (až 128:1).
    • Bezztrátová komprese barev (až 8:1).
  • Dynamická akcelerace geometrie
    • Programovatelná teselační jednotka (tessellation unit).
  • Vyhlazování textur
    • 2, 4, 8, 16× vysoce kvalitní adaptivní (přizpůsobivé) anizotropický vyhlazovací mód (až 128 bodů (taps na pixel)
    • sRGB filtrování (gamma/degamma)
  • ATI CrossFireX™ Multi-GPU technologie.
    • Zvýšení výkonu renderování a kvality obrazu s 2 GPU.
    • Integrovaný skládací engine.

RV730

Podrobně

  • HD 4650 a HD 4670.
  • 514 milionů tranzistorů, vyráběných 55nm procesem u TSMC.
  • Podpora GDDR3/DDR3/DDR2 pamětí a 128bitová sběrnice.
  • Unifikovaná superskalární architektura shaderu.
    • 320 stream zpracovávacích jednotek.
      • Shadery jsou flexibilně rozdělovány mezi vertex, geometry a pixel jednotky. (Shadery jsou programovatelné.)
    • 128bitová přesnost plovoucí desetinné čárky pro všechny instrukce.
    • Bezpečnostní čip proti přehřátí GPU.
    • Shader instrukce a cache pro konstanty.
    • Načtení až 128 textur na frekvenci.
    • Až 128 textur na pixel.
    • DXTC a 3Dc+ komprese textur.
    • Podpora vysokého rozlišení textur (až 8192 x 8192).
    • Bezztrátová komprese barev (až 8:1).
    • Podpora fyzikálních enginů.
  • ATI CrossFireX™ Multi-GPU technologie.
    • Zvýšení výkonu renderování a kvality obrazu s 2 GPU.
    • Integrovaný skládací engine.
    • Vnitřní propojení pro vysoký výkon.

RV740

  • HD 4770
  • 826 milionů tranzistorů, vyráběných 40nm procesem u TSMC.
  • Podpora GDDR5 pamětí a 128bitová sběrnice.
  • Unifikovaná superskalární architektura shaderu.
    • 640 stream zpracovávacích jednotek.
      • Shadery jsou flexibilně rozdělovány mezi vertex, geometry a pixel jednotky. (Shadery jsou programovatelné)
    • 128bitová přesnost plovoucí desetinné čárky pro všechny instrukce.
    • Bezpečnostní čip proti přehřátí GPU.
    • Shader instrukce a cache pro konstanty.
    • Načtení až 128 textur na frekvenci.
    • Až 128 textur na pixel.
    • DXTC a 3Dc+ komprese textur.
    • Podpora vysokého rozlišení textur (až 8192 x 8192).
    • Bezztrátová komprese barev (až 8:1).
    • Podpora fyzikálních enginů.
  • ATI CrossFireX™ Multi-GPU technologie.
    • Zvýšení výkonu renderování a kvality obrazu s 2 GPU.
    • Integrovaný skládací engine.
    • Vnitřní propojení pro vysoký výkon.

RV770

Podrobně

  • HD 4830, HD 4850 a HD 4890
  • 956 milionů tranzistorů, vyráběných 55nm procesem u TSMC.
  • Podpora GDDR3/4/5 pamětí a 256bitová sběrnice.
  • Unifikovaná superskalární architektura shaderu.
    • 640/800 stream zpracovávacích jednotek.
      • Shadery jsou flexibilně rozdělovány mezi vertex, geometry a pixel jednotky. (Shadery jsou programovatelné)
    • 128bitová přesnost plovoucí desetinné čárky pro všechny instrukce.
    • Bezpečnostní čip proti přehřátí GPU.
    • Shader instrukce a cache pro konstanty.
    • Načtení až 160 textur na frekvenci.
    • Až 128 textur na pixel.
    • DXTC a 3Dc+ komprese textur.
    • Podpora vysokého rozlišení textur (až 8192 x 8192).
    • Bezztrátová komprese barev (až 8:1).
    • Podpora fyzikálních enginů.
  • ATI CrossFireX™ Multi-GPU technologie.
    • Zvýšení výkonu renderování a kvality obrazu s 2 GPU.
    • Integrovaný skládací engine.
    • Vnitřní propojení pro vysoký výkon.

RV790

Podrobně

  • 956 milionů tranzistorů, vyráběných 55nm procesem u TSMC.
  • Podpora GDDR5 pamětí.
  • Unifikovaná superskalární architektura shaderu.
    • 800 stream zpracovávacích jednotek.
      • Shadery jsou flexibilně rozdělovány mezi vertex, geometry a pixel jednotky. (Shadery jsou programovatelné)
    • 128bitová přesnost plovoucí desetinné čárky pro všechny instrukce.
    • Bezpečnostní čip proti přehřátí GPU.
    • Shader instrukce a cache pro konstanty.
    • Načtení až 160 textur na frekvenci.
    • Až 128 textur na pixel.
    • DXTC a 3Dc+ komprese textur.
    • Podpora vysokého rozlišení textur (až 8192 x 8192).
    • Podpora fyzikálních enginů.
  • ATI CrossFireX™ Multi-GPU technologie.
    • Zvýšení výkonu renderování a kvality obrazu s 2 GPU.
    • Integrovaný skládací engine.
    • Vnitřní propojení pro vysoký výkon.

Reference

  1. Seznam certifikovaných produktů. ati.amd.com [online]. [cit. 2009-05-16]. Dostupné v archivu pořízeném dne 2009-05-13. 

Externí odkazy