Historie grafických karet v noteboocích – 4. díl: 128 bitů a pravé barvy ve 3D

Ve třetím díle se grafické karty naučily vykreslovat ve 3D a nyní je čas, aby se posunuly v rychlosti a kvalitě zobrazení. 3D akcelerátory se stanou součástí základního vybavení a do odvětví notebooků se podívá další silný hráč – NVIDIA – aby konečně započal tu pravou konkurenční válku.

Tímto dílem se dostávám na konec roku 1999. 3D je velké téma v počítačích i noteboocích. V minulém díle výrobci ještě hledali ty správné cesty a tuto část počítače definovali. Teď už jsou stanovené jasné základy a těch se drží výrobci hardware i software. V desktopech je velká konkurence a rozdíly ve výkonu jednotlivých řešení již nejsou tak velké. V noteboocích je situace jiná – konkurence prakticky neexistuje, a kdo chce použitelné akcelerovat na svém notebooku 3D, volí jen jedno řešení od jednoho výrobce.

Průměrný velký notebook této doby má procesor na frekvenci aspoň 400 MHz (u Intelu Pentium II, u AMD K6-2 nebo K6-3), nejméně 64MB RAM a 5GB pevný disk. Displej je již ve většině případů aktivní (TFT) s rozlišením 1024×768 a úhlopříčkou 14-15″ a mezi 3D akcelerátory s přehledem vede ATI Rage LT Pro s 8 MB paměti, které okupuje vše od střední třídy výš (každý třetí grafický čip v notebooku je od ATI). Zvuková karta je již naprosto běžnou součástí a mezi optickými mechanikami se občas objeví i DVD-ROM. Malé notebooky mají slabší procesory a grafické karty nezřídka bez akcelerace 3D (nejčastěji NeoMagic kvůli nízké spotřebě) nebo s nízkým 3D výkonem (Trident).

Toshiba Satellite 2655XDVD je jedním z dobových dostupných modelů, které se snaží zaujmout podporou přehrávání DVD videa.

Ve většině notebooků je předinstalovaný operační systém Windows 98 SE a multimediální funkce obstarává knihovna DirectX ve verzi 6. Kdo má notebook jako výkonnou pracovní stanici, volí raději Windows NT 4.0 a každým dnem očekává finální verzi dlouho očekávaného Windows 2000. Proti Windows 98 sice je jádro NT 4.0 podstatně výkonnější a stabilnější, ale nepodporuje správně Plug-n-Play, USB, nejnovější DirectX a správu napájení – jeho provoz na notebooku tedy znamená velké kompromisy.

Ale teď už zpět ke grafickým čipům…

S3 Savage/IX/MV (1999) – poslední velký triumf S3

Výrobci jako 3Dfx, Matrox nebo NVIDIA (známí ze stolních počítačů) do mobilního segmentu nefušovali. Jelikož většina „staré gardy“ ze světa notebooků (Cirrus Logic, Chips&Technologies, Trident,…) ze hry v podstatě odstoupila, nebo byla technologicky značně pozadu, není divu, že nadvládu ATI ukončilo právě S3 (výrobce bojující s NeoMagicem o druhé místo na trhu).

V posledním kvartálu roku 1999 na trh přichází první notebooky vybavené grafickým čipem většinou označovaným jako S3 Savage/IX/MV (někdy také Savage/MX). Tento 3D akcelerátor vychází po necelém půlroce od své desktopové varianty (Savage 4), což je výrazně méně než u dřívějších čipů. Něco takového si S3 mohlo dovolit jen díky velmi úspornému návrhu původního čipu, a tedy minimu potřebných úprav pro optimální chod v notebooku. Z toho vyplývá, že po technologické stránce nebyl velký rozdíl mezi ním a herními grafickými kartami v běžných počítačích (plná podpora DirectX 6).

64bit jádro Savage v sobě nese pouze jedinou pixel pipeline s jedinou texturovací jednotkou, která však zvládá v jednom průchodu (single-pass) trilineární filtrování a dokonce i multitexturing*1* (dvě textury přes sebe) díky rekurzivnímu zpracování ve více cyklech. Tímto způsobem sice nejde dosáhnout stejné rychlosti jako při více samostatných texturovacích jednotkách (případně celé pipeline), ale stále je to výrazně rychlejší než zpracování jednoho pixelu s více texturami několika průchody (ve kterých se musí počítat znovu všechno včetně geometrie a blendingu). Navíc bez nutnosti přidávat mnoho tranzistorů v čipu.

Při bilineární filtraci vznikají na zemi ostré předěly mezi místy, kde se používá jiné zmenšení textury. Trilineární litr tento problém řeší a vytváří plynulý přechod mezi vzorky. Na obrázku vlevo je bilineární filtr a vpravo je trilineární; rozdíly jsou patrné zejména na tmavých čarách na rozhraní chodníku a silnice, které se u bilineárního skokově zhoršují se vzdáleností.

S3 tedy v noteboocích dosáhlo několika prvenství. Nabídlo jako první multitexturing, výkon na 32bit barevnou hloubku (true-color) pro lepší kvalitu zobrazení a schopnost šetřit grafickou paměť ukládáním komprimovaných textur.

Komprimace textur S3DT byla důležitým prvkem a vynálezem S3 (odkazy na ni najdete ještě v dnešních řešeních). Karta byla osazena ve všech dostupných variantách pouze 8 MB paměti, což je úplně stejně, jako měl (tou dobou stále prodávaný) ATI Rage Lt Pro. Pokud ovšem hra s kompresí počítala a aktivovala ji, rázem každá textura zabírala pouze čtvrtinu. Starým hrám stačilo 8 MB i bez komprese a v nových hrách, které byly na textury náročnější, byla karta na úrovni jiných řešení s až 32 MB (v reálu by to bylo méně, neboť část paměti zaberou oblasti, do kterých se vykresluje, a ty se nekomprimují).

Velikost paměti ovšem výkon neurčuje. Aby grafika mohla vykreslovat komplexnější scény s detailnějšími texturami, měla by mít odpovídající výkon, který zde byl naštěstí posunut o velký kus dál. Zatímco stolní verze měly takty od 110 do 143 MHz, z úsporných důvodů byl mobilní čip taktován na 100 MHz a na stejné frekvenci pracovala také připojená paměť (64bit). Stolní karty pak také měly od 16 do 32 MB paměti, což znamenalo v náročných hrách velkou výhodu, jakmile jste chtěli hrát ve vyšším rozlišení.

Nižší takty a malá paměť snížily výkon proti desktopovému vzoru o čtvrtinu až polovinu podle programu (hry) a zvoleného rozlišení. V době, kdy se Savage začíná používat v noteboocích, má takový průměrný stroj procesor Pentium III-M od 600 MHz (případně dobový Celeron a AMD) a naprosto běžně displej s rozlišením 1024×768. Podávaný výkon sice postačoval k plynulému hraní všech dobových her, ale u náročných jste se museli spokojit s nižším rozlišením (800×600, 640×480). Savage, ač nejvýkonnější řešení mezi notebooky, odpovídalo výkonem pomezí nižší a střední třídy stolních počítačů.

ATI se za dobu svého kralování podařilo obsadit velkou část trhu notebooků a zejména tam, kde šlo o výkon, bylo cokoli jiného vzácnou výjimkou. Aby S3 mohlo takové postavení narušit, muselo nabídnout výrazně vyšší 3D výkon, což se podařilo, neboť Savage je proti Rage LT Pro v průměru o 75% rychlejší. S každou novější hrou se pak rozdíl ještě prohluboval. Kdo chtěl na notebooku hrát hry, nebo potřeboval 3D výkon, ten by byl sám proti sobě, kdyby zvolil model s jakýmkoli jiným čipem – taková byla realita.

Mezi stolními počítači tou dobou zrovna kralují 3Dfx Voodoo3 a NVIDIA Riva TNT2. Obě měly 128bit paměti, pracovaly na vyšších taktech a uměly vykreslovat dvě textury současně (multitexturing) bez ztráty výkonu. Savage/IX/MV se s nimi jednoduše nemohla rovnat. Výkon byl nicméně poloviční proti levnějšímu desktopovému řešení Riva TNT2 M64 (s nižšími takty a 64bit pamětí), blízko Voodoo2, což stačilo i na právě přicházející, později kultovní hry Unreal Tournament a Quake III, na jejichž vykreslovacích enginech vyšlo v dalších letech ještě mnoho her.

Měl bych doplnit, že ani Savage nebyla bezproblémová. S3 mělo odjakživa problémy s kompatibilitou některých her. Ty sem tam běžely trhaně, ačkoli je měl zvládnout i pomalejší čip, jindy se zas něco špatně vykreslovalo (například při trilineární filtraci nefungovaly korektně všechny typy průhlednosti). Rozhodně však měla S3 v noteboocích dobře našlápnuto.

S3 Savage nabídla výrazně lepší kvalitu zobrazení proti předchozím mobilním grafikám. Zde si můžete prohlédnout obrázky z několika her ukázaných v minulém díle pro porovnání s minulou generací (je zde vidět zejména lepší filtrování textur, korektní mipmapping a přesnější práce s efekty poloprůhlednosti).

Konec původní S3?

Ač byla S3 na dobré cestě, udělali v jejím vedení několik velkých strategických chyb, z nichž jedna z osudných byla odkoupení společnosti Diamond Multimedia (výrobce hi-end karet zejména s čipy 3Dfx a NVIDIA). Problémy společnosti později vyřešilo pohlcení velkým výrobcem čipových sad – společností VIA. VIA měla zálusk především na některé patenty potřebné pro výrobu procesorů s architekturou x86 (které S3 kupodivu vlastnila).

Samotná grafická divize byla spíše snadným způsobem, jak získat funkční jádro pro implementaci do svých připravovaných čipových sad. Nad dedikovanými čipy S3 bojujícími o přední příčky v noteboocích se však slehla zem a byla to velká škoda. Proč? Protože právě S3 vždy excelovala v získávání maximálního výkonu z relativně jednoduchého a energeticky nenáročného čipu.

Poslední dedikovaný čip původní éry pro notebooky byl S3 SuperSavage/IX, který byl pozdní odpovědí na ATI Rage Mobility 128. Mohl mít 128bit paměti a nabídl výkon podobný svému konkurentovi, nicméně velkou díru do světa neudělal.

O pár let později byl odkup S3 osudný i pro Trident, neboť jeho návrh integrovaného jádra ve velkém odkupovala právě VIA do svých čipových sad. Jakmile se jádra S3 upravila pro stejný účel, nebyl důvod nadále cokoli od Tridentu odebírat (zlomilo se to u posledních čipových sad pro Pentium III a ekvivalentní AMD).

ATI Rage Mobility 128/M4 (2000)

V ATI si samozřejmě nenechali líbit, že se je někdo snaží sesadit z prvních příček. Odpověď přišla začátkem roku 2000, kdy byl světu představen ATI Rage Mobility 128.

Plně 128bit čip za $55 v sobě nese dvě pixel pipeline (každá s jednou texturovací jednotkou) umožňující v jednom průchodu vykreslit pixel polygonu s aplikovaným osvětlením a dvěma texturami, případně dva pixely polygonu s jednou texturou. Ze světa stolních počítačů posloužilo jádro Rage128 Pro, které přineslo znatelně vyšší výkon, podporu sběrnice AGP 4x, propracovanější akceleraci videa a řadu 3D technologií (lepší komprese textur, rychlý 32bit rendering, anizotropní filtrování). Parametrově je to pokrok proti Savage/IX/MV.

Na obrázku vlevo je trilineární filtr a vpravo anizotropní. Princip obou je podobný, ale zatímco trilineární vybere texturu dvakrát menší v obou rozměrech, jakmile by byl vykreslený texel menší než pixel na obrazovce, u anizotropního je možné volit i textury, které jsou zmenšené pouze v jednom rozměru. Takové řešení potřebuje více video-paměti, ale zejména na zemi a zdích táhnoucích se do dálky se neztrácejí tak rychle detaily.

Jádro bylo taktováno na 105 MHz a stejně rychle tikala i připojená paměť. Budete-li hledat informace o čipem Rage Mobility, pravděpodobně zjistíte, že existují pod různými modelovými názvy, přestože na všech fungují stejné ovladače a všechny mají stejné grafické jádro. Důvodem je několik způsobů provedení – čip může spoléhat výhradně na připojenou paměť, která se montuje na základní desku okolo něj (64/128bit, varianta P), může mít paměťové čipy umístěné přímo na sobě (fyzicky jako malé čipy na pouzdře velkého čipu), nebo může používat kombinované zapojení. Poslední možnost má v sobě integrovaných 8 MB (64bit) a druhých 8 MB se může (a nemusí) připojit pro dosažení 128bit sběrnice. Některá z provedení měla čip elektricky kompatibilní s předchozí generací Rage Mobility (odvozených od Rage LT Pro), což usnadnilo jejich implementaci do stávajících notebooků. Tímto způsobem si ATI i v dalších letech zajišťovala, aby bylo možné nové produkty dostat do notebooků co nejrychleji.

Apple PowerBook G3 (Pismo) patří k pracovním notebookům, které volily základní variantu s integrovanými 8 MB paměti přímo do čipu.

Základní model byl vybaven 16 MB RAM, ale během roku přišly i 32MB a 8MB (pro lowend) varianty kvůli lepšímu pokrytí potřeb trhu. Z důvodu omezení spotřeby a prostorových nároků byla většina verzí pouze s 64bit paměťovou sběrnicí, což byla hlavní příčina nižšího výkonu proti plnohodnotné desktopové variantě.

Základní varianta na dobových sestavách nezaostávala za desktopovou předlohou v 64bit verzi o více než 10 %, čímž v mnoha testech nabídla výkon lehce pod úrovní NVIDIA Riva TNT. Výkon byl vyšší než u Savage/IX/MV (obvykle 20-40 %) a to hlavně u her jako Quake III (je to díky dvěma pipeline, neboť Quake III jako zástupce moderních her vykresloval většinu polygonů s dvěma texturami). Plný potenciál čipu zde bohužel brzdila paměťová sběrnice.

Jiná byla situace u nejvybavenějších typů se 128bit pamětí určených pro velké výkonné notebooky, kde až díky větší propustnosti paměti vynikla výhoda dvou pixel pipeline. Výkon zde byl o dalších 50 % vyšší a v případě vyšších rozlišení nebo barevné hloubky se rozdíl prohluboval. Ve srovnání s desktopy, kde možnosti 3D grafiky posunuly dál hi-end čipy NVIDIA GeForce 256 a ATI Radeon DDR, notebooky nemohly konkurovat víc než jen střední třídě 3D akcelerátorů. Dá se ovšem říct, že na notebooku už bylo možné hrát, a pokud jste nebyli nároční v otázkách rozlišení, tak i celkem obstojně. Výkon byl jen o 15 % nižší proti plnohodnotné stolní variantě (dáno nižšími takty) a odpovídal NVIDIA Riva TNT2 M64 (nižší v 16bit barevné hloubce a vyšší v 32bit), která stačila na všechny moderní tituly v rozlišení 800×600 nebo 1024×768 (64bit varianta se hodila spíše pro rozlišení 640×480).

Pokroky ve 3D jsou nezpochybnitelné a ATI se opět stalo výkonnostním lídrem. To zajímavé se však skrývá v dalších funkcích. Stejně jako v Rage LT Pro je i zde možnost obsloužit dva nezávislé výstupy. Tentokrát jde dvakrát o rozlišení UXGA (1600×1200). ATI implementovala do jádra LVDS i TMDS transmitéry tikající na frekvenci okolo 160 MHz, čímž umožnila digitální připojení velkých LCD, jak interních, tak i externích pomocí DVI. Rázem se tak otevírají úplně nové možnosti v segmentu pracovních stanic, kde se pracuje s CAD, CAM nebo GIS aplikacemi.

ATI do nižších segmentů (nebo úsporných notebooků) používá zlevněné čipy Mobility M1/M2 s nižší spotřebou, založené na starších a pomalejších jádrech. Nejnovější počin jde do výkonných notebooků, které mají procesory Intel Mobile Pentium III 700-850 MHz, 128-192 MB RAM, až 30GB pevné disky a 15“ TFT displeje, většinou s rozlišením 1400×1050 nebo 1600×1200. Takové notebooky na desce integrují všechny potřebné komponenty jako zvuková a síťová karta, používají touchpady a jejich hmotnost okolo 3,3 kg se neliší od nedávných standardů pracovních stanic.

Během roku 2000 se ATI povedlo velmi slušně vystrčit ze hry většinu ostatních výrobců. V mobilních grafických čipech má tou dobou přes 50 % trhu a druhým hráčem je skomírající S3 s pouhými 10 %. Nic ovšem nemusí trvat věčně

NVIDIA GeForce2 Go (2001) – bitva začíná

V roce 2001 už se za velkou louží začíná nahlas povídat o poklesech prodejů stolních počítačů na úkor notebooků a ty se dostávají stále více do středu dění. O tom, že NVIDIA něco chystá, se mluvilo už dlouho, ale stejně to byl pro mnohé šok, když začátkem roku 2001 předvedla veřejnosti svůj první mobilní čip pro výkonné notebooky se sběrnicí AGP 4x. Odvozený od jádra GeForce2 MX dostal příhodný název GeForce2 Go (ten při vyslovení zněl jako GeForce To Go, což by šlo přeložit jako „GeForce na cesty“).

První z mobilních čipů NVIDIE označovaných Go (zdroj: digitalstormonline.com)

GeForce2 MX v roce 2001 trůní v mnoha počítačích jako skvělá volba z pohledu poměru výkonu a ceny a běží na ní všechny hry. Vzhledem k tomu, že toto jádro bylo původně navrhováno jako mobilní (přestože šlo nakonec do desktopů), nebylo mobilní variantu nutné příliš přizpůsobovat. V základu dostala všechno potřebné včetně dvou na sobě nezávislých výstupů pro režim rozšířené plochy a integrovaných podpůrných obvodů. Pokud jde o 3D, jádro splňuje všechny požadavky rozhraní DirectX 7 a jedním z nových vizuálních vylepšení je možnost počítání osvětlení „per pixel“ pomocí DOT3 bump-mappingu (to se však ve hrách objeví až v době, kdy výkon tohoto čipu nebude stačit). Jde také o první mobilní čip podporující akceleraci transformace a osvětlení*2* (Transform&Lighting = TnL) – tedy činností, které do té doby musel dělat procesor. S ohledem na složitost scén dobových her, výkon této jednotky a výkon procesorů, se kterými je čip párován, je přínos diskutabilní, ale nějak se začít musí.

256bit jádro je taktované na 143 MHz (místo 175 MHz u GeForce2 MX), má v sobě dvě pixel pipeline a k tomu všemu ještě na každé z nich dvě texturovací jednotky (= lze vykreslit dva multitexturované pixely najednou). Paměť o velikosti 16-32 MB je sice připojena pouze 64bit sběrnicí, ale v tomto případě to nepředstavuje takový limit díky vyšší frekvenci (166 MHz). Paměť je stále typu SDR, což dává tušit, že GeForce2 Go nemůže být výkonnější než low-end varianty GeForce2 MX200.

 

Přesto na trh přichází nejvýkonnější mobilní čip. NVIDIA hlásí, že lidé na noteboocích nehrají jen proto, že jim k tomu zatím nikdo nedal příležitost, ale GeForce2 Go to má všechno změnit. Cílový segment je tak jasný hned od začátku – nejvýkonnější herní/multimediální notebooky a pracovní stanice. Do menších a levnějších notebooků se tento čip nehodí. Jednak kvůli vyšší ceně a jednak kvůli spotřebě. NVIDIA u svého prvního čipu ještě neuměla ošetřit všechny prvky správy napájení, a tak například vypínání jeho nepotřebných částí je zde, na rozdíl od veškeré konkurence, utopií.

Průměrný hi-end notebook s tímto čipem ($3000) má v době vydání procesor Pentium III-M (až 1 GHz), až 256 MB RAM a s hi-res displejem (1600×1200) nevydrží na baterky déle než dvě a půl hodiny. Střední proud se zatím drží procesorů okolo 700 MHz, 64-128 MB RAM, 10GB disků a displejů s rozlišením 1024×768 (v lepším případě 1400×1050). Zatímco do hi-endu se pomalu předinstalovávají nová Windows XP, v nižších segmentech se ještě nějakou dobu setrvá u Windows Me (jenž bez většího povyku nahradil Windows 98 SE). Má totiž nižší hardwarové nároky a notebooky s ním vydrží déle na jedno nabití baterie (protože se neděje pořád něco na pozadí).

NVIDIA samozřejmě chápe, že nejvyšší třída notebooků velké peníze nepřinese a že pokud má v mobilním segmentu začít vydělávat, musí zaútočit v levnějších modelech. Postupně proto vznikají i nižší verze GeForce2Go 200 a 100. Liší se menším množstvím paměti, nižšími takty a v případě modelu 100 také použitím pouze 32bit paměťové sběrnice (jediný 8MB DDR modul). Právě model 100 je k vidění zejména u nejprodávanější cenové kategorie okolo $1500 v multimediálních noteboocích větších výrobců (Toshiba, DELL) a v dražších čistě business modelech – dokonce ještě v době, kdy už má čip svého nástupce. Poloviční výkon nejnižšího modelu přibližně odpovídá velmi rozšířenému ATI Mobility Rage 128, což už není žádný trhač asfaltu. Na druhou stranu je tento výkon dosažen při zachování všech technologických vymožeností moderního čipu.

ATI Mobility Radeon M6 (2001) – ATI vrací úder

V desktopovém segmentu se ATI s Radeonem a NVIDIA s GeForce dostaly do pozice nejsilnějších výrobců grafických čipů. V noteboocích měla ATI vždy dobré postavení, jenže příchod dalšího silného hráče může něco takového snadno ohrozit. Kanadský výrobce tak několik měsíců po první mobilní GeForce odpovídá novým čipem ATI Mobility Radeon M6. Je to 256bit čip s 64bit DDR*3* paměťmi (později vznikl low-end s 32bit DDR) a podporou DirectX 7, tentokrát však s jednou pixel pipeline a na ní třemi texturovacími jednotkami (lze vykreslit maximálně jeden pixel polygonu za průchod, nicméně může mít kombinaci až tří textur).

Mobilní Radeon vychází z úsporného jádra RV100, které se od „plnotučného“ Radeonu (R100) liší odebráním druhé pixel pipeline a chybějící podporou akcelerace transformace a osvětlení (TnL). Z předchozích mobilních karet zůstává plná podpora LCD s vysokým rozlišením, dva nezávislé výstupy a vyhlazení nižších rozlišení zobrazovaných na LCD. Velmi dobrou podporu akcelerace videa z Mobility Rage 128 (resp. Rage128Pro) rozšiřuje Radeon o lepší filtry a kvalitnější vykreslování videa s prokládanými snímky (typicky DVD).

Technologická stránka pro 3D je v některých ohledech horší než u GeForce2Go (která má register combiner*4* – omezený předchůdce pixel shaderu), ale v některých fixních funkcích (zejména různé typy bump-mappingů*5*) produkt NVIDIE překonává. Dalo by se říct, že v hrubém výkonu je GeForce zajímavější, ale Radeon je celkově technologicky vychytanější a výkon nahání všemožnými optimalizacemi. Zásadní změny se týkají práce se Z-bufferem (komprimace, optimalizované operace) a schopnosti „zahazovat“ při zpracování části scény, které beztak nebudou ve výsledném obraze vidět (například objekty schované za jinými objekty).

Ve výsledku tak jednodušší, menší a levnější čip nabízí mnohdy srovnatelný výkon (zejména v 32bit barevné hloubce) se ztrátou do 10% při znatelně nižší spotřebě. Největší rozdíl spotřeby je patrný při práci ve 2D (Windows, Office, web), kde ATI mohla zúročit své četné zkušenosti s mobilními čipy v propracované správě napájení.

Vylepšení vody pomocí Emboss Bump Mappingu ilustruje spodní z obrázků (hra Expendable). Horní obrázek má vodu řešenou pouze jako polygon s texturou, případně navíc průhledností. U dolního obrázku je využita technika, kdy se k základní textuře přidá druhá textura, která slouží k výpočtu vektoru odrazu světla (na základě normálové mapy určující „náklon“ každého texelu). Grafický čip použije vektor dopadu světla, s vektorem odrazu a pozicí kamery pro výpočet efektu odlesků ve vodě (zdroj: anandtech.com).

Většina hi-end sestav zůstává u produktu NVIDIE (kvůli lepším ovladačům a obecně vnímání značky GeForce zákazníky), nicméně pro běžné nasazení ve standardních, případně tenkých noteboocích s vyšší výdrží na baterie je Radeon nesrovnatelně lepší volba, a tak není divu, že okupuje zejména všemožné business modely.

Pro srovnání, ekvivalentní 15“ výkonné notebooky s Pentium III-M 1,2 GHz a displejem s vysokým rozlišením mají v průměru výdrž s GeForce okolo dvou a půl hodiny, zatímco Radeon umožní se srovnatelným hardware o hodinu práce více.

Ve střední třídě si ATI zachovává jasné vedení zejména s cenově dostupnou 16MB verzí. Nízká spotřeba umožňuje osazení i do malých notebooků s dlouhou výdrží, kde lze použít úspornou variantu s nízkými takty a 8 MB RAM. Ač to zní neuvěřitelně, stále se vyrábí i první ATI Rage Mobility M1 s 4 MB RAM a objevuje se v těch nejmenších nebo nejlevnějších strojích (ještě aby ne, jeho cena šla postupně dolů a stále bylo možné jej dát do notebooku navrženého pro Radeon bez změny návrhu základní desky).

ATI Mobility Radeon M6 byl po nástupu další generace v nové revizi přejmenován na ATI Mobility Radeon 7000.

ATI Mobility Radeon 7500 a NVIDIA GeForce4 Go (2002) – za lepším výkonem se 128bit sběrnicí

V roce 2002 už nikdo nepochyboval, že v dedikovaných grafikách pro notebooky jsou dva silní hráči a že žádný z nich se snadno nevzdá svého podílu na trhu. Silná konkurence byla zárukou snahy přiblížit herní výkon notebooků klasických stolním počítačům. Očekávání se postupně naplňovala – začala ta pravá bitva.

Pro lepší uvedení do tehdejší situace je dobré zmínit nějaké výkonové srovnání. Původní mobilní Radeon M6 ve hře Quake III (demo001) zvládl přibližně 70 fps v 800×600 (16bit). GeForce 2Go byla o něco rychlejší a při stejném testu zvládla 80 fps. Pro představu, její výkon byl okolo 1900 bodů v testu 3D Mark 2001.

Výkonné grafické karty stolních počítačů měly výkon násobně vyšší a začínaly experimentovat s programovatelnými jednotkami (shadery). Většina her však nové technologické možnosti nepoužívala, nebo alespoň nevyžadovala, takže další krok v mobilním segmentu logicky směřoval k vyššímu výkonu bez přidávání nových zásadních funkcí.

Výsledkem je nástup inovovaného čipu ATI Mobility Radeon 7500 a krátce po něm také NVIDIA GeForce 4Go. Tyto čipy již byly postaveny přímo proti sobě. V obou případech byly pilířem DDR paměti, výrazné navýšení taktů a konečně také větší rozšíření 128bit paměťové sběrnice. Právě absence 128bit paměťové sběrnice byla dlouho brzdou notebooků v dohánění výkonu stolních počítačů, jenže nebylo to bezdůvodné. Na 128bit zapojení potřebujete dvojnásobek (stejných) paměťových čipů a to zabírá drahocenné místo na základní desce (proto se 64bit sběrnice používá v low-endu běžně ještě dnes). Teď, když bylo jasné, že určitá nezanedbatelná skupina lidí chce maximální 3D výkon v notebooku, nebyl důvod jim nevyhovět.

V případě Radeonu 7500 byla hlavní změna v novém výrobním procesu, vrácení druhé pixel pipeline a optimalizacích čipu pro dosažení vyšších taktů. V kombinaci se 128bit sběrnicí to stačilo k navýšení výkonu a zbylé funkce měl už předchozí Radeon M6 nadstandardní, takže bylo jisté, že čip za konkurencí nemůže příliš zaostávat.

Modul s grafickou kartou NVIDIA GeForce4 Go440 do notebooku DELL Inspiron 8200 (zdroj: anadtech.com).

U NVIDIE se museli zasnažit trochu více GeForce 4 Go má taktéž nový výrobní proces, optimalizace pro vyšší takty a možnost připojit 128bit paměti. Navíc došlo ve 3D k optimalizaci na T&L jednotce (původní byla pomalá) a přidání funkcí urychlujících práci s částečnou průhledností. Výrazné změny byly potřeba i mimo 3D. Šlo zejména o snížení spotřeby. Do čipu se proto poprvé implementovala technologie NVIDIA PowerMizer, která se starala o snižování energetické náročnosti a změnu taktů v závislosti na připojeném napájení. Situace se proti předchozímu modelu výrazně zlepšila, ale nutno dodat, že Radeon 7500 byl na tom stále lépe a zejména v tenčích a business noteboocích byl díky tomu oblíbenější.

Výkon obou řešení stoupl přibližně na dvojnásobek v jejich lepších variantách. V testu 3D Mark 2001 byl výkon 4000-4500 bodů (v nejvýkonnějších noteboocích se stolními procesory až 5000 bodů). Oba grafické čipy byly ve vyšší třídě nabízeny s 32-64 MB vlastní paměti.

U obou čipů postupně vznikly levnější varianty, které se uplatnily hlavně v běžných business noteboocích a nižší/střední třídě spotřebního segmentu. V rámci úspor nákladů byla jako první vždy omezena paměťová sběrnice zpět na 64bit (osadila se polovina paměťových čipů), čímž se snížila paměť na 16 MB. Snížily se také takty jak čipu, tak paměti a ve výsledku výkon poklesl o 30-50% (2500-3500 bodů v testu 3D Mark 2001).

Nejvýkonnější verze výkonem nezaostávaly tak moc za hi-endem stolních počítačů. Pokud jste měly slabší verzi s 64bit pamětí, pořád to stačilo k pohodlnému hraní všech aktuálních her. Až v roce 2004 se začaly objevovat hry jako Doom 3, kde Radeonu došel dech úplně a GeForce 4Go se držela jen díky tomu, že měla jakýsi osekaný pixel shader nazvaný NVIDIA Register Combiner, ve kterém Carmack dokázal naprogramovat speciální způsob (per-pixel) osvětlení herních scén a modelů. Pak vyšel také Far Cry, který už ani jeden z čipů nezvládl hrubým výkonem.

To se ovšem bavíme o těch nejnáročnějších hrách. Nějaký ten Half-Life 2, GTA: Vice City, Counter-Strike: Source a hromady dalších AAA titulů fungovaly skvěle i v rozlišení 1024×768. Měl jsem kdysi notebook s GeForce 4Go 420 (16 MB) a dlouho jsem se nemusel při hraní příliš omezovat ani v rozlišení, ani v úrovni detailů. Až okolo roku 2005 jsem cítil, že už by to na občasné hraní chtělo něco lepšího.

NVIDIA Quadro a ATI FireGL – zaměřeno na CAD

Ve chvíli, kdy 3D akcelerátory v noteboocích dospěly, nastal čas vyhovět nárokům profesionálních CAD/CAM aplikací, kam herní varianty čipů jednoduše nepatří. Jako první se začátkem roku 2002 objevilo NVIDIA Quadro2Go dle očekávání odvozené od GeForce2Go. Šlo o stejný čip, pouze doplněný větším množstvím rychlejší paměti a firmwarem, který odblokoval funkce pro akceleraci vykreslování čar a různých objektů.

Následovalo o půl roku později ATI FireGL 7800, které již bylo odvozené od Radeonu 7500, opět s mírně vyšším výkonem a odemčenými funkcemi pro CAD. Od té doby oba výrobci pravidelně vydávají profesionální varianty od každé generace svých grafických čipů v noteboocích.

Možná si říkáte, proč NVIDIA a ATI prodávali ten samý čip pro profesionální nasazení dražší, když výrobní náklady byly stejné. Šlo o to, že herních čipů se prodá mnohem více a je s nimi méně práce v případě ovladačů a softwarové podpory. Profesionální produkty měly certifikované ovladače pro řadu aplikací, různé optimalizace a garantovaný životní cyklus. Předtím se dělaly profesionální produkty úplně odděleně, ale v NVIDII i ATI si spočítali, že výroba jednoho čipu pro obě nasazení s následným zablokováním funkcí bude ekonomicky nejefektivnější.

Někteří uživatelé se samozřejmě snažili odemknout profesionální funkce i u herních čipů a někdy se jim to dařilo za pomoci modifikovaných ovladačů nebo firmware karty. Výrobci se samozřejmě s každou novou verzí ovladačů a generací produktů neoficiálním modifikacím intenzivněji bránili.

IBM ThinkPad A31p je skvělým příkladem notebooku s profesionální grafikou z roku 2002. Kombinuje Pentium-4M, ATI FirePro 7800 a 15“ IPS displej s rozlišením 1600×1200 (zdroj: tomsguide.com).

Závěr

Začátek nového milénia byl pro 3D akceleraci v noteboocích zásadní. V řešeních zaměřených na výkon došlo k pročištění trhu. Zůstali dva tahouni (ATI a NVIDIA) a zbytek trh buďto zcela opustil, nebo se začal věnovat produktům orientovaným na cenu, případně se speciálními funkcemi.

Notebooky se staly plnohodnotnými alternativami ke stolním počítačům, a kdo měl dostatek peněz, mohl si bez problému zahrát nejnovější hry v pěkné grafice i na cestách. Důležité je, že výkonné grafické čipy se (alespoň ve slabších variantách) dostaly také do střední a nižší třídy notebooků, takže k mobilnímu hraní nebylo potřeba tolik peněz. Kolem roku 2003 vám stačilo 40 tisíc korun a mohli jste mít notebook s Radeonem 7500, případně GeForce 4Go (to je jen o deset tisíc více, než začínaly nejlevnější stroje).

Bod, ve kterém tento díl končí, stojí za pozornost, neboť nastolil něco, co trvá dodnes. Tedy pravidelný cyklus obměny grafických čipů a dělení každé generace do kategorií od low-endu po výkonná herní/CAD řešení s tím, že nižší verze se dělají ořezáváním paměťové sběrnice, nižšími takty, případně slabším nebo starším 3D jádrem. Končí tím klasický divoký západ doprovázející počátky každé zásadní technologie.

Co bude příště?

V tomto díle jsem záměrně opomněl integrovaná grafická jádra. V příštím díle se mimo jiné vrátím kousek zpět, abych ukázal příchod první generace integrovaných grafik v noteboocích a jejich následný bouřlivý vývoj. Půjde tedy hlavně o společnosti S3/VIA, SiS, Trident a Intel.

Ještě se zbývá podívat na další vývoj klasických dedikovaných čipů. Zejména na to, jak přišly první shadery. Zbytek již proberu pouze ve stručnosti.

 

*1*) Dříve bylo možné dvě textury zkombinovat jedině překrytím jednoho polygonu druhým, který měl nastavený nějaký typ průhlednosti. Zde je možné prolnout podle nějakého z vybraných vzorců dvě textury, aniž by se musela počítat geometrie pro více polygonů (šetří se tím výkon). U multitexturingu je situace podobná jako u částečných průhledností. Můžete k barvě každého pixelu jedné textury přičíst barvu druhé, nebo také odečíst a zprůměrovat váženým průměrem. Grafické karty s více texturovacími jednotkami mohly vykreslovat polygony s dvěma texturami stejně rychle jako s jednou, což bylo zásadní pro hry s lepším vykreslováním osvětlení scény (jedna textura představovala materiál a druhá vypočtená světla a stíny – tzv. lightmapa).

*2*) TnL jednotka akceleruje proces transformace a osvětlení scény. Snaží se ulehčit procesoru vlastní schopnosti transformace 3D souřadnic scény do její 2D projekce na obrazovce a následného vypočítání osvětlení jednotlivých vertexů. Takové urychlení bylo v době příchodu čipu GeForce diskutabilní, neboť rychlejší procesor zvládl to samé rychleji a ještě zbyl čas na herní logiku, nicméně o pár let později s hrami jako Half-Life 2, které pracovali s detailní geometrií scén a modelů, a rychlejšími grafickými čipy se ukázala důležitost TnL v plné síle.

*3*) DDR (dual data rate) paměti dokážou v jednom taktu přenést teoreticky až dvojnásobné množství dat proti původním SDR. Mohou za to vylepšení algoritmy časování a schopnost přenášet data při vzestupné i sestupné hraně hodinového signálu. Kvůli lepšímu znázornění nárůstu výkonu se u nich začal používat pojem efektivní takt. DDR paměť pracující s reálným taktem 100 MHz se pak často označovala efektivním jako 200MHz.

*4*) Register Combiner jakožto předchůdce Pixel Shaderu umožňuje provádět operace nad rámec multitexturingu. Umožňuje provést až osm kroků s každým pixelem polygonu, kdy část kroků používá jako vstupní hodnoty textury a zbylé mají jako vstupní hodnoty skalární konstanty uložené v registrech čipu. Reálného nasazení se Register Combinery dočkaly snad jen v případě hry Doom 3, kde umožnily vykreslení per-pixel osvětlení s více světly na jednom polygonu bez použití plnohodnotného Pixel Shaderu. Fakt, že první generace Radeonů nic takového neměly, znamenal, že Doom 3 na nich nebyl hratelný.

*5*) Různé metody Bump Mappingu slouží k vytvoření detailů povrchu polygonů ve scéně. Pomocí simulace různých nerovností vytváří pocit, že je scéna detailnější, než ve skutečnosti je.

Komentáře k článku

  1. 1. Clous  19.2.2019  23:52:25

    Tady jsem studoval tu S3 Savage/IX+MV (86c294) a můj notebook: http://www.clous.cz/hewlett-packard-omnibook-xe3/ má jen 4MB, nevím teda kde jsou, ale ty tady píšeš že vždy min. 8MB.

    Taky si myslím, že jádro ATI Rage Mobility M3, které vyšlo na konci roku 1999 a jasně S3 Savage překonává.

    Jinak samozřejmě parádní článek, je zajímavé to číst takto v souvislostech. Navíc většinu těch grafik co popisuješ, v noteboocích mám a tak se sem tam ozvu :-D

  2. 2. swarm  20.2.2019  8:38:18

    [1] Ono je docela ironické, že tou větou jsem chtěl (nešikovně) sdělit, že to bylo maximálně 8MB a nikdy ne víc (na rozdíl od desktopových verzí). Ona ta 4MB verze v době vydání možná vůbec neexistovala a vznikla až v době, kdy už šlo o low-end a chtěli ještě ušetřit peníze. Proto jsem ji neviděl v žádných prohlášeních, ani noteboocích, které tento čip používaly, když byl úplně nový.

    Ale máš pravdu, low-end 4MB verze skutečně existuje. Že jsi tam tu paměť nikde na desce nenašel, je v pořádku. Měla by být integrovaná přímo v čipu (podobně jako u některých ATI Mobility). Přímé sdílení paměti z RAM (jinak než pomocí AGP) neumí.

    Mobility M3 by měla být dostupná až spolu s M4 a ostatními verzemi během roku 2000, takže S3 skutečně chvíli kralovala. M3 je identické jádro, jen s jinou konfigurací paměti – M4 měla 128bit 16+MB, M3 jen 8MB 64bit.

    Zajímavé je, že M3 v mnoha situacích není o tolik rychlejší než S3, přestože má k tomu všechny předpoklady. Nedávno jsem oba čipy proti sobě přeměřil ve svém benchmarku ( http://swarm.cz/gpubench/_GPUbench-results.htm ) a potvrdilo se mi to. ATI má o 5MHz větší takt jádra/pamětí (100 vs 105) a dokonce umí kreslit dva pixely za takt místo jednoho. Jenže paměť už je příliš limitující faktor. Jakmile se kreslí poloprůhledné polygony v 32bit barvách, už už jsou oba čipy stejně rychlé (při poloprůhlednosti se totiž nejdřív musí sáhnout do paměti, vytáhnout barvu původního pixelu, přes který kreslím, spočítat nový, prolnout a zapsat zpět – v tu chvíli jsou nároky na paměť dvojnásobné). Stejně tak je problém s detailními texturami a lightmapami, pokud není použit multitexturing. V nejhorších případech je pak M3 rychlejší klidně jen o 5% a za všechno může nepřiměřeně pomalá paměť. Pak jsou samozřejmě situace, kdy je možné dosáhnout klidně na dvojnásobek výkonu (hodně hrubé textury, žádná poloprůhlednost).

    Nicméně M3 už byla myšlena skutečně jen jako levnější varianta čipu a na to byla skvělá. Hodně se objevila ve všestranných business 14″ noteboocích (DELL, Apple…).

  3. 3. swarm  20.2.2019  8:45:07

    Btw ten tvůj OmniBook XE3 vypadá hodně osekaně. 13,3″ TFT LCD s 800×600 byla ta nejnižší verze a v rámu pro 15″ displeje vypadá komicky. Mám ten samý, ale v konfiguraci s 15″ 1024×768 TFT, 850MHz Celeronem a 8MB verzí té S3.

    Koukám, že do toho uměli narvat kde co: http://h10032.www1.hp.com/ctg/Manual/lpi05588.pdf


Napsat komentář