
Co PlayStation 4 będzie mieć wspólnego z najnowszym iPadem albo Wii U? Rzut oka na napędzające te urządzenia układy scalone powinien trochę wyjaśnić…
Gdy Sony potwierdziło specyfikację techniczną PS4, pierwsze co mi przyszło do głowy to dysproporcja między procesorem a układem graficznym. Architektura Jaguar kojarzyła mi się z niewielkimi rdzeniami, a układ graficzny o podanej przez Sony mocy obliczeniowej wyglądał na pierwszy rzut oka na bardzo duży.
GPU w PlayStation 4 będzie zawierać 18 jednostek SIMD podobnych do tych z architektury GCN. Radeon HD 7870 ma 20 takich jednostek i zajmuje 212 mm² w procesie technologicznym 28 nm. Bezpiecznie będzie założyć, że 18 nowej generacji SIMD-ów wraz z resztą obwodów składających się na GPU będzie zajmowało od 150 do 200 mm².
A jaką powierzchnię będzie w tej samej technice produkcji zajmował procesor z PS4? Podstawową jednostką do budowania czipów z rdzeniami Jaguar jest CU (compute unit), czyli cztery rdzenie i wspólna pamięć podręczna L2. Dokumenty techniczne z ISSCC podają rozmiar jednego rdzenia: 3,1 mm². Szybkie porównanie do schematu całej jednostki CU pozwala oszacować jej rozmiar na około 26,5 mm². Osiem rdzeni wraz z obszarami pamięci podręcznej L2 będzie zajmowało około 53 mm² – od trzech do czterech razy mniej od szacowanego rozmiaru GPU! Ale przyzwyczaiłem się do analizowania procesorów (czy też APU) do komputerów biurkowych, może taka dysproporcja nie jest niczym dziwnym w innych zastosowaniach? W internecie można znaleźć wszystko, więc nie miałem problemu z porównaniem tych informacji do innych nowoczesnych czipów:
zdjęcia rdzeni za Chipworks, UBM TechInsights, SemiAccurate, AMD, Nvidia
Przyjrzyjmy się im po kolei. W Wii U, maszynie służącej wyłącznie do grania, GPU i CPU są na oddzielnych krzemowych jądrach, w dodatku produkowanych w dwóch różnych fabrykach i w nienajnowszych procesach technologicznych. W jądrze Latte oprócz GPU jest wbudowana pamięć eDRAM (służąca i procesorowi, i układowi graficznemu), którą pomijam w obliczeniach – ale i tak GPU mimo większego upakowania tranzystorów jest znacznie większe od CPU. Apple A6 i A6x to układy tej samej generacji, w obu jest ten sam procesor, ale ten drugi ma znacznie wydajniejszy (i większy) procesor graficzny. W iPhone 5 GPU zajmuje na oko tyle samo miejsca, co CPU, ale w iPadzie jest już wyraźnie największym elementem całego SoC. Tegra 4 jest przedstawiona w przybliżonej skali, bo dokładne wymiary jądra nie są znane. Pięć rdzeni ARM (z których wykorzystywane są cztery lub jeden, nigdy pięć) jest wyraźnie mniejsze od rozbudowanego GPU, które zajmuje większą część SoCa. Kolejnych dwóch czipów na ogół nie zestawia się z poprzednimi, bo mają zupełnie inne zastosowania, ale zasadniczo są to tak samo kawałki krzemu zawierające CPU, GPU i dodatkowe funkcje. Jądra Richland z najnowszych APU AMD i Ivy Bridge (na ilustracji najbardziej rozbudowana wersja laptopowa: 4 rdzenie + HD Graphics 4000) na oko zawierają podobne proporcje CPU i GPU. A gdyby policzyć te proporcje?
Tak, możecie się już śmiać… Doszedłem to tego, co i tak było wiadomo: PlayStation 4, Wii U, Tegra 4 i Apple A6x to maszyny do grania. Jedynym niewielkim zaskoczeniem na tej liście jest iPad 4. generacji. O ile Wii U jest konsolą do gier, a najważniejszą zaletą Tegry ma być wydajność w grach i związek z ekosystemem Nvidii (Tegra Zone), to iPad raczej nie jest reklamowany jako konsola (choć chyba głównie do tego bywa wykorzystywany). Wyraźnie widać, że niektóre urządzenia są wielozadaniowe, a GPU jest tylko częścią całego układu; a w niektórych to układ graficzny dominuje, a procesor jest raczej z konieczności.
Oczywiście moje szacunki oparte na zdjęciach krzemu nie są zbyt precyzyjne, ale mogą być pożyteczne, dopóki nie próbuje się z nich wyciągać zbyt daleko idących wniosków. Następnym razem spróbuję znaleźć jakieś bardziej sensacyjne zależności :)
P.S. Podczas poszukiwania informacji w sieci natrafiłem na mniej i bardziej wiarygodne informacje. Wśród tych pierwszych znalazł się pewien polski portal technologiczny, którego newsman wypatrzył gdzieś prezentację AMD na temat architektury Jaguar i podał:
Każdy rdzeń może pochwalić się mocą obliczeniową na poziomie 194490 FLOPS, podczas gdy Bobcat osiągał tylko 159900 FLOPS – różnica wynosi zatem około 20%.
Około 195 KFLOPS to mniej niż połowa teoretycznej wydajności Intela 80387 sprzed 25 lat – choć w co drugiej prezentacji technologicznej pojawiają się teraflopy (tak, wiem, że „flops” to nie jest liczba mnoga!), autor najwyraźniej nie zauważył, że coś jest nie tak. Liczby wzięto z tego slajdu ze wspomnianej prezentacji:
Pozycja Core Flop Count w tej tabelce nie oznacza operacji zmiennoprzecinkowych na sekundę, ale przybliżoną liczbę przerzutników w rdzeniu x86 (prawdopodobnie nie liczono pamięci podręcznej). Pamiętajcie – nie wierzcie we wszystko, co przeczytacie w sieci :)
Jedno zero za dużo - 80 mm^2
Wg. tej informacji oceniałem skalę przy umieszczaniu Tegry 4 na ilustracji.
O tu: SONY INTRODUCES PLAYSTATION®4
Racja, poprawiłem się. Można się pogubić w tych generacjach...
android arm i bodajże GX540 (czy jak on tam ma)
Trinity ma powierzchnię 240mm^2. Z tego zestawienia wynika, że 1/3 rdzenia zajmują kontrolery całkiem pokaźna ilość
Racja, poprawiłem się. Można się pogubić w tych generacjach...
To jeszcze w tytule na głównej popraw
Trinity ma powierzchnię 240mm^2. Z tego zestawienia wynika, że 1/3 rdzenia zajmują kontrolery całkiem pokaźna ilość
W przypadku llano AMD już pokazywało, że stawia na równy podział 1/3 cpu, 1/3 gpu, 1/3 NB.
jaki wspólny kontroler pamięci? tam masz kontroler jak dla GPU i jest wspólny dla całego układu bez względu na to jak chcesz to podzielić. A ze specyfikacji budowy L2 w jaguarze będzie pewnie 2x4 - no chyba, że zmodyfikują cache.
W samym artykule trochę mnie zaskakuje przybliżone zdjęcie Tegry 4 - ten układ ma chyba sumarycznie 8 rdzeni (4xA15 + 4xA7), a powierzchnia CPU zdaje się być wyraźnie mniejsza niż w 2 rdzeniowym układzie Apple... Trochę to dziwne, ale może to kwestia różnic w technologii (28 vs 32).
Tak niech tak będzie i niech gry wczytują się dłużej niż na PS3
to tak jak w trinity. 2 moduły to praktycznie 2 osobne układy. Piszesz jak by aktualnie procesory nie siedziały na zewnętrznej szynie, tylko tworzyły monolit.
Tak niech tak będzie i niech gry wczytują się dłużej niż na PS3
PS4 ma wspierać teraz tryb 'wstrzymania' (jak w PSVITA) więc ponowne uruchamianie gier będzie raczej natychmiastowe. Poza tym na szybkość uruchamiania ma też wpływ ilość i szybkość pamięci więc raczej nie będzie problemów, chyba że prędkość odczytu z HDD będzie wąskim gardłem.
W samym artykule trochę mnie zaskakuje przybliżone zdjęcie Tegry 4 - ten układ ma chyba sumarycznie 8 rdzeni (4xA15 + 4xA7), a powierzchnia CPU zdaje się być wyraźnie mniejsza niż w 2 rdzeniowym układzie Apple... Trochę to dziwne, ale może to kwestia różnic w technologii (28 vs 32).
Mylisz Tegrę 4 z Exynosem Octa.