PlayStation 4 w małej galerii krzemu

23
Mateusz Brzostek
PlayStation 4 w małej galerii krzemu

Co PlayStation 4 będzie mieć wspólnego z najnowszym iPadem albo Wii U? Rzut oka na napędzające te urządzenia układy scalone powinien trochę wyjaśnić…

Gdy Sony potwierdziło specyfikację techniczną PS4, pierwsze co mi przyszło do głowy to dysproporcja między procesorem a układem graficznym. Architektura Jaguar kojarzyła mi się z niewielkimi rdzeniami, a układ graficzny o podanej przez Sony mocy obliczeniowej wyglądał na pierwszy rzut oka na bardzo duży.

GPU w PlayStation 4 będzie zawierać 18 jednostek SIMD podobnych do tych z architektury GCN. Radeon HD 7870 ma 20 takich jednostek i zajmuje 212 mm² w procesie technologicznym 28 nm. Bezpiecznie będzie założyć, że 18 nowej generacji SIMD-ów wraz z resztą obwodów składających się na GPU będzie zajmowało od 150 do 200 mm².

A jaką powierzchnię będzie w tej samej technice produkcji zajmował procesor z PS4? Podstawową jednostką do budowania czipów z rdzeniami Jaguar jest CU (compute unit), czyli cztery rdzenie i wspólna pamięć podręczna L2. Dokumenty techniczne z ISSCC podają rozmiar jednego rdzenia: 3,1 mm². Szybkie porównanie do schematu całej jednostki CU pozwala oszacować jej rozmiar na około 26,5 mm². Osiem rdzeni wraz z obszarami pamięci podręcznej L2 będzie zajmowało około 53 mm² – od trzech do czterech razy mniej od szacowanego rozmiaru GPU! Ale przyzwyczaiłem się do analizowania procesorów (czy też APU) do komputerów biurkowych, może taka dysproporcja nie jest niczym dziwnym w innych zastosowaniach? W internecie można znaleźć wszystko, więc nie miałem problemu z porównaniem tych informacji do innych nowoczesnych czipów:

 galeria_krzemu_1200pxzdjęcia rdzeni za Chipworks, UBM TechInsights, SemiAccurate, AMD, Nvidia

Przyjrzyjmy się im po kolei. W Wii U, maszynie służącej wyłącznie do grania, GPU i CPU są na oddzielnych krzemowych jądrach, w dodatku produkowanych w dwóch różnych fabrykach i w nienajnowszych procesach technologicznych. W jądrze Latte oprócz GPU jest wbudowana pamięć eDRAM (służąca i procesorowi, i układowi graficznemu), którą pomijam w obliczeniach – ale i tak GPU mimo większego upakowania tranzystorów jest znacznie większe od CPU. Apple A6 i A6x to układy tej samej generacji, w obu jest ten sam procesor, ale ten drugi ma znacznie wydajniejszy (i większy) procesor graficzny. W iPhone 5 GPU zajmuje na oko tyle samo miejsca, co CPU, ale w iPadzie jest już wyraźnie największym elementem całego SoC. Tegra 4 jest przedstawiona w przybliżonej skali, bo dokładne wymiary jądra nie są znane. Pięć rdzeni ARM (z których wykorzystywane są cztery lub jeden, nigdy pięć) jest wyraźnie mniejsze od rozbudowanego GPU, które zajmuje większą część SoCa. Kolejnych dwóch czipów na ogół nie zestawia się z poprzednimi, bo mają zupełnie inne zastosowania, ale zasadniczo są to tak samo kawałki krzemu zawierające CPU, GPU i dodatkowe funkcje. Jądra Richland z najnowszych APU AMD i Ivy Bridge (na ilustracji najbardziej rozbudowana wersja laptopowa: 4 rdzenie + HD Graphics 4000) na oko zawierają podobne proporcje CPU i GPU. A gdyby policzyć te proporcje?

tabelka

Tak, możecie się już śmiać… Doszedłem to tego, co i tak było wiadomo: PlayStation 4, Wii U, Tegra 4 i Apple A6x to maszyny do grania. Jedynym niewielkim zaskoczeniem na tej liście jest iPad 4. generacji. O ile Wii U jest konsolą do gier, a najważniejszą zaletą Tegry ma być wydajność w grach i związek z ekosystemem Nvidii (Tegra Zone), to iPad raczej nie jest reklamowany jako konsola (choć chyba głównie do tego bywa wykorzystywany). Wyraźnie widać, że niektóre urządzenia są wielozadaniowe, a GPU jest tylko częścią całego układu; a w niektórych to układ graficzny dominuje, a procesor jest raczej z konieczności.

Oczywiście moje szacunki oparte na zdjęciach krzemu nie są zbyt precyzyjne, ale mogą być pożyteczne, dopóki nie próbuje się z nich wyciągać zbyt daleko idących wniosków. Następnym razem spróbuję znaleźć jakieś bardziej sensacyjne zależności :)

 

P.S. Podczas poszukiwania informacji w sieci natrafiłem na mniej i bardziej wiarygodne informacje. Wśród tych pierwszych znalazł się pewien polski portal technologiczny, którego newsman wypatrzył gdzieś prezentację AMD na temat architektury Jaguar i podał:

Każdy rdzeń może pochwalić się mocą obliczeniową na poziomie 194490 FLOPS, podczas gdy Bobcat osiągał tylko 159900 FLOPS – różnica wynosi zatem około 20%.

Około 195 KFLOPS to mniej niż połowa teoretycznej wydajności Intela 80387 sprzed 25 lat – choć w co drugiej prezentacji technologicznej pojawiają się teraflopy (tak, wiem, że „flops” to nie jest liczba mnoga!), autor najwyraźniej nie zauważył, że coś jest nie tak. Liczby wzięto z tego slajdu ze wspomnianej prezentacji:

amd_jaguar_isscc_jpegPozycja Core Flop Count w tej tabelce nie oznacza operacji zmiennoprzecinkowych na sekundę, ale przybliżoną liczbę przerzutników w rdzeniu x86 (prawdopodobnie nie liczono pamięci podręcznej). Pamiętajcie – nie wierzcie we wszystko, co przeczytacie w sieci :)

Oceny (23)
Średnia ocena
Twoja ocena
majkel84 (2013.03.03, 20:51)
Ocena: 8
Jak zwykle Mateusz wyczerpał temat, więc i komentarzy brak :-D
mbrzostek (2013.03.04, 00:21)
Ocena: 8
Ma to dobre strony - nie ma za dużo trolli :)
miekrzy (2013.03.04, 00:59)
Ocena: 1
Jeden drobiazg: Tegra 4 ma około 800 mm^2 powierzchni, jakbyś chciał dodać do tabelek ;)
Mayek (2013.03.04, 08:19)
Ocena: 0
miekrzy (2013.03.04, 00:59)
Jeden drobiazg: Tegra 4 ma około 800 mm^2 powierzchni, jakbyś chciał dodać do tabelek ;)

Jedno zero za dużo - 80 mm^2 :)
SunTzu (2013.03.04, 08:41)
Ocena: 0
Ciekawe czy z tego wyniknie, ze haswell to tez do grania....
Edytowane przez autora (2013.03.04, 08:42)
mbrzostek (2013.03.04, 09:09)
Ocena: -1
miekrzy (2013.03.04, 00:59)
Jeden drobiazg: Tegra 4 ma około 800 mm^2 powierzchni, jakbyś chciał dodać do tabelek ;)

Wg. tej informacji oceniałem skalę przy umieszczaniu Tegry 4 na ilustracji.
piotrze (2013.03.04, 09:32)
Ocena: -3
Po pierwsze A6x to procek, który jest wykorzystywany w iPad'ie czwartej, a nie trzeciej generacji, a po drugie to różnice w proporcjach GPU/CPU pomiędzy A6 a A6x bardzo prosto wyjaśnić - rozdzielczość iPhone'a to 1136x640, a iPad'a 2048x1536
Stefan999 (2013.03.04, 09:43)
Ocena: 0
Mi sie wydaje, ze 8 rdzeni nie jest podzielony na 2 2x4, a raczej jest 1x8. Ma to swoje zalety, chociazby wspólny kontroler pamięci.
paulusss (2013.03.04, 10:08)
Ocena: -3
Gdzie jest podane że PS4 bedzie mało jeden APU a nie dwa rdzenie?
mbrzostek (2013.03.04, 10:24)
Ocena: 1
paulusss (2013.03.04, 10:08)
Gdzie jest podane że PS4 bedzie mało jeden APU a nie dwa rdzenie?

O tu: SONY INTRODUCES PLAYSTATION®4

piotrze (2013.03.04, 09:32)
A6x jest wykorzystywany w iPad'ie czwartej, a nie trzeciej generacji

Racja, poprawiłem się. Można się pogubić w tych generacjach...

Edytowane przez autora (2013.03.04, 10:25)
ZIB2000 (2013.03.04, 11:24)
Ocena: 0
w zasadzie powinieneś dostawić do komplety psp vita
android arm i bodajże GX540 (czy jak on tam ma)
SunTzu (2013.03.04, 11:59)
Ocena: 0
Coś mi tu nie pasuje.
Trinity ma powierzchnię 240mm^2. Z tego zestawienia wynika, że 1/3 rdzenia zajmują kontrolery całkiem pokaźna ilość
robgrab (2013.03.04, 12:19)
Ocena: 0
Jeśli chodzi jeszcze o apple a6 i a6x to są ode produkowane w 32nm(ma 123mm2), a nie jak podaje autor 28nm.
slavkozz (2013.03.04, 13:07)
Ocena: 0
mbrzostek (2013.03.04, 10:24)

piotrze (2013.03.04, 09:32)
A6x jest wykorzystywany w iPad'ie czwartej, a nie trzeciej generacji

Racja, poprawiłem się. Można się pogubić w tych generacjach...

To jeszcze w tytule na głównej popraw ;)
Amitoza (2013.03.04, 13:26)
Ocena: 2
ktoś zapomniał w tegrze 4 chyba zaznaczyć cahce. To co na zdjęciach to sam rdzeń. Jak zaznaczy się także cache, to wyjdzie na to, że CPU ma podobną wielkość do GPU.
SunTzu (2013.03.04, 11:59)
Coś mi tu nie pasuje.
Trinity ma powierzchnię 240mm^2. Z tego zestawienia wynika, że 1/3 rdzenia zajmują kontrolery całkiem pokaźna ilość

W przypadku llano AMD już pokazywało, że stawia na równy podział 1/3 cpu, 1/3 gpu, 1/3 NB.
Amitoza (2013.03.04, 13:27)
Ocena: 1
Stefan999 (2013.03.04, 09:43)
Mi sie wydaje, ze 8 rdzeni nie jest podzielony na 2 2x4, a raczej jest 1x8. Ma to swoje zalety, chociazby wspólny kontroler pamięci.

jaki wspólny kontroler pamięci? tam masz kontroler jak dla GPU i jest wspólny dla całego układu bez względu na to jak chcesz to podzielić. A ze specyfikacji budowy L2 w jaguarze będzie pewnie 2x4 - no chyba, że zmodyfikują cache.
Stefan999 (2013.03.04, 14:53)
Ocena: 0
Dwa fizycznie oddzielne bloki CPU wymagalyby jakiegoś połączenia miedzy soba do przekazywania danych, chyba zeby użyć ram. Mielybysmy do czynienia z dwoma procesorami zintegrowanymi na jednym kawałku krzemu, przy tym poziomie konsolidacji byloby to bardzo problematyczne.
PePePL (2013.03.04, 15:53)
Ocena: -1
Ja bym jeszcze dodał, że w kwestii wyboru CPU dla PS4 także kwestie techniczno-ekonomiczne wydają się być istotne. SONY uczy się na błędach swoich jak i konkurencji - więc PS4 nie może się za bardzo grzać (patrz RROD w X360), ani nie być przesadnie drogie (patrz słaba sprzedaż PS3 po premierze). Mocne GPU jest z kategorii 'must-have' więc poszukiwanie oszczędności energii (temperatury) oraz kosztów siłą rzeczy padło na CPU. Tym bardziej, że część obliczeń CPU (np. związnych z fizyką) można przerzucić na GPU, a konsolowy OS raczej nie obciąża zbyt mocno CPU (pewnie będzie miał jeden rdzeń dla siebie i spokój). Dodatkowo na konsolach łatwiej jest zmusić programistów do pełniejszego korzystania z wielu rdzeni oraz specjalnych instrukcji. Stosunkowo słabe CPU nie powinno być więc jakoś specjalnie bolesne dla końcowego użytkownika.
W samym artykule trochę mnie zaskakuje przybliżone zdjęcie Tegry 4 - ten układ ma chyba sumarycznie 8 rdzeni (4xA15 + 4xA7), a powierzchnia CPU zdaje się być wyraźnie mniejsza niż w 2 rdzeniowym układzie Apple... Trochę to dziwne, ale może to kwestia różnic w technologii (28 vs 32).
Ha11ucinogen (2013.03.04, 16:05)
Ocena: 0
'Stosunkowo słabe CPU nie powinno być więc jakoś specjalnie bolesne dla końcowego użytkownika'.

Tak niech tak będzie i niech gry wczytują się dłużej niż na PS3 :D
Amitoza (2013.03.04, 17:53)
Ocena: 1
Stefan999 (2013.03.04, 14:53)
Dwa fizycznie oddzielne bloki CPU wymagalyby jakiegoś połączenia miedzy soba do przekazywania danych, chyba zeby użyć ram. Mielybysmy do czynienia z dwoma procesorami zintegrowanymi na jednym kawałku krzemu, przy tym poziomie konsolidacji byloby to bardzo problematyczne.

to tak jak w trinity. 2 moduły to praktycznie 2 osobne układy. Piszesz jak by aktualnie procesory nie siedziały na zewnętrznej szynie, tylko tworzyły monolit.
PePePL (2013.03.04, 18:21)
Ocena: 0
Ha11ucinogen (2013.03.04, 16:05)
'Stosunkowo słabe CPU nie powinno być więc jakoś specjalnie bolesne dla końcowego użytkownika'.

Tak niech tak będzie i niech gry wczytują się dłużej niż na PS3 :D


PS4 ma wspierać teraz tryb 'wstrzymania' (jak w PSVITA) więc ponowne uruchamianie gier będzie raczej natychmiastowe. Poza tym na szybkość uruchamiania ma też wpływ ilość i szybkość pamięci więc raczej nie będzie problemów, chyba że prędkość odczytu z HDD będzie wąskim gardłem.
Edytowane przez autora (2013.03.04, 18:22)
Super8 (2013.03.05, 23:37)
Ocena: 0
PePePL (2013.03.04, 15:53)

W samym artykule trochę mnie zaskakuje przybliżone zdjęcie Tegry 4 - ten układ ma chyba sumarycznie 8 rdzeni (4xA15 + 4xA7), a powierzchnia CPU zdaje się być wyraźnie mniejsza niż w 2 rdzeniowym układzie Apple... Trochę to dziwne, ale może to kwestia różnic w technologii (28 vs 32).


Mylisz Tegrę 4 z Exynosem Octa. ;)
miekrzy (2013.03.06, 16:47)
Ocena: 0
Ale te cztery dodatkowe rdzenie powinny zajmować mniej więcej tyle miejsca co dodatkowy rdzeń A15.
Zaloguj się, by móc komentować
Najnowsi blogerzy
ZenFistunknown_soliderhainczludojadkrzysztofwolongiewiczPuszorMuMineQPhalandircicior112kozarovvkristoflampart[DH] BanitovhpMade In 3WŚruTubaFoxaZlotoUchyGorylJaRoMalloygatorListonosz_złej_nowinytomeczek80max-bitroksiphaker146Blog technologiczny TECHNETQingwaWodziantracer123Windows7 fanWojtek Żuchowski