[#1] [Hollywood] Szybkość obliczeń G4 vs G5
Cześć.

Ostatnio natknąłem się na ciekawy problem - przyładowy (napisany w Hollywood) kod dość "obciążający" komputer liczył mi się zauważalnie szybciej na Macu Mini G4 1,33 GHz niż na Power Macu G5 QUAD 2,5 GHz.

Na fali ciekawości stworzyłem program liczący pierdołę - a konkretnie wyliczający przybliżenie liczby Pi metodą Monte Carlo. Wynik nie jest szczególnie dokładny (z uwagi na jedynie 1000000 punktów w kodzie oraz fakt, że funkcja RndF() w Hollywood nie generuje jedności). Jednakowoż robi co ma robić - obciąża komputer bzdurnymi wyliczeniami i na koniec podaje wynik w sekundach.

No i co się okazuje? Znowu jest zauważalnie szybciej na Miniaczu. G5 liczy całość około 24 sekund, zaś G4 - około 14 sekund. To jest kosmiczna różnica, zważywszy na relatywną różnicę wydajności tych sprzętów.

Tu powstaje pytanie - czy ktoś wyposażony w komputer z G4 i/lub G5 mógłby powtórzyć te wyliczenia? Mam podejrzenie, że binarka generowana w Hollywood jest po prostu optymalizowana pod G4 (pewnie Andreas ma tylko Maca Mini), ale chciałbym się jeszcze upewnić zanim uderzę do niego w tej sprawie.

EDIT: Chyba podałem błędną wykonywalkę. Zaraz podam prawidłowy link.

Tutaj można pobrać plik do testów.

Ostatnia aktualizacja: 08.03.2025 19:45:29 przez recedent

Ostatnia aktualizacja: 08.03.2025 19:53:23 przez recedent
[#2] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #1

Powermac G5 PCIe, 2.3 GHz - 3.786s
[#3] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@michal_zukowski, post #2

Coś jest nie tak z moim QUAD-em w takim razie. Tylko nie mam pojęcia co go tak ścięło.
Próbowałem nawet na systemie świeżo zabootowanym z pena - ten sam wynik (powyżej 23 sekundy).
[#4] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@michal_zukowski, post #2

To są jakieś jaja. Właśnie zrobiłem na obydwu komputerach benchmarki klientem dnetc. Wyniki są zgodne z oczekiwaniami. G5 wyprzedza, a miejscami deklasuje G4:

dnetc benchmark:

Test: OGR-NG

[     CORE       ][      G4 result     ][      G5 result     ]
[KOGE 3.1 Scalar:][13,662,996 nodes/sec][22,046,482 nodes/sec]
[KOGE 3.1 Hybrid:][28,819,700 nodes/sec][41,025,997 nodes/sec]

Test: RC5-72

[     CORE       ][      G4 result     ][      G5 result     ]
[   MH 2-pipe    ][ 5,185,536 keys/sec ][ 5,606,657 keys/sec ]
[   KKS 2-pipe   ][ 5,094,095 keys/sec ][ 6,135,656 keys/sec ]
[   KKS 604e     ][ 5,221,290 keys/sec ][ 5,599,851 keys/sec ]
[   KKS 7400     ][12,125,199 keys/sec ][15,746,582 keys/sec ]
[   KKS 7450     ][14,166,525 keys/sec ][18,839,114 keys/sec ]
[   MH-1 pipe    ][ 4,731,531 keys/sec ][ 4,738,733 keys/sec ]
[  MH 1-pipe 604e][ 4,689,936 keys/sec ][ 4,742,533 keys/sec ]
[#5] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #3

Nie jestem niczyja własnością ok, racja
3
[#6] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@QUAD, post #5

Jak będziesz brykać to wyciągnę wtyczkę i odstawię na stryszek, jak ostatnio.

Co wiemy do tej pory?

-= computer =-  |CPU clock|result|CPU model|
Efika 5200B       0,39 GHz: 26,70s MPC5200B |
Mac Mini G4       1,33 GHz: 14,02s PPC7447A |
PowerBook G4      1,67 GHz:  6,33s PPC7447A |
iMac G5           2,1  GHz: 23,00s PPC970fx |
Power Mac G5 AGP  2,3  GHz:  3,44s PPC970fx |
Power Mac G5 PCIe 2,3  GHz:  3,78s PPC970MP |
Power Mac G5 PCIe 2,5  GHz: 23,40s PPC970MP |
Power Mac G5 AGP  2,7  GHz: 24,58s PPC970fx |


To nie ma sensu. Nie ma żadnej reguły odnośnie modelu procesora. 970fx na jednym komputerze liczy szybciej - na innym wolniej. 970MP na jednym liczy szybciej - na innym wolniej.

Ktoś ma jakieś pomysły?

Ostatnia aktualizacja: 09.03.2025 10:17:16 przez recedent
[#7] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #6

Kondensatory na płycie w różnej kondycji.

Spadek wydajności procka, bo się zagrzał?

Spisek Jabola i procki wybrakowane jak nowe karty Nvidii, które nie mają takich samych parametrów i brakuje im ROP-ów do liczby deklarowanych czy czegoś.
[#8] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@KM_Ender, post #7

Tylko że wiesz, ja robiłem benchmark dnetc (RC5 i OGR-72) na dostępnych dla mnie sprzętach (Mac Mini 1,33 GHz i Power Mac G5 Quad 2,5 GHz) i tam wyniki nie odstawał od normy. Zwłaszcza w OGR Miniacz dostawał od Quada ostro w tyłek:

[     CORE       ][      G4 result     ][      G5 result     ]
[KOGE 3.1 Scalar:][13,662,996 nodes/sec][22,046,482 nodes/sec]
[KOGE 3.1 Hybrid:][28,819,700 nodes/sec][41,025,997 nodes/sec]


Z jakiegoś powodu dostrzeżone różnice dotyczą póki co tylko binarek Hollywood i w przypadku G5 nie korelują zupełnie z niczym (raz wolny jest 970fx, raz 970MP, innym razem jest odwrotnie). Wszedłem w detale, znalazłem wartości FSB, taktowanie pamięci... Nigdzie nie ma korelacji.

Co do temperatury - test uruchamiałem u siebie na "zimnym" (49 stopni Celsjusza) CPU. Oczywiście poszedł w górę o parę stopni, ale nawet do 60 było jeszcze daleko. To nie to.
1
[#9] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #8

No to Hollywood ma jakiegoś buga i nie jest zoptymalizowany dobrze pod G4 i G5. Czyżby G5 miały jakąś wadę i różnicę w sobie w zależności od rewizji?
[#10] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@KM_Ender, post #9

No to Hollywood ma jakiegoś buga i nie jest zoptymalizowany dobrze pod G4 i G5


Gdyby problemem był brak optymalizacji pod G5 to wszystkie komputery oparte na tym procesorze liczyłyby "benchmark" wolno. A tak nie jest. Ciekaw jestem czy pojawi się ktoś, kto na modelu który mamy już "w tabelce" uzyska rażąco odmienny wynik. To by dopiero dało mi do myślenia.
[#11] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #8

MorphOs działa na jednym rdzeniu.
Może ten konkretny na którym się uruchamia jest "wolny".
W OF można wyłączyc rdzen.
Czy jest możliwość wyboru na którym rdzeniu ma działać MorphOS?
To już pytanie do twórców MorphOS.

Ostatnia aktualizacja: 09.03.2025 11:47:32 przez Norbert
1
[#12] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Norbert, post #11

Gdyby tu chodziło o "wolny" czy "szybki" hardware to wszystkie benchmarki wychodziłyby wolno na takim sprzęcie. A tak nie jest (vide: dnetc).
[#13] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #12

Tak tylko strzelam: moze to wina dostepu do pamieci?
Moze procedury OGR/RC5 sa tak napisane ze mieszcza sie w Cache procesora, a twoja procedura
robi czeste skoki do pamieci niewiadomo gdzie.
[#14] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #12

Sprawdzenie mojej teorii rozwiązałoby wątpliwości.
Tylko czy da się wybrać na jakim rdzeniu uruchomi się MorphOS.?

Wersja o cache procesora też jest możliwa
[#15] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Phibrizzo, post #13

Tylko że cache procesora w przypadku 970MP@2,3 GHz i 970MP@2,5 GHz jest identyczny, a wynik różni się o 20 sekund (co stanowi 540%) i to na korzyść niżej taktowanego CPU.

Co do pamięci - na Minaczu masz 600 MB/s write i 350 verify. Na G5 jest to odpowiednio - 1450/2150 MB/s. Znowu G5 miażdży G4, podczas gdy G4 daje lepszy wynik obliczeń. To się nie spina.

Ostatnia aktualizacja: 09.03.2025 12:52:15 przez recedent
[#16] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #15

A ta aplikacja jest typu "standalone" czy tez potrzebuje jakiejs biblioteki?
I moze to ona stanowi problem?
[#17] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Phibrizzo, post #16

Nie, tam wszystko jest "w kupie", jak to Hollywood. Żadnych zewnętrznych bibliotek, pluginów itp.
[#18] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #17

Ja bym obstawial, ze to jest problem z cache.
Jak kod jest na granicy tego co miesci sie w cache to moga decydowac inne uruchomione programy/biblioteki itp, dzialajace w multitaskingu.
Musialbys zrobic testy na czystym systemie bez s-s (jak tam jest cos takiego), bez zadnych extra dodatkow.
Ewentualnie jest drugi prostszy (?) sposob.
Wylaczyc cache w testowanych sprzetach.
I wtedy zrobic testy, wyniki powinny byc wtedy raczej prawidlowe.
[#19] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #17

A moze rozszezyles sobie pamiec karta graficzna i zapomniales?
[#20] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Don_Adan, post #18

Mogę uruchomić bez startup-sequence, natomiast to co robiłem to uruchamiałem "czysty system" z płyty/obrazu bootującego. Tam nie ma uruchomione nic więcej, tylko sam system z nośnika zewnętrznego.

Wyłączyć cache - to też ciekawy sposób. Zobaczymy.
W międzyczasie DayWalker powtórzył mój test na swoim QUAD-zie. Wyszło mu praktycznie toczka w toczkę to samo co u mnie czyli 23,36s.

@Phibrizzo: "Dodawanie" RAM kosztem VRAM testowałem tylko na Miniaczu. Z racji że ma on 32 MB VRAM to memory gauge na górnej belce świeci na czerwono jak tylko coś z pamięci graficznej uszczknę. Uwierz mi - zauważył bym. No i Miniacz jest "szybszy" od G5 w tym teście, więc tym bardziej to nie go.
[#21] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #20

Nie znam sie na MorphOS-ie i nie wiem czy te same pliki sa uzywane dla G4 i dla G5.
Ale jezeli sa rozne, to wieksza binarka szybciej zapelni cache niz mniejsza.
No chyba, ze G5 ma wiekszy cache niz G4.
[#22] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Don_Adan, post #21

W tym przypadku używaliśmy cały czas tej samej binarki.
I tak, G5 ma większy cache niż G4 (konkretnie: Mac Mini G4 ma 64k L1 cache i 512k L2/L3 cache natomiast Power Mac G5 ma 32/64k L1 cache (32k cache danych poziomu 1, 64k cache instrukcji poziomu 1) i 1 MB L2/L3 cache).
Nie zmienia to faktu, że największe różnice obserwujemy pomiędzy procesorami G5, gdzie wielkość cache nie zmienia się wcale - czyli (według mojego rozumowania) - wypada z równania.

Konkretnie:
Na sprzęcie rzookola z procesorem PPC970MP (G5) o częstotliwości 2,3 GHz jest 3,78s
Na moim sprzęcie z procesorem PPC970MP (G5) o częstotliwości 2,5 GHz jest 23,4s
Na MorphZone ktoś dzisiaj potwierdził, że na tej samej maszynie co moja uzyskał 23,36s.
[#23] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #22

Wielkosc cache sie nie zmienia.
Ale zmienia sie jego zajetosc.
Prawdopodobnie to zalezy od wersji systemu MorphOS i/lub aktywnych programow/wtyczek na tych sprzetach.
Dlatego proponowalem bez s-s zrobic ten test.
Przepelnienie cache moze powodowac kilkukrotne spowolnienie dzialania programu.
[#24] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Don_Adan, post #23

Spieszę donieść, że wyłączenie cache komendą CPU NOCACHE dało dokładnie nic. Wyniki na G5 i G4 są identyczne jak wcześniej.

Ostatnia aktualizacja: 10.03.2025 14:59:54 przez recedent
[#25] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #24

To cos jest nie tak.
Powinno byc wolniej.
Wyglada, ze komenda CPU nocache, nie dziala na MorphOS-ie.
Ewentualnie testowany program sam ustawia/aktywuje sobie cache.
Byc moze robi to blednie.
I w tym moze byc problem.
[#26] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #22

A moze te dodatkowe "kory" ktore nic nie robia w MOSie jednak cos robia w tle i zajmuja cykle dostepu do cache lub pamieci.
Jesli mozesz to skompiluj swoj program pod Macka i uruchom na tym komputerze.
[#27] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Phibrizzo, post #26

No ale rzookol uruchomił ten programik na swoim "dwukorowym" G5 i uzyskał wynik prawie o 20 sekund lepszy.
Co do OSX - popełniłem taką kompilację. Komputer - jak widać - działa poprawnie:



To w kwestii software coś ewidentnie nie domaga. Tylko co?
[#28] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #27

Czyli podejrzenie moze byc sluszne ze MOS na 4-kory ma cos ewidentnie zwalone.
Moze byc nawet tak, ze nie tylo twoj program dziala wolno, moga tez byc inne z taka przypadloscia.

Ostatnia aktualizacja: 10.03.2025 15:57:32 przez Phibrizzo
[#29] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@Phibrizzo, post #28

Pozwól, że w odpowiedzi przytoczę jeszcze raz słynną tabelkę:

-= computer =-  |CPU clock|result|CPU model|
Efika 5200B       0,39 GHz: 26,70s MPC5200B |
Mac Mini G4       1,33 GHz: 14,02s PPC7447A |
PowerBook G4      1,67 GHz:  6,33s PPC7447A |
iMac G5           2,1  GHz: 23,00s PPC970fx |
Power Mac G5 AGP  2,3  GHz:  3,44s PPC970fx |
Power Mac G5 PCIe 2,3  GHz:  3,78s PPC970MP |
Power Mac G5 PCIe 2,5  GHz: 23,40s PPC970MP |
Power Mac G5 AGP  2,7  GHz: 24,58s PPC970fx |


Pozycja 4 to iMac G5 z jednordzeniowym PPC970fx - uzyskuje 23 sekundy.
Pozycja 8 to Power Mac G5 z jednordzeniowym PPC970fx - uzyskuje 24,5 sekundy.

Tu nie ma reguły ile kto ma rdzeni czy jakie taktowanie - dlatego to takie frustrujące.
[#30] Re: [Hollywood] Szybkość obliczeń G4 vs G5

@recedent, post #29

I Efika jest tylko o 2 sekundy gorsza od tego G5?

Chwileczke, moj PB 1.6GHz wyciaga az 14 sekund.
Jakim cudem masz prawie 6?


Ostatnia aktualizacja: 10.03.2025 16:02:41 przez Phibrizzo
Na stronie www.PPA.pl, podobnie jak na wielu innych stronach internetowych, wykorzystywane są tzw. cookies (ciasteczka). Służą ona m.in. do tego, aby zalogować się na swoje konto, czy brać udział w ankietach. Ze względu na nowe regulacje prawne jesteśmy zobowiązani do poinformowania Cię o tym w wyraźniejszy niż dotychczas sposób. Dalsze korzystanie z naszej strony bez zmiany ustawień przeglądarki internetowej będzie oznaczać, że zgadzasz się na ich wykorzystywanie.
OK, rozumiem