@Duracel, post #61
@Radov, post #57
@mailman, post #43
@krashan_, post #64
Oczywiście powstaje pytanie dlaczego jest więcej stopni. Na to pewnie mogliby odpowiedzieć tylko konstruktorzy.
W procesorach z serii 7447(A) jest pięć jednostek wykonawczych
Okazuje się, że AltiVec w PA6T ma cztery jednostki wykonawcze
W procesorze G4 wszystkie jednostki AV mogą wykonywać jeden rozkaz co jeden takt procesora. Niestety do tych danych dla PA6T jeszcze się nie dogrzebałem
Oczywiście powstaje pytanie dlaczego jest więcej stopni.
Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...)
@Radov, post #66
@krashan_, post #67
Pozostało nam zatem tylko jedno.
Ja zoptymalizuję pod G4 i puszczę powiedzmy na PowerBooku 1,67 GHz. Ty zoptymalizujesz pod PA6T i zapuścisz na X1000.
W nauce zawsze eksperyment weryfikuje teorię.
@Radov, post #68
@wali7, post #71
@krashan_, post #70
Stawiam zatem tezę: „Jednostka AltiVec w PA6T jest mniej wydajna z megaherca niż w G4 7447. Jest to cecha konstrukcyjna tego procesora i nie da się tego poprawić drogą optymalizacji kodu. W efekcie kod korzystający intensywnie z AltiVec-a na G4 o porównywalnym zegarze (1.67 GHz vs 1.8 GHz dla PA6T) wykonywał się będzie szybciej lub w tym samym czasie, mimo wolniejszego taktowania. Dotyczy to w szczególności operacji zmiennoprzecinkowych.”
Póki co jednak zauważ, że eksperymenty zostały przeprowadzone (test LAME). Wydają się potwierdzać moją wersję teorii.
@Radov, post #73
@krashan_, post #75
No i? Dostrzegasz tu jakąś sprzeczność?
Która to przewaga może się znaznaczyć najbardziej w kodzie intensywnie wykorzystujących wektorową jednostkę zmiennoprzecinkową.
Z dokładnością do ilu miejsc po przecinku? Dla mnie sprawa wygląda tak.
Oczywiście mówimy tu o testach AltiVeca jako takiego, a więc na małym zbiorze danych. Dla dużego zbioru danych (np. większego niż cache L2) przetestujemy również szybkość dostępu do pamięci i tu powinniśmy się spodziewać przewagi PA6T, co zresztą potwierdzają testy dekodowania video.
Oj zabawiasz się w filozofowanie... Można i tak, ale do czego takie zabawy słowne prowadzą?
To było trochę inaczej. Po ukazaniu się wyników testów LAME kilku użytkowników X1000 argumentowało wyniki tym, że LAME nie jest zoptymalizowany pod ten procesor i że z tego powodu test jest „nieuczciwy”.
A na koniec zgrabną figurą sofistyczną próbujesz obalić wyniki testu LAME biorąc do swojej ręki ten sam argument, który wcześniej bezpodstawnie usiłowałeś włożyć do mojej.[quote]
Skądże znowu - żadnych testów nie obalam. Staram się jedynie konsekwentnie trzymać tego co sam pisałeś kilka wiadomości wcześniej. Jeśli w temacie wpływu energooszczędności między CPU powołałeś sie na AV i obecne wyniki LAME - to zamierzam zadbać o to, by w definicji "eksperymentu" te elementy też się pojawiły jako jedno z założeń.
[quote] To jednak nie zadziała z dwóch powodów. Po pierwsze, nawet jeżeli uznamy, że test LAME nie potwierdza mojej tezy, to jej również nie falsyfikuje.
Od propozycji tej się uchyliłeś, co jest pewną przesłanką do mojego twierdzenia, że nie będzie kto miał tego kodu (np. w LAME) zoptymalizować.
Stawiam hipotezę, że może się takiej nigdy nie doczekać.
A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4 jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.
@pinior, post #76
@Radov, post #77
@krashan_, post #75
Wobec niewielkiej różnicy zegarów (1,67 i 1,8 GHz) stawiam więc tezę, że również w jednostkach czasu rzeczywistego G4 uzyska przewagę. Która to przewaga może się znaznaczyć najbardziej w kodzie intensywnie wykorzystujących wektorową jednostkę zmiennoprzecinkową.
@gx, post #80
@Radov, post #68
@recedent, post #72
@krashan_, post #79
Jeżeli precyzujemy eksperyment, to siłą rzeczy muszą się pojawić dodatkowe elementy. To nieuniknione.
a liczy się tylko "throughput" (...) O ile mam takie dane dla 7447A, o tyle nie udało mi się znaleźć odpowiednika Freescale'owskich "User's Manual" dla PA6T. Jakbyś miał, to będę wdzięczny za linka.
Teraz ustaw wartości graniczne między nimi: przewaga PA6T || równowaga ||przewaga G4 || test permutacji || test "najbardziej" LAME. (...)
Już to przecież zrobiłem. Czyżbyś zaczynał krążyć w kółko?
W takim razie mówimy o dwóch różnych rzeczach. Teza, którą postawiłem dotyczy wyłącznie AltiVeca, co zresztą jasno wynika z jej treści.
Skoro sobie luźno dyskutowaliśmy, temat dyskusji się zmieniał. Konkretem jest teza postawiona przeze mnie w poście 70, oraz warunki testu z postu 75. I nic więcej.
Reszta to Twój taniec na falach retoryki.
Przyjąłeś błędne założenie, że stawiam sobie za cel dyskusji udowodnienie, że G4 jest procesorem lepszym niż PA6T.
Po pierwsze pojęcie "lepszości" jest niezdefiniowane.
Po drugie, jeżeli zaczniemy je definiować, to rozbijemy je na szereg podzagadnień, gdzie w części z nich punkty zbierze G4, w części PA6T.
Nie powołałem się. Zmieszałeś dwa zupełnie różne wątki, z różnych miejsc portalu.
Do tego wcale nie trzeba cudu. Sam potrafię napisać taki kod, który praktycznie w ciemno uzyska lepsze rezultaty na PA6T niż na G4.
A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest
niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4 jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.
Trzymałem się tezy z postu 70.
Chcesz dalej w ten sposób drążyć temat? Droga wiedzie donikąd...
@Ender, post #86