Komentowana treść: Amiga X Party - pierwsze zdjęcia
[#61] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #52

krashan, dla mnie jesteś persona grata :D przyjeżdżaj a zapewniam Cię, że nikt Cię palcem nie tknie, a jak tknie, to będzie to ostatni raz kiedy tego palca użył ;D
[#62] Re: Amiga X Party - pierwsze zdjęcia

@Duracel, post #61

Tak patrzac z boku....
Nie wydaje Wam sie smieszne, ze dorosli ludzie, tak bardzo sie tutaj przekrzykują ?
Czy juz nie mozna miec wlasnego zdania ? Co to za forum, czy srodowisko, gdzie kazdy kazdego chwali.......
Gdyby w Amigowym srodowisku faktycznie wystapila sytuacja, ze ktos kogos fizycznie zniewaza za odmienne poglady, to naprawde wstyd byloby sie z takim "srodowiskiem" identyfikowac.
Kazdy ma swoje pasje. Uszanujmy to. A Krashan, generalnie, jest madrzejszy od wiekszosci osob na tym forum :) Co nie znaczy, ze sie nie myli :)

A co to Amiga X PArty - fajnie chlopaki to pokazali, choc ja osobiscie zaluje , ze nie bylem z jednego powodu - konkurs z grami wymyslono na party wysmienicie!!!! Rewelacja panowie!

Zreszta, co ja sie bede odzywac :) Amige zawsze traktowalem jak konsolę, za jej systemem nie przepadam ( by nie napisac nie znosze, w koncu system Amigi byl jednym z glownych powodow, dzieki ktoremu seria tych komputerów uwazana jest na swiecie za finansową i marketingowa porazke ) i wg mnie wiecej dzis Amigi w byle PC czy konsoli niż tych wszystkich Neo-Amigach razem wzietych :)
[#63] [post oznaczony jako OT] wyświetl
[#64] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #57

A jak sam Grzesiek przyznał - specyfikacji tej drugiej architektury w zasadzie to nawet nie zna.

No, trochę nadrobiłem od tamtego czasu. Kłopot pewien jest z tym, że materiały dotyczące PA6T nie są łatwo dostępne w sieci. Póki co dogrzebałem się do reklamowych materiałów PA Semi, które są dość ogólnikowe i schematu blokowego procesora. Niemniej pewne wnioski można już wyciągnąć. Na przykład wyniki AltiVeca PA6T (stąd w testach LAME PowerBook i najszybsze Maki mini wyprzedzają X1000). Okazuje się, że AltiVec w PA6T ma cztery jednostki wykonawcze: Floating Point, Complex Integer, Easy Integer i Permute. W procesorach z serii 7447(A) jest pięć jednostek wykonawczych: do czterech analogicznych do PA Semi dochodzi jeszcze Load Store Unit. Prawdopodobnie konstruktorzy z PA Semi doszli do wniosku, że kontroler pamięci jest na tyle szybki, że poradzi sobie również z obrobieniem instrukcji AV. Co nie jest pozbawione podstaw, bo dostęp do głównej pamięci systemu w G4 jest około 3 razy wolniejszy. Szukałem więc dalej i zatrzymałem się na długości potoków poszczególnych jednostek: jednostka zmiennoprzecinkowa ma w PA6T 8 stopni wykonania, w 7447A ma cztery stopnie, jednostka złożonych operacji stałoprzecinkowych: 6 w PA6T, 4 w 7447A, jednostka prostych operacji stałoprzecinkowych 2 w PA6T kontra 1 w G4 i jednostka permutacji, tutaj oba procesory mają po 2 stopnie. W procesorze G4 wszystkie jednostki AV mogą wykonywać jeden rozkaz co jeden takt procesora, w przypadku idealnego wypełnienia potoków. Niestety do tych danych dla PA6T jeszcze się nie dogrzebałem. G4 może też w jednym takcie zegara wysłać dwie instrukcje AV z bloku dekodera rozkazów do jednostek wykonawczych.

Oczywiście powstaje pytanie dlaczego jest więcej stopni. Na to pewnie mogliby odpowiedzieć tylko konstruktorzy. Może to daje oszczędności na energii, może inne bloki procesora narzuciły swoje wymagania, a może po prostu lepiej nie umieli. Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...).
[#65] Re: Amiga X Party - pierwsze zdjęcia

@mailman, post #43

Mam nadzieję, że wszystko sobie powyjaśnialiśmy i nikt nie będzie się bał nigdzie przyjeżdżać. To, że sobie trochę pokrzyczymy nie oznacza, że się tak naprawdę nie lubimy

@mailman
Wracając do tematu konkursu - aż sam siebie zmyliłem:) Black Crypt jest jak najbardziej poprawną odpowiedzią, tak więc MichalMarek ma +1 punkt.

Do listy Mailmana trzeba dodać Flashback (już podany) oraz wykluczyć "Prawo krwi".

Jak już pojawią się wszystkie tytuły, to podam gdzie spodziewałem się cyferek.
Od razu zaznaczam, że są to także trywialnie "proste" miejsca - ot takie sposób na zdobycia bonusu, jak ktoś zauważy. Mamy więc:

Z1: kompletne
Z2: 1 tytuł
Z3: 2 tytuły
Z4: 1 tytuł
Z5: kompletne
[#66] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #64

Oczywiście powstaje pytanie dlaczego jest więcej stopni. Na to pewnie mogliby odpowiedzieć tylko konstruktorzy.

Ok. Możemy o tym pogadać na AmiWawie. Pewnie inne osoby też będą zainteresowane, a będzie łatwiej niż przez forum...

Ja naprawdę nie chcę żebyś nie wypowiadał się w ogóle w tematach o AmigaOS 4. Tak samo rozumiem Twoje zmęczenie różnymi przytykami. Ale tak samo jestem zmęczony ja. Dlatego ma dla mnie znaczenie co i jak piszesz. Mam nadzieję, że dojdziemy do porozumienia.

PS. ;)
Literatury rzeczywiście jest b. mało. Będę próbował podziałać w kierunku Varisysa, bo warto by coś opublikować więcej.
W procesorach z serii 7447(A) jest pięć jednostek wykonawczych

W które nie możesz wprowadzić jednocześnie więcej niż 16 instrukcji ;)

Okazuje się, że AltiVec w PA6T ma cztery jednostki wykonawcze

Wydaje mi się, że w przypadku PA6T powinniśmy mówić w kategorii dwóch jednostek. Wewnętrznie jest może inaczej zbudowane, ale jednoczesny dostęp masz jedynie do 2 kanałów: P0 i P1(dzielony z FPU)

W procesorze G4 wszystkie jednostki AV mogą wykonywać jeden rozkaz co jeden takt procesora. Niestety do tych danych dla PA6T jeszcze się nie dogrzebałem

G4 nie obsłuży więcej niż 16tu instrukcji na różnych etapach wykonania. A potok ma minimalną długość 7. Nie mogę znaleźć na którym kroku instrukcje są przekazywane do AV. W najbardziej złośliwym przypadku oznacza to spada wydajności do poziomu ~1.45 instrukcji na takt (gdzie 2.0 jak sam zauważyłeś to max). Dodatkowo:
- Każda operacja inna niż AV (np load/store) - oznacza w efekcie spadek wydajności przetwarzania AV
- G4 z 4 dostępnych jednostek może obsadzić jednocześnie tylko 2 różne - efektywnie to tak samo jak PA6T przy swoim podziale na P0 i P1. Tyle, że PA6T będzie w stanie dobić do poziomu 3 instrukcji / takt przy uwzględnieniu operacji load/store.

Oczywiście powstaje pytanie dlaczego jest więcej stopni.

W tym przypadku możemy wymienić dwa główne powody oraz 1 poboczny. Dłuższy potok:
1) Pozwala uzyskać wyższe taktowanie układu utrzymując podobne napięcie zasilające. (G5 mają jeszcze dłuższy...)
2) Pozwala wprowadzić większą ilość instrukcji w jednostki wykonawcze.
Oraz dodatkowo:
- konstrukcja PA6T oparta jest ponoć o bramki dynamiczne - przy większej ilości, krótkich kroków łatwiej taką architekturą zaprojektować.

Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...)

Nie zgodzę się z tym. Wniosek nie ma uzsadnienia.
1) Liczba stopni potoku nie przekłada się bezpośrednio na wydajność układów
2) G4: 1.5-2.0 instrukcji AV (i kara za load/store) - vs 2.0 instrukcji (i "darmowy" load/store) w PA6T
Kod zoptymalizowany na AV PA6T będzie działać szybciej niż kod zoptymalizowany na AV G4

Ostatnia aktualizacja: 27.02.2012 21:42:20 przez Radov

Ostatnia aktualizacja: 27.02.2012 21:44:25 przez Radov
[#67] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #66

Nie zgodzę się z tym. Wniosek nie ma uzsadnienia.
1) Liczba stopni potoku nie przekłada się bezpośrednio na wydajność układów
2) G4: 1.5-2.0 instrukcji AV (i kara za load/store) - vs 2.0 instrukcji (i "darmowy" load/store) w PA6T
Kod zoptymalizowany na AV PA6T będzie działać szybciej niż kod zoptymalizowany na AV G4


Pozostało nam zatem tylko jedno. Zaproponuj zagadnienie do zaimplementowania w AltiVecu. Ja zoptymalizuję pod G4 i puszczę powiedzmy na PowerBooku 1,67 GHz. Ty zoptymalizujesz pod PA6T i zapuścisz na X1000. W nauce zawsze eksperyment weryfikuje teorię.
[#68] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #67

Pozostało nam zatem tylko jedno.

Przestać autorytatywnie pisać o nieprzetestowanych układach, których się na oczy nie widziało...

Ja zoptymalizuję pod G4 i puszczę powiedzmy na PowerBooku 1,67 GHz. Ty zoptymalizujesz pod PA6T i zapuścisz na X1000.

aa nie... chcesz pojedynku :)
To tylko sprecyzuj mi co chcesz udowodnić:
- jeśli to, że ty lepiej zoptymalizujesz kod pod G4 niż ja pod PA6T, to mogę Ci to od razu przyznać. Tak samo mogę od razu przyznać, że banany są bardziej żółte niż pomarańcze okrągłe - skoro takie eksperymenty pozwalają Ci wyciągnąć wnioski.
Obawiam się jednak, że stawiasz mnie w nierównej sytuacji - ja nie mam takiego dostępu do X1000 jak ty do G4. Jesteś pewien, że taki test pozwoli cokolwiek wywnioskować?

BTW. Zanim zaczniemy doprecyzowywać warunki pojedynku, czy możesz zawczasu przeczytać i skomentować ten artykuł:
link?
(w szczególności strona 20, jakkolwiek inne też są ważne)
Czy taki test praktyczny Ci wystarczy, czy jednak potrzebujesz się jeszcze pojedynkować ze mną na umiejętności?

(i tak: widzę tam cyferki - podzieliłem wyniki PA6T przez 2, a te G4 zwiększyłem o 1670/975 tych)

PS. Jeśli mamy być precyzyjni, to...
W nauce zawsze eksperyment weryfikuje teorię.

... to jakoś wiele postów temu eksperymentów nie potrzebowałeś, gdy nie znałeś specyfikacji procesorów skąd ta nagła zmiana?

Ostatnia aktualizacja: 27.02.2012 23:00:50 przez Radov
[#69] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #68

Pozostaje tylko się cieszyć, że ludzie z różnych środowisk ze sobą rozmawiają. Lepiej późno niż wcale. Jak to leciało w "Krzyżakach" Sienkiewicza: "(...) pokój między chrześcijany(...)". OK Chyba warto brać przykład z literatury. :)
[#70] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #68

Przestać autorytatywnie pisać o nieprzetestowanych układach, których się na oczy nie widziało...

Mam wrażenie, że to dotyczy nas obu.

To tylko sprecyzuj mi co chcesz udowodnić:

Stawiam zatem tezę: „Jednostka AltiVec w PA6T jest mniej wydajna z megaherca niż w G4 7447. Jest to cecha konstrukcyjna tego procesora i nie da się tego poprawić drogą optymalizacji kodu. W efekcie kod korzystający intensywnie z AltiVec-a na G4 o porównywalnym zegarze (1.67 GHz vs 1.8 GHz dla PA6T) wykonywał się będzie szybciej lub w tym samym czasie, mimo wolniejszego taktowania. Dotyczy to w szczególności operacji zmiennoprzecinkowych.”

możesz zawczasu przeczytać i skomentować ten artykuł:

Mogę, ale dopiero po uzyskaniu dostępu do Windowsa w pracy (PowerPoint ).

to jakoś wiele postów temu eksperymentów nie potrzebowałeś, gdy nie znałeś specyfikacji procesorów skąd ta nagła zmiana?

Pracuję nad sobą. Póki co jednak zauważ, że eksperymenty zostały przeprowadzone (test LAME). Wydają się potwierdzać moją wersję teorii.

Ostatnia aktualizacja: 28.02.2012 06:42:39 przez krashan_
[#71] Re: Amiga X Party - pierwsze zdjęcia

@Ender, post #69

Ender - widzę, że wciąż jesteś w środku książki ;) . Doczytaj do końca, zobaczysz jak się to kończy. Mam nadzieję, że u nas będzie inaczej :)
[#72] Re: Amiga X Party - pierwsze zdjęcia

@wali7, post #71

No jak się kończy?

Maćko i Zbyszko wrócili do Bogdańca. Stary rycerz żył jeszcze długo, a Zbyszko doczekał się w zdrowiu i sile tej szczęsnej chwili, w której jedną bramą wyjeżdżał z Malborga ze łzami w oczach mistrz krzyżacki, drugą wjeżdżał na czele wojsk polski wojewoda, aby w imieniu króla i Królestwa objąć w posiadanie miasto i całą krainę aż po siwe fale Bałtyku.

Całkiem całkiem. Mam nadzieję, że u nas będzie tak samo :)

P.S. "Pax między chrześcijany" wołał Wielki Mistrz Zakonu, Konrad.
[#73] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #70


Stawiam zatem tezę: „Jednostka AltiVec w PA6T jest mniej wydajna z megaherca niż w G4 7447. Jest to cecha konstrukcyjna tego procesora i nie da się tego poprawić drogą optymalizacji kodu. W efekcie kod korzystający intensywnie z AltiVec-a na G4 o porównywalnym zegarze (1.67 GHz vs 1.8 GHz dla PA6T) wykonywał się będzie szybciej lub w tym samym czasie, mimo wolniejszego taktowania. Dotyczy to w szczególności operacji zmiennoprzecinkowych.”

Dobrze. Przypomnę Cie jednak, że to co napisałeś pierwotnie przy teście:
"Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...)"

To właśnie stwierdzenie napisałeś pierwotnie odnośnie różnicy w PA6T oraz G4. Teza, którą teraz napisałeś brzmi inaczej. Chciałbym żebyś dodał do niej także stwierdzenie "dostanie w plecy", wymiernie określił ile to właściwie jest oraz zdefiniował wartość graniczną "najbardziej". Oczywiście ta teza też jest ciekawa i z chęcią ją zbadam, ale jednak brzmi trochę inaczej od tego co napisałeś pierwotnie. Nie chcielibyśmy przecież potwierdzać eksperymentalnie innej tezy niż pierwotnie wysnuta, co nie ;)

Póki co jednak zauważ, że eksperymenty zostały przeprowadzone (test LAME). Wydają się potwierdzać moją wersję teorii.

Twoja wersja teorii mówiła także, że dla AmigaOS kod pod PA6T nie jest zoptymalizowany i w praktyce nigdy nie będzie, bo nie będzie miał tego kto zrobić. Możesz mi wyjaśnić, w którym miejscu nastąpiło przejście i jednak porównywane były dwie zoptymalizowane wersje? Bo chyba nie chcesz twierdzić, że to test miedzy wersjami: zoptymalizowanej do nie-zoptymalizowanej potwierdza Twoją wersję?
[#74] Re: Amiga X Party - pierwsze zdjęcia

@Ender, post #69

"pax, pax między chrześcijany" tam było:). Cholera, uprzedziłeś mnie Rec. Do pokoju rzeczywiście nawoływał Konrad podczas wyżerki w Malborku:D.

Ostatnia aktualizacja: 28.02.2012 09:33:46 przez fazior
[#75] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #73

Przypomnę Cie jednak, że to co napisałeś pierwotnie przy teście: "Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...)"

No i? Dostrzegasz tu jakąś sprzeczność? Bazując na informacjach o ilości stopni w potokach jednostek AltiVec wysunąłem hipotezę, że w przeliczeniu na takty zegara, wydajność AltiVeca w PA6T jest w porównaniu do G4 najsłabsza przy jednostce zmiennoprzecinkowej, natomiast, wobec jednakowej długości potoków dla jednostki VPU, instrukcje permutacji tracą najmniej, a być może wcale. Wobec niewielkiej różnicy zegarów (1,67 i 1,8 GHz) stawiam więc tezę, że również w jednostkach czasu rzeczywistego G4 uzyska przewagę. Która to przewaga może się znaznaczyć najbardziej w kodzie intensywnie wykorzystujących wektorową jednostkę zmiennoprzecinkową.

Chciałbym żebyś dodał do niej także stwierdzenie "dostanie w plecy", wymiernie określił ile to właściwie jest oraz zdefiniował wartość graniczną "najbardziej".

Z dokładnością do ilu miejsc po przecinku? Dla mnie sprawa wygląda tak. Jeżeli AV w PA6T byłby tak samo wydajny w odniesieniu do taktów zegara, jak w G4, to wtedy w każdym teście AltiVeca X1000 byłaby szybsza od PowerBooka, bo ma szybsze taktowanie. Jeżeli natomiast w jednostkach czasu rzeczywistego (a więc nawet bez uwzględnienia różnicy zegarów) PowerBook wykonuje test szybciej, to jego AltiVec jest wydajniejszy zarówno względnie (per MHz) jak i bezwzględnie. Zatem definiujemy:

Przyjmujemy czas wykonania się testu X na PA6T 1,8 GHz za 1,000. I teraz jeżeli G4 1,67 GHz wykona ten test w czasie mniejszym od 1,000, to PA Semi dostaje w plecy zarówno bezwzględnie jak i względnie. Jeżeli wykona go w czasie powyżej 1,000, ale poniżej 1,078 (stosunek taktowań obu procesorów), to PA Semi dostaje w plecy tylko względnie. Jeżeli czas G4 będzie powyżej 1,078, to w plecy dostaje G4.

Oczywiście mówimy tu o testach AltiVeca jako takiego, a więc na małym zbiorze danych. Dla dużego zbioru danych (np. większego niż cache L2) przetestujemy również szybkość dostępu do pamięci i tu powinniśmy się spodziewać przewagi PA6T, co zresztą potwierdzają testy dekodowania video.

Oczywiście ta teza też jest ciekawa i z chęcią ją zbadam, ale jednak brzmi trochę inaczej od tego co napisałeś pierwotnie. Nie chcielibyśmy przecież potwierdzać eksperymentalnie innej tezy niż pierwotnie wysnuta, co nie

Oj zabawiasz się w filozofowanie... Można i tak, ale do czego takie zabawy słowne prowadzą?

Twoja wersja teorii mówiła także, że dla AmigaOS kod pod PA6T nie jest zoptymalizowany i w praktyce nigdy nie będzie, bo nie będzie miał tego kto zrobić. Możesz mi wyjaśnić, w którym miejscu nastąpiło przejście i jednak porównywane były dwie zoptymalizowane wersje? Bo chyba nie chcesz twierdzić, że to test miedzy wersjami: zoptymalizowanej do nie-zoptymalizowanej potwierdza Twoją wersję?

To było trochę inaczej. Po ukazaniu się wyników testów LAME kilku użytkowników X1000 argumentowało wyniki tym, że LAME nie jest zoptymalizowany pod ten procesor i że z tego powodu test jest „nieuczciwy”. Takie stwierdzenie nie wchodziło w skład mojej teorii, był to wręcz jej kontrargument i nie został, rzecz jasna, wysunięty przeze mnie. Zatem dobrze, w takim razie zaproponowałem przeprowadzenie „uczciwego” testu i zoptymalizowanie kodu pod każdy z procesorów oddzielnie. Jak więc widzisz, nie było żadnego przejścia. Od propozycji tej się uchyliłeś, co jest pewną przesłanką do mojego twierdzenia, że nie będzie kto miał tego kodu (np. w LAME) zoptymalizować. A na koniec zgrabną figurą sofistyczną próbujesz obalić wyniki testu LAME biorąc do swojej ręki ten sam argument, który wcześniej bezpodstawnie usiłowałeś włożyć do mojej. To jednak nie zadziała z dwóch powodów. Po pierwsze, nawet jeżeli uznamy, że test LAME nie potwierdza mojej tezy, to jej również nie falsyfikuje. Po drugie, z punktu widzenia tak zwanego szarego użytkownika fakty są takie, że szybszy procesor wykonuje program wolniej. Użytkownik nie ma w ręku jakiejkolwiek „zoptymalizowanej” pod PA6T wersji LAME. Stawiam hipotezę, że może się takiej nigdy nie doczekać. A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4 jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.
[#76] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #75

Powiedz nam teraz panie fachowiec jak to i7 dostanie w plecy od G4 i tego potężnego altiveca. Bo z Twoich wypocin wynika, że ten wspaniały 13 letni procesor daje w plecy każdemu nowszemu.

Ostatnia aktualizacja: 28.02.2012 11:47:28 przez pinior
[#77] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #75

No i? Dostrzegasz tu jakąś sprzeczność?

Oj nie. sprzeczności żadnej nie dostrzegam. Dostrzegam tylko kilka elementów, które nie pojawiły się wcześniej w założeniach "eksperymentu". Jeśli w pierwotnym stwierdzeniu użyłeś pewnych (na razie wprawdzie niewymiernych) określeń dt. wydajności - a moja odpowiedź na nie wywołała u Ciebie chęć pojedynkowania się na kod - to chcę żeby te same określenia pojawiły się w założeniach. Daje Ci wolną rękę w określeniu uch "wymierności", jakkolwiek też będę kierował uwagi.


Która to przewaga może się znaznaczyć najbardziej w kodzie intensywnie wykorzystujących wektorową jednostkę zmiennoprzecinkową.

A zastanawiałeś się co by było, gdyby - przykładowo: ktoś w tym pojedynku wprowadził rejestrów AV kilka kolejnych próbek danych i liczył je przeplatając? Czy wtedy ograniczenia wynikające z wydłużenia potoku będą się objawiać w stopniu w jakim przewidujesz? ;)


Z dokładnością do ilu miejsc po przecinku? Dla mnie sprawa wygląda tak.

Z dokładnością do testu:
- permutacji - który jako dostanie w plecy, ale nie "najbardziej".
- LAME - który określiłeś jako "najbardziej"
Jak rozumiem - już teraz zakładasz, ze PA6T będzie mieć gorszy współczynnik zegar-w-zegar niż G4 (czyli te 1,078). OK. Ale obecne wyniki LAME też są już znane. Teraz ustaw wartości graniczne między nimi: przewaga PA6T || równowaga ||przewaga G4 || test permutacji || test "najbardziej" LAME.


Oczywiście mówimy tu o testach AltiVeca jako takiego, a więc na małym zbiorze danych. Dla dużego zbioru danych (np. większego niż cache L2) przetestujemy również szybkość dostępu do pamięci i tu powinniśmy się spodziewać przewagi PA6T, co zresztą potwierdzają testy dekodowania video.

Nie. Skądże znowu. Dlaczego w ogóle miałbym przyjmować takie ograniczenie?
Od samego początku (gdy przytoczyłem Twoją wypowiedź) mówimy o pórówaniu wydajności CPU, a nie samego Altiveca. Oraz wpływie energooszczędności na wydajność względem G4
Nie widzę najmniejszego powodu dla którego naszą dyskusję o wydajności między G4, a PA6T miałbym zamieniać na wydajnosć między AV w G4, a PA6T i to na małym pakiecie danych. Tylko dlatego, że z pośród wielu elementów CPU odniosłeś się tylko do tego kilka wiadomości temu? Obawiam się, że nie ma na to szans
Konstruktorzy PA6T przyjęli pewne rozwiązania wspierajace wydajność także AV - nie widzę powodu bym nagle miał je przestać uwzględniać, bo G4 ich nie ma.

Oj zabawiasz się w filozofowanie... Można i tak, ale do czego takie zabawy słowne prowadzą?

Do tego, że między kolejnymi postami zmieniasz podmiot dyskusji. Ten wątek - tutaj - zacząłem od przytoczenia (moim zdaniem wątpliwej) tezy o wpływie energooszczędności na wydajność PA6T względem G4. W międzyczasie przeszedłeś na analizę różnicy między samymi jednostkami AV - a teraz w ogóle wprowadzasz oderwane od tematu ograniczenia.

To było trochę inaczej. Po ukazaniu się wyników testów LAME kilku użytkowników X1000 argumentowało wyniki tym, że LAME nie jest zoptymalizowany pod ten procesor i że z tego powodu test jest „nieuczciwy”.

Ale ja nie dyskutuję o tym co kilku użytkowników napisało gdzie indziej - mogą się mylić. Tylko o tym co TY, który powołuje się na doświadczenia inżynierskie, piszesz TUTAJ.

A na koniec zgrabną figurą sofistyczną próbujesz obalić wyniki testu LAME biorąc do swojej ręki ten sam argument, który wcześniej bezpodstawnie usiłowałeś włożyć do mojej.[quote]
Skądże znowu - żadnych testów nie obalam. Staram się jedynie konsekwentnie trzymać tego co sam pisałeś kilka wiadomości wcześniej. Jeśli w temacie wpływu energooszczędności między CPU powołałeś sie na AV i obecne wyniki LAME - to zamierzam zadbać o to, by w definicji "eksperymentu" te elementy też się pojawiły jako jedno z założeń.

[quote] To jednak nie zadziała z dwóch powodów. Po pierwsze, nawet jeżeli uznamy, że test LAME nie potwierdza mojej tezy, to jej również nie falsyfikuje.

Zgadza się. Dlatego staram się ustalić jednoznacznie brzmiące warunki byś nie napisał mi tego samego jeśli jakimś cudem moje algorytmy na PA6T uzyskają lepsze rezultaty niż Twoje na G4

Od propozycji tej się uchyliłeś, co jest pewną przesłanką do mojego twierdzenia, że nie będzie kto miał tego kodu (np. w LAME) zoptymalizować.

Jeszcze się nie uchyliłem. Zaznaczyłem jedynie, że jak na "neutralne i rzetelne" eksperymentowanie to postawiłeś mnie w "lekko" niekorzystnej sytuacji.
Na razie jednak staram się ustalić jeden, spójny z poprzednimi wypowiedziami, temat eksperymentu.
Jak to się uda, to potem sie zastanowię czy i jak będę w stanie zrealizować postawione wyzwania. Mam pomysły na kilka ciekawych algorytmów. Byłbyś w razie czego skłonny udostępnić swój zoptymalizowany pod G4 kod liczący FFT?


Stawiam hipotezę, że może się takiej nigdy nie doczekać.

A to znowu jeszcze inna hipoteza, niż umieściłeś w pierwotnych założeniach eksperymentu.


A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4 jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.

Zgadza się - sam to bym napisał, gdybyś nie przeszedł od razu do tematu pojedynkowania. Jednak w mojej opinii długi potok nie ma tak rygorystycznego znacznia jak uważasz. Dlatego mimo wszystko spodziewami się, że wyniki pomiędzy tymi prockami byłyby zbliżone i będą zależeć, od wydajności innych elementów CPU. A to wydajność całego CPU oceniamy.
[#78] Re: Amiga X Party - pierwsze zdjęcia

@pinior, post #76

Powiedz nam teraz panie fachowiec jak to i7 dostanie w plecy od G4 i tego potężnego altiveca.

Wykonując program dla AmigaOS 4, czy MorphOSa? Panie fachowiec?

Bo z Twoich wypocin wynika, że ten wspaniały 13 letni procesor daje w plecy każdemu nowszemu.

Każdemu? Może zacytujesz adekwatny fragment? Albo miejsce, gdzie napisałem coś o i7?
[#79] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #77

Dostrzegam tylko kilka elementów, które nie pojawiły się wcześniej w założeniach "eksperymentu".

Jeżeli precyzujemy eksperyment, to siłą rzeczy muszą się pojawić dodatkowe elementy. To nieuniknione.

A zastanawiałeś się co by było, gdyby - przykładowo: ktoś w tym pojedynku wprowadził rejestrów AV kilka kolejnych próbek danych i liczył je przeplatając? Czy wtedy ograniczenia wynikające z wydłużenia potoku będą się objawiać w stopniu w jakim przewidujesz?

Na tym polega optymalizacja algorytmu. Przecież wiesz, że żeby optymalnie wypełnić potok trzeba postarać się, aby w miarę możliwości argumenty instrukcji będących na początku potoku nie były wynikami instrukcji, które go jeszcze nie opuściły. Nie zawsze jest to możliwe w praktyce. Im potok jest dłuższy, tym trudniej go wypełnić w ten sposób. Jeżeli jednak wykonywany algorytm na to pozwala, to w przypadku idealnym parametr "latency" (czas przejścia przez potok) staje się nieistotny a liczy się tylko "throughput" czyli obrazowo mówiąc co ile taktów procesora kolejna instrukcja schodzi z potoku przy wypełnieniu optymalnym. O ile mam takie dane dla 7447A, o tyle nie udało mi się znaleźć odpowiednika Freescale'owskich "User's Manual" dla PA6T. Jakbyś miał, to będę wdzięczny za linka.

Jak rozumiem - już teraz zakładasz, ze PA6T będzie mieć gorszy współczynnik zegar-w-zegar niż G4 (czyli te 1,07. OK. Ale obecne wyniki LAME też są już znane. Teraz ustaw wartości graniczne między nimi: przewaga PA6T || równowaga ||przewaga G4 || test permutacji || test "najbardziej" LAME.

Już to przecież zrobiłem. Czyżbyś zaczynał krążyć w kółko?

Nie. Skądże znowu. Dlaczego w ogóle miałbym przyjmować takie ograniczenie?
Od samego początku (gdy przytoczyłem Twoją wypowiedź) mówimy o pórówaniu wydajności CPU, a nie samego Altiveca.


W takim razie mówimy o dwóch różnych rzeczach. Teza, którą postawiłem dotyczy wyłącznie AltiVeca, co zresztą jasno wynika z jej treści.

Do tego, że między kolejnymi postami zmieniasz podmiot dyskusji. Ten wątek - tutaj - zacząłem od przytoczenia (moim zdaniem wątpliwej) tezy o wpływie energooszczędności na wydajność PA6T względem G4. W międzyczasie przeszedłeś na analizę różnicy między samymi jednostkami AV - a teraz w ogóle wprowadzasz oderwane od tematu ograniczenia.

Skoro sobie luźno dyskutowaliśmy, temat dyskusji się zmieniał. Konkretem jest teza postawiona przeze mnie w poście 70, oraz warunki testu z postu 75. I nic więcej. Reszta to Twój taniec na falach retoryki.

Konstruktorzy PA6T przyjęli pewne rozwiązania wspierajace wydajność także AV - nie widzę powodu bym nagle miał je przestać uwzględniać, bo G4 ich nie ma.

Przyjąłeś błędne założenie, że stawiam sobie za cel dyskusji udowodnienie, że G4 jest procesorem lepszym niż PA6T. Tak nie jest z dwóch powodów. Po pierwsze pojęcie "lepszości" jest niezdefiniowane. Po drugie, jeżeli zaczniemy je definiować, to rozbijemy je na szereg podzagadnień, gdzie w części z nich punkty zbierze G4, w części PA6T. Gdybyśmy chcieli to ująć syntetycznie, trzebaby wykonać jakąś sumę ważoną, ale znowuż dobór wag okazałby się subiektywny, bo jakim kryterium się kierować? W związku z tym z punktu widzenia logiki dalsze parcie w tym kierunku jest bezcelowe.

Jeśli w temacie wpływu energooszczędności między CPU powołałeś sie na AV i obecne wyniki LAME

Nie powołałem się. Zmieszałeś dwa zupełnie różne wątki, z różnych miejsc portalu.

Zgadza się. Dlatego staram się ustalić jednoznacznie brzmiące warunki byś nie napisał mi tego samego jeśli jakimś cudem moje algorytmy na PA6T uzyskają lepsze rezultaty niż Twoje na G4

Do tego wcale nie trzeba cudu. Sam potrafię napisać taki kod, który praktycznie w ciemno uzyska lepsze rezultaty na PA6T niż na G4. Wystarczy, że wybierzemy algorytm wymagający dostępu do dużego zbioru danych, zwłaszcza dostępu niesekwencyjnego. Kontroler pamięci w PA6T zje wtedy G4 na śniadanie.

Byłbyś w razie czego skłonny udostępnić swój zoptymalizowany pod G4 kod liczący FFT?

Nie mam swojego zoptymalizowanego kodu do FFT. Trochę próbowałem, ale gdy zestawiłem moje wyniki z tym co potrafi biblioteka FFTW, stwierdziłem, że tracę czas...

A to znowu jeszcze inna hipoteza, niż umieściłeś w pierwotnych założeniach eksperymentu.

Jest ona wszakże z eksperymentem zupełnie niezwiązana i nie wpływa na jego założenia.

A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest
niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4
jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.

Zgadza się - sam to bym napisał, gdybyś nie przeszedł od razu do tematu pojedynkowania. Jednak w mojej opinii długi potok nie ma tak rygorystycznego znacznia jak uważasz.


Możliwe, przecież w tezie nie zawarłem stwierdzenia, że to tylko sprawa dłuższych potoków. Żeby próbować ustalać przyczyny, potrzebny jest dla PA6T opis analogiczny do rozdziału siódmego "MPC 7450 RISC Microprocessor Family Reference Manual" z Freescale. Moje próby znalezienia takich materiałów w sieci spełzły na niczym.

A to wydajność całego CPU oceniamy

Trzymałem się tezy z postu 70. A jeżeli chcesz oceniać cały CPU, to sprawa rozbije się o to, o czym pisałem wyżej - o wagi jakie będziemy przykładać poszczególnym elementom oceny. Wynik każdego testu jaki sobie można wyobrazić, w różnym, trudnym nieraz do oceny, stopniu zależy od różnych aspektów konstrukcji procesora. Przecież nawet kod tego nieszczęsnego LAME nie składa się z samych instrukcji AV, dane do obliczeń nie biorą się z powietrza, na pewno też i jednostka główna i FPU są wykorzystywane. A nawet jeżeli opracujemy idealne testy, z których jeden przetestuje tylko AltiVeca, drugi główną jednostkę stałoprzecinkową, trzeci FPU i tak dalej... to znowuż uzyskanie sytnetycznego wyniku będzie sprawą subiektywną :) Chcesz dalej w ten sposób drążyć temat? Droga wiedzie donikąd... Z równym powodzeniem możemy rozważać temat "jabłka, banany, pomarańcze - co jest najlepsze"
[#80] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #75

Wobec niewielkiej różnicy zegarów (1,67 i 1,8 GHz) stawiam więc tezę, że również w jednostkach czasu rzeczywistego G4 uzyska przewagę. Która to przewaga może się znaznaczyć najbardziej w kodzie intensywnie wykorzystujących wektorową jednostkę zmiennoprzecinkową.


trzeba pamietac, ze AOS4 korzysta tylko z jednego rdzenia PA6T, wobec tego wszelkie rozwazania/hipotezy etc. porownujace G4 vs PA6T nie maja raczej sensu.
[#81] Re: Amiga X Party - pierwsze zdjęcia

@gx, post #80

trzeba pamietac, ze AOS4 korzysta tylko z jednego rdzenia PA6T, wobec tego wszelkie rozwazania/hipotezy etc. porownujace G4 vs PA6T nie maja raczej sensu.

Dlaczego? 1 rdzeń PA6T i 1 rdzeń G4 to mniej więcej to samo?
[#82] Re: Amiga X Party - pierwsze zdjęcia

@gx, post #80

trzeba pamietac, ze AOS4 korzysta tylko z jednego rdzenia PA6T, wobec tego wszelkie rozwazania/hipotezy etc. porownujace G4 vs PA6T nie maja raczej sensu.

W kontekście obecnego AmigaOS 4, jak najbardziej mają. W momencie gdy AmigaOS 4 ruszy na dwóch rdzeniach, sytuacja ulegnie zasadniczej zmianie. Z drugiej strony uważam, że to co potrafi procesor to jedno. Sposób w jaki programy potrafią go wykorzystać, to drugie.

Patrząc z perspektywy, porównywanie PowerBooka z X1000, nawet w czysto amigowym aspekcie, to też niewiele ponad rozrywkę intelektualną. MorphOS nie działa na X1000, AmigaOS 4 nie działa na PowerBooku... To coś jak określanie kto jest lepszy w sztuce kochania, na podstawie długości członka, w dodatku różnica wynosi jakieś pół centymetra
[#83] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #68

czy możesz zawczasu przeczytać i skomentować ten artykuł

Owszem, właśnie zakończyłem lekturę. Jedyne, co mogę skomentować, to wyniki ze strony 20. Mamy tam jakąś aplikację o nieznanym (patrz strona 18) algorytmie, która coś tam robi, zapewne przetwarza jakieś obrazy. Po normalizacji do jednego rdzenia i 1,000 GHz wyszły mi takie wyniki (z poprawką na to, że wartości czytałem z wykresu): w wolniejszej wersji algorytmu wydajność PA6T to 1,6 wydajności G4, w szybszej – 1,35 wydajności G4. Algorytmu nie znamy, to co napiszę, jest czystą spekulacją: zakładam, że aplikacja przetwarza obrazy, zapewne w czasie rzeczywistym (successive image frames i sustain the required frame-rate, s. 19.). To oznacza duże ilości danych, dzięki czemu PA6T wykazuje się swoimi dobrymi wynikami kontrolera pamięci. Ciekawe, że dwie różne biblioteki przetwarzania wektorowego wykazują spore różnice wydajności, o ile dobrze zrozumiałem, sam algorytm jest ten sam, ale używa różnych bibliotek. Sprawą ważną jest też kompilator, tutaj możesz poczytać jak walczyłem z GCC 4.0.2 i jego masakrycznym schedulerem. GCC 4.4.x się trochę poprawił pod tym względem, wciąż jednak ręczny tuning w GCC 2.95.4 pozwala wycisnąć z 7447A te parę procent, chociaż pewnie kosztem osiągów na 7400/7410, a i na tym buja MorphOS, więc generalnie teraz zdaję się na GCC 4.4.5.

Ostatnia aktualizacja: 28.02.2012 15:09:12 przez krashan_

Ostatnia aktualizacja: 28.02.2012 15:09:43 przez krashan_
[#84] Re: Amiga X Party - pierwsze zdjęcia

@recedent, post #72

Taka po byku bitwa była, gdzie się te chrześcijany wzajemnie przez cały dzień wyrzynały, a przecie te "chrześciajany" są alegorią nas samych :) . Maćko i Zbyszko, tudzież Jagienka mieli zupełnie OK, ale to już zupełnie inna analogia.
[#85] Re: Amiga X Party - pierwsze zdjęcia
Z3 - ten stateczek (czołg) jest zdaje się z Wasted Dreams.
[#86] Re: Amiga X Party - pierwsze zdjęcia

@recedent, post #72

A może i pax było. To tak z głowy poleciało i nie sprawdziłem, ale wymowa ta sama.

@ Wali7
Ostatnio zacząłem czytać książkę I. Kraszewskiego "Krzyżacy 1410". Streszczenie za Wikipedią :
Akcja powieści toczy się w latach 1409-11. Autor ukazał narastające napięcie pomiędzy Zakonem Krzyżackim, a zjednoczoną Polską i Litwą, którego finałem była wielka wojna zakończona bitwą pod Grunwaldem. Głowną bohaterką powieści jest piękna Ofka, szpieg na służbie Krzyżaków, która z fanatyzmem i poświęceniem nie cofającym się przed żadną zbrodnią, dąży do wspomożenia armii walczącej z Polakami. Klęska pod Grunwaldem stanowi dla niej osobistą tragedię z którą nie może się pogodzić...

Krzyżacy 1410. Obrazy z przeszłości

PS. Co do tego wyrzynania, to badacze średniowiecza (np. profesorowie UAM z mojego podyplomu wydział Historii) twierdzili, że w tamtych czasach rycerze to się w niewolę dla okupu brali a nie wycinali. Tak na logikę bycie rycerzem to bardzo drogi interes (cały rynsztunek itd.), więc nie opłacało się zabić tylko wziąć w niewolę i zarobić. (Tę tezę zdaje się potwierdzać J.Chryzostom Pasek w swoich pamiętnikach, gdy opisuje jedna z bitew i to jak sobie wybrał przeciwnika - tego, za którego liczył, że zgarnie duży okup). Gdyby każda bitwa kończyła się regularną rzezią jak na filmach, to po dziesięciu takich bitwach na 100% ktoś zostaje bez rycerstwa, a to chyba kiepski pomysł (obrona kraju, czas wyszkolenia kolejnego rycerza, którym nie każdy może zostać). No to teraz OT zrobiłem.



Ostatnia aktualizacja: 28.02.2012 21:00:27 przez Ender
[#87] Re: Amiga X Party - pierwsze zdjęcia

@krashan_, post #79

Jeżeli precyzujemy eksperyment, to siłą rzeczy muszą się pojawić dodatkowe elementy. To nieuniknione.

Dlatego bardzo bym chciał, żebyś zajął się precyzowaniem założeń, które podałeś w wiadomościach #64 i #67, a nie znacznie je zmieniał tak jak to zrobiłeś w #70. Gdybyś od razu napisał co w tej wiadomości - ja też bym inaczej odpowiedział. Tak jednak nie było - zaproponowałeś eksperyment w znaczeniu wiadomości #64. Bądź teraz konsekwentny. Wiadomości #70 i #75 są pewnie bardzo ciekawe, szkoda tylko, że mało związane z treściami, które sprokurowały Cię do zaproponowania eksperymentu. Całkiem możliwe, ze nawet miałeś te myśli w głowie pisząc pierwsze wiadomości - ale sorry, czytania w myślach jeszcze nie potrafię. A napisałeś co innego niż #70.

a liczy się tylko "throughput" (...) O ile mam takie dane dla 7447A, o tyle nie udało mi się znaleźć odpowiednika Freescale'owskich "User's Manual" dla PA6T. Jakbyś miał, to będę wdzięczny za linka.

Ok. Super. Po prostu ciekawi mnie, że tk piszesz o PA6T, jakbyś te materiały jednak już miał (nie, samo odniesienie do G5 nie wystarczy, jeśli nie uwzględnisz różnic w wydajności RAM...)

Teraz ustaw wartości graniczne między nimi: przewaga PA6T || równowaga ||przewaga G4 || test permutacji || test "najbardziej" LAME. (...)
Już to przecież zrobiłem. Czyżbyś zaczynał krążyć w kółko?

Oj nie... Chciałbym żebyś to zrobił po raz pierwszy.
Jak na razie zaproponowałeś jakiś dziwny podział nie wiadomo skąd. Skończmy więc już z dziwnymi i daj jakiś dobry - spójny ze stwierdzeniami jakie zaproponowałeś w wiadomościach #64 i #67 ;)

W takim razie mówimy o dwóch różnych rzeczach. Teza, którą postawiłem dotyczy wyłącznie AltiVeca, co zresztą jasno wynika z jej treści.

Intrygujące, bo ile razy czytam kluczową tu wypowiedź z wiadomości #64: "Tak czy inaczej najmniej PA6T dostanie w plecy przy aplikacjach altivecowych ostro męczących jednostkę permutacji (kryptografia), a najbardziej przy zmiennoprzecinkowych (hello LAME...). " - to tyle razy widzę, że odnosisz się do PA6T i gdzie ten CPU dostanie w plecy mniej, a gdzie więcej. Nie ma tu ograniczenia wyłącznie do altiveca co ni stąd, ni zowąd - zrobiłeś parę wiadomości później.

Skoro sobie luźno dyskutowaliśmy, temat dyskusji się zmieniał. Konkretem jest teza postawiona przeze mnie w poście 70, oraz warunki testu z postu 75. I nic więcej.

To co możnaby nazwać "luźną dyskusją" to raptem 2 wiadomości po których zaproponowałeś ekepryment. Gdzie można zaobserwować "zmianę tematu dyskusji" na przestrzeni 2 wiadomości? Przecież to nawet nie dyskusja, tylko pytanie i odpowiedź
To co było później to tylko moje pytanie, dlaczego teza z #64 (na którą zaproponowałeś eksperyment) i #70 (po tym jak poprosiłem o sprecyzowanie) się różnią. Nadal czekam na odpowiedź.
Jak na razie uzyskuję coś w stylu: "no bo co innego miałem na myśli". Pamiętasz rozmowę o "modelu programistycznym"? Znowu co innego miałeś na myśli

Reszta to Twój taniec na falach retoryki.

Przypominanie co sam napisałeś kilka wiadomości wcześniej to taniec na falach retoryki? Najnormalniej jakie ja chwyty poniżej pasa stosuję! Przypominam ludziom co sami napisali! Niesłychane!
(jakbyś miał wątpliwości: TO był taniec na fali retoryki )

Przyjąłeś błędne założenie, że stawiam sobie za cel dyskusji udowodnienie, że G4 jest procesorem lepszym niż PA6T.

Sorry. To ta wypowiedź o dostawaniu w plecy przez PA6T w aplikacjach altivecowych mnie zmyliła. Muszę zapamiętać, że jak coś piszesz, to tak naprawdę nie masz tego na myśli...

Po pierwsze pojęcie "lepszości" jest niezdefiniowane.

No to całe szczęście, że pojęcie "dostawania w plecy" jest za to zdefiniowane... a nie, nie jest. do tej pory nie wyjaśniłeś co miałeś na myśli w wiadomości #64.

Po drugie, jeżeli zaczniemy je definiować, to rozbijemy je na szereg podzagadnień, gdzie w części z nich punkty zbierze G4, w części PA6T.

No i jak na razie zaproponowałeś eksperyment polegający w wybraniu jednego podzagadnienia korzystnego dla G4. Możesz mi wyjaśnić jak możesz jednocześnie radzić by coś robić i by tego nie robić? Jestem naprawdę zafascynowany

Nie powołałem się. Zmieszałeś dwa zupełnie różne wątki, z różnych miejsc portalu.

Noo... Ja napisałem o energooszczędności w wiadomości #57 (odnosząc się przy okazji do znajomości specyfikacji), a ty w odpowiedzi zrobiłeś w #64 analizę altiveca podsumowując jak w tych aplikacjach sprawdzi się PA6T. Serio twierdzisz, że wiadomości #57 i #64 to dwa różne miejsca portalu, a to że w #64 piszesz o altivecu, wcale nie oznacza, że piszesz o altivecu? Doprawdy ciężko jest mi pojąć takie rozumowanie....

Do tego wcale nie trzeba cudu. Sam potrafię napisać taki kod, który praktycznie w ciemno uzyska lepsze rezultaty na PA6T niż na G4.

Czekaj, czekaj.... czyli teza podsumowująca #64, że PA6T uzyska rezultaty złe albo gorsze jest jednak nieprawdziwa....? I nie ma problemu zrobić aplikację, która na PA6T będzie działać lepiej? To nad czym w ogóle chciałeś eksperymentować w #67? a no tak.... nad czymś innym :)

A zgodnie z moją ścisłą tezą postawioną w poprzednim poście, taka optymalizacja jest
niemożliwa, ponieważ względna (z taktu zegara) wydajność AltiVeca w PA6T mniejsza niż w G4 jest jego cechą konstrukcyjną, podobnie jak w przypadku G5 zresztą.

Po czym odrzucasz wszystkie przypadki wynikające z szybkiego dostępu do pamięci, gdy okazuje się, że ciut sprawniejszy element nie jest w stanie okazać swej przewagi, bo nie da się go nakarmić danymi. Sorry. Co z tego że Altivec w G4 może ciut szybciej przetwarzać dane, jeśli równocześnie ciut częściej ich nie ma. Obawiam się, że po "szybszym nic nie robieniu na pamięci" zaraz udowodnisz "szybsze nieprzetwarzanie danych". Normalnie super rzetelne testy...

Trzymałem się tezy z postu 70.

o to wielka szkoda, że odpowiadając na post #64 nie przewidziałem, że 6 wiadomości dalej zaczniesz pisać o czymś innym.

Chcesz dalej w ten sposób drążyć temat? Droga wiedzie donikąd...

Ja tylko chcę się dowiedzieć, dlaczego zaproponowałeś pewien eksperyment, a potem zacząłeś zmieniać jego zakres. Czy ten pierwszy temat nie był dobry? Jak tak, to dlaczego po prostu tego nie napiszesz? Bo jak na razie pierwotnych założeń nie odwołałeś.
Inna sprawa, że wątpię, by te kolejne miały dać jakikolwiek obraz Altiveca w obu prockach - to rzeczywiście droga donikąd... ale to TY ją forsujesz
[#88] Re: Amiga X Party - pierwsze zdjęcia

@c3h6, post #85

@C3H6
Zgadza się - punkt!

Stan bieżący:
Z1: kompletne
Z2: 1 tytuł
Z3: 1 tytuł
Z4: 1 tytuł
Z5: kompletne
[#89] Re: Amiga X Party - pierwsze zdjęcia

@Radov, post #88

Z4 - Ishar 3
[#90] Re: Amiga X Party - pierwsze zdjęcia

@Ender, post #86

Prawda. Ale bywały wyjątki od tej reguły, bitwa pod Grunwaldem może być zaliczona do nich: na 50 000 żołnierzy biorących udział w bitwie zginęło ok. 10 000, 20% to niezła jatka. Drugą sprawą jest sprawa śmierci prawie wszystkich dostojników Zakonu (Braci Zakonnych) - zamiast wziąć ich w niewolę i z zyskiem uwolnić, zostali zabici (wg niektórych już po bitwie). Goście zakonni z Zachodu raczej uniknęli tego losu i zostali wymienieni za okup.
Na stronie www.PPA.pl, podobnie jak na wielu innych stronach internetowych, wykorzystywane są tzw. cookies (ciasteczka). Służą ona m.in. do tego, aby zalogować się na swoje konto, czy brać udział w ankietach. Ze względu na nowe regulacje prawne jesteśmy zobowiązani do poinformowania Cię o tym w wyraźniejszy niż dotychczas sposób. Dalsze korzystanie z naszej strony bez zmiany ustawień przeglądarki internetowej będzie oznaczać, że zgadzasz się na ich wykorzystywanie.
OK, rozumiem