@anioł
Ja czytalem tylko Krashana A kolege Radova odpuscilem niestety bo lekko mnie mdli od jego wywodów,ale proszę ,żeby sie nie obrażałOK
No trochę mi przykro, że mdli - ale się nie obrażam :) Ja doskonale rozumiem, że to temat trudny - a forma w jakiej będzie prowadzona dla osób postronnych będzie dziwna. Dlatego wolałem prowadzić ją osobiście na Amiwawie, a że jednak wyszło tutaj....
@krashan_
Żeby wiadomości nie rozrastały się w nieskończoność postaram się je pogrupować na najważniejsze wątki. Jakbym jakiś istotny pominął - nie wahaj się go przywrócić
To nieprawda. W #70 je właśnie sprecyzowałem, w #75 dołożyłem Ci wartości numeryczne kryteriów. (...) Jestem konsekwentny. Wiadomości #70 i #75 są uściśleniem #64 i #67. (...) Patrz posty #70 i #75.
Tłumaczę:
1. w wiadomości #64 dokonałeś wstępnego podziału obszarów wydajności PA6T w aplikacjach na dwie klasy:
- "dostać w plecy" (DWP) oraz
- "bardzo dostać w plecy" (BDWP)
To co napisałeś w wiadomościach kolejnych spowosodowało, że mam wrażenie, że wcześniej podany obszar wydajności "DWP" zawiera się jednak w (BDWP). Dlatego chciałem, żebyś to PRECYZYJNIE wyjaśnił, by uniknąć sytuacji w której aktywne będą jednocześnie dwie klasyfikacje.
2. Podział graniczny zaproponowany w kolejnych wiadomościach jest bardzo wąski, można go sprowadzić do klasyfikacji binarnej. Wg mnie nie ma on większego sensu i nie jestem pewien, czy jest użyteczny w "eksperymencie".
3. Dlatego vhciałbym, żebyś (w takim razie - jeszcze raz) wypełnił tę klasyfikację, ale w formie, którą podałem kilka wiadomości później, z jednoznacznie zaznaczonymi przedziałami wartości.
4. Chciałbym, ale już niekoniecznie, żeby obszary DWP i BDWP z wiadomości #64 wypadały także w tych obszarach w nowej klasyfikacji. Jeśli jednak to pierwsze to był luźny podział, może dokonany na fali emocji - to ok. Po prostu to napisz i nie będę tego oczekiwał.
Wcale Cię nie ciekawi, z tego prostego powodu, że nigdzie tak nie piszę.
W wiadomości #64 jednoznacznie oceniłeś oba układy za pomocą analizy specyfikacji ALtiveca - więc jednak to zrobiłeś. Uważam, że z tego obrazka możesz również wywnioskować jaki jest najbardziej niekorzystny przypadek potrzebnego latency - i na jego podstawie możesz ocenić, czy da się zoptymalizować kod by działał porównywalnie wydajnie na PA6T. Załóżmy, że parametry czasowe ze względu na potok są (strzelam) 2x gorsze dla PA6T. Pytam sie więc:
- czy takie parametry uniemożliwią optymalne wykorzystanie potoku, czy wciąż będzie to możliwe?
- czy też potrzeba na to eksperymentu?
- jeśli eksperymentu, to dlaczego dokonałeś oceny przed eksperymentem, na podstawie 1 testu (LAME) nawet niezgodnego z jego założeniami?
Co można poradzić na Twój ośli upór. Post #64 jest tylko o AltiVecu, czy to dociera do Ciebie (...) Widzisz słowo "altivecowych" w pierwszym zdaniu, czy też może umknęło ono Twojej uwadze? Jest tu ograniczenie wyłącznie do AltiVeca. (...) Od postu #64 w dół tematem jest AltiVec. (...) To proste. Tylko AltiVec był przedmiotem całej tej dyskusji. Od postu #64 poczynając. (...) Odpowiedź jest prosta. One się nie różnią. W #70 następuje sprecyzowanie tezy i sformułowanie jej w nieco bardziej formalnym języku.
1. Grzegorzu - w podsumowaniu wiadomości #64 do której JA z kolei się odnosiłem jest nie tylko słowo "Altivec". Tam jest wyrażenie "Aplikacje Altivecowe". I ocena, że na PA6T będą działać gorzej niż na G4.
Moje pytanie było: skąd takie założenie? Długi potok Altivecu to nie jedyny element wpływający na wydajność tych aplikacji - więc skąd taki wniosek?
Zgadzam się, że i ja mogłem przesadzić swoim stwierdzeniu podsumowującym odpowiedź na #64 - ale dla tego też z zainteresowaniem przyjąłem propozycję eksperymentu. Jeśli jednak, jak raczej wynika z kolejnych, wiadomości mamy się ograniczyć TYLKO do Altivecu i pominąć usprawnienia PA6T pozwalające efektywniej wykorzystać PA6T - to raczej nie mamy o czym mówić..
2. To co pojawiło się w kolejnych wiadomościach to zmiana słowa "aplikacje" na "algorytmy". To są dwa różne obszary funkcjonalne - z czego ten pierwszy warto przetestować, a ten drugi: nie ma większego sensu, bo nie przekłada się na rzeczywistą wydajność całego układu.
Moje pytanie było: dlaczego gdy odniosłem się do "aplikacji altivecowych" - ty zaproponowałeś eksperyment na "algorytmy altivecowe"? "Aplikacje altivecowe" to szersze pojęcie niż "algorytmy altivecowe" i nie możesz tak po prostu sobie ich zmieniać.
3. Dlaczego chcesz eksperymentować przy ściśle określonych założeniach wykluczających korzystne dla PA6T rozwiązania? Można napisać także i aplikację i "algorytm altivecowy", które z tych rozwiązań będą korzystać. Można tez próbować tego nie robić - ale i tak będą miały wpływ na wynik.
Ech... Nad AltiVecem chciałem eksperymentować. "Zaproponuj zagadnienie do zaimplementowania w AltiVecu.". Jak mam to jeszcze napisać? Rozstrzelonym tekstem, na czerwono, a może cyrylicą?
Pisząc tu "nad czym w ogóle" zastosowałem emfazę, która miała brzmieć jak "Czy widzisz sens w...". Piszę więc jasno: jaki jest sens eksperymentowania nad "Altiveciem", przy założeniach jakie podajesz - jeśli wydajność w rzeczywistych zastosowaniach i tak będzie wypadkową wydajności interfejsu pamięci?
Sugerujesz, że to nicnierobienie na pamięci i szybsze nieprzetwarzanie danych? To może z faktami sobie teraz podyskutujesz?
1. Sugeruję, że przy próbie sprecyzowania warunków eksperymentu odrzucasz te, które są korzystne dla PA6T, a przy których G4 mimo, że chciałoby liczyć - nie miałoby czego. W efekcie czego, w istotnej części rzeczywistych przypadków, AV w G4 NIE przetwarza danych.
2. Fakty też są takie, że odwołujesz się do testu niezoptymalizowanego algorytmu, a traktujesz go jako potwierdzenie różnic konstrukcyjnych.
3. Jeśli chcesz zbadać różnice konstrukcyjne Altiveców (już nawet nie na polu wydajności aplikacji altivecowych, tylko jakichś specyficznych układów) to właśnie o istotnym elementem jest to, że PA6T potrafi wydajniej karmić AV danymi. Nie możemy tego odrzucić tylko dlatego, bo w G4 tego nie ma.
Sprytne uogólnienie, ale pamiętaj, że uogólnianie tezy nie podtrzymuje jej prawdziwości. Między "istnieje takie X, że zachodzi"; a "dla każdego X zachodzi" jest zasadnicza różnica, którą właśnie raczyłeś zignorować.
Grzegorzu - proszę, w takim razie wyjaśnij. W wiadomości #64, po analizie altiveca, napisałeś że na PA6T **Aplikacje Altivecowe** będą działać gorzej, albo jeszcze gorzej. Moim zdaniem to ty zastosowałeś to uogólnienie. Owszem: istnieją takie aplikacje, które na PA6T będą działać gorzej niż na G4 - ale też są takie aplikacje altivecowe, które na PA6T będą działać lepiej - ale to nie to napisałeś. Właśnie *TAM* dokonałeś uogólnienia.