@Lorak,
post #5
Jakosc jest dlatego tak kiepska, poniewaz tzw. sygnal resztkowy nie byl kompresowany. W zastosowanym algorytmie kompresji mowy zastosowany jest schemat lpc10, tzn.:
- obliczam wspolczynniki filtra, ktore odpowiadaja krtani, ustom, tchawicy itp.
- wzbudzenie, ktore jest powietrzem przechodzacym przez ww uklad, odpowiada wzbudzeniu filtra
Kiepska jakosc bierze sie stad, ze wzbudzenie filtra jest znacznym uproszczeniem, tzn. rozrozniam tylko dwa stany - dzwieczny (ciag impulsow o amplitudzie rownej 1) i bezdzwieczny (szum gaussowski).
Celem pracy jest stworzenie kodera o mozliwie najnizszej sredniej bitowej przy zrozumialosci przekazu (za zrozumialosc przekazu w glownej mierze odpowiada filtr traktu glosowego).
Ktos sie pytal jak zamierzam zinterpretowac wyniki skoro nie slychac roznicy. Dlatego wlasnie potrzebuje wynikow od jak najwiekszej ilosci osob - jedna osoba moze np. nie slyszec roznicy miedzy plikami podczas gdy druga bedzie miala subiektywne wrazenie,ze sie roznia. Wyniki zostana pozniej usrednione :)