[#1] Konwerter UTF-8 -> APL
Czy jest na Amidze jakiś tool, który konwertowałby teksty ze standardu UTF-8 na AmigaPL ?

Ostatnia aktualizacja: 09.02.2022 11:52:43 przez MarX
[#2] Re: Konwerter UTF-8 - APL

@MarX, post #1

Masz https://github.com/jens-maus/libcodesets, ale ta biblioteka (i dołączony tool) jest tak zj eba na, że jeśli masz chwile czasu to wypadałoby ją poprawić tzn napisać na nowo obsługę utfów. Niestety w systemach amigowych tylko charset.library z MorphOSa ma sensownie napisaną konwersję utfów (o ile pamiętam nawet z ligaturami). Poza tym masz 256 kodów w amiga-pl, możesz zrobić tablicę utf8 -> amigapl i jechać na niej. Pominie to jakieś sytuacje w stylu ý który mógłbyś w dobrej konwersji zamienić na y, ale 90% zagranicznych tekstów i tak jest po angielsku. Możesz także skorzystać z iconva, zamienić na iso2 a potem z iso2 na amigapl. Tu raczej toole są.

Ostatnia aktualizacja: 09.02.2022 12:22:29 przez michal_zukowski
[#3] Re: Konwerter UTF-8 - APL

@MarX, post #1

Polecam KonwersjaLib autorstwa Grzegorza Królika. Jest to cała biblioteka do konwersji zawierająca program Konwerter.

Można dodawać nowe standardy polskich znaków, w razie potrzeby.

Z tego konwertera korzystałem cały czas w ostatnich latach kiedy pisałem artykuły do Amigazynu na mojej Amidze.
[#4] Re: Konwerter UTF-8 - APL

@Hexmage960, post #3

Markowi chodziło o konwersje utf8->amigapl
[#5] Re: Konwerter UTF-8 - APL

@michal_zukowski, post #4

Dokładnie, ten konwerter chyba nie obsługuje UTF-8

OK, to chyba rzeczywiście pozostaje konwersja na ISO a potem na APL. Dzięki chłopaki za odzew.

Ostatnia aktualizacja: 09.02.2022 12:36:31 przez MarX
[#6] Re: Konwerter UTF-8 - APL

@MarX, post #5

Słusznie, najpierw należy skonwertować z UTF-8 do ISO albo Windows, które to pliki KonwersjaLib już obsłuży.

Ostatnia aktualizacja: 09.02.2022 12:45:11 przez Hexmage960
[#7] Re: Konwerter UTF-8 - APL

@MarX, post #1

Na Windowsy jest taki program nazywa się Gżegżółka XP, wiem, że szukasz na Amigę, ale może jakoś Ci to pomoże.
[#8] Re: Konwerter UTF-8 - APL

@MarX, post #1

Możesz tego spróbować, zrobiłem to w sumie dość nie dawno. Aha musisz sobie to skompilować na ami, ale nie powinno być problemu.
https://github.com/tdolphin-org/UTF-8.to.AmigaPL.converter
1
[#9] Re: Konwerter UTF-8 - APL

@MarX, post #1

Transfont z Aminetu.
Trzeba tylko odpowiednią tablicę konwersji napisać, jak przykładowe zawarte tam w programie.
[#10] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #8

Możesz tego spróbować, zrobiłem to w sumie dość nie dawno. Aha musisz sobie to skompilować na ami, ale nie powinno być problemu.
https://github.com/tdolphin-org/UTF-8.to.AmigaPL.converter

Dzięki! Bardzo sympatyczny tool. Właśnie o coś takiego mi chodziło OK. Lekko go zmodyfikowałem, skompilowałem i podpiąłem przed chwilą pod ikonkę w DOpusie5. Działa elegancko . Co prawda nie radzi sobie zbyt dobrze z apostrofami, ale jak na moje potrzeby jest jak najbardziej OK.
1
[#11] Re: Konwerter UTF-8 - APL

@MarX, post #10

Jesli dobrze oamietam AmitextPro 2.0 mial taka mozliwosc
[#12] Re: Konwerter UTF-8 - APL

@MarX, post #1

Sprawdź poniższy skrypt ARexxa. Napisany na kolanie, nie testowany, *** nadpisuje plik źródłowy! ***

https://szybkiplik.pl/BTkzEKzH43
[#13] Re: Konwerter UTF-8 - APL

@MarX, post #10

Fajnie, że się przydał.
A jaki jest problem z apostrofami?
[#14] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #13

A jaki jest problem z apostrofami?

Sorry, nie apostrof a cudzysłów. Wygląda to tak jak na rysunku:

[#15] Re: Konwerter UTF-8 - APL

@MarX, post #14

czy możesz mi udostępnić gdzieś taki plik tekstowy? bo tych znaków cudzysłowa chyba jest kilka różnych w UTF-8
[#16] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #15

czy możesz mi udostępnić gdzieś taki plik tekstowy? bo tych znaków cudzysłowa chyba jest kilka różnych w UTF-8

Pewnie, tu jest plik z przykładowym cudzysłowem górnym i dolnym.
[#17] Re: Konwerter UTF-8 - APL

@MarX, post #16

dodałem obsługę tych cudzysłowów (tzw lewy i prawy), zamieniane są na standardowy cudzysłów górny
1
[#18] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #17

dodałem obsługę tych cudzysłowów (tzw lewy i prawy), zamieniane są na standardowy cudzysłów górny

Dzięki, teraz działa wyśmienicie! OK Na swoje potrzeby zrobiłem forka Twojego repozytorium. Zależało mi, żeby po konwersji zapisywać plik z tą samą nazwą i przyrostkiem .apl (w tym samym katalogu). Dodałem też instrukcję podpięcia Twojego programu pod akcję w Dopusie. Link dla zainteresowanych:

https://github.com/marekhac/UTF-8.to.AmigaPL.converter
2
[#19] Re: Konwerter UTF-8 - APL

@MarX, post #18

ale coś w swoim repo nie masz moich zmian z cudzysłowami, usunąłeś je w commicie
https://github.com/marekhac/UTF-8.to.AmigaPL.converter/commit/3fe5c94df1214bedc482e4bc6926dfea08e22d18
[#20] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #19

Zgadza się, zakomitowałem wcześniej plik ze starą wersją. Dzięki za czujność. Poprawione
1
[#21] Re: Konwerter UTF-8 - APL

@Rafael/ARMO, post #8

Uprzejmie donoszę, że Rafael/ARMO wypuścił nową wersję swojego konwertera UTF8 -> AmigaPL.

ZMIANY:

- poprawiona konwersja kodu zakończenia linii
- pojedynczy znak wielokropek w UTF konwertowany jest na trzy pojedyncze kropki
- cudzysłowy drukarskie konwertowane są na zwykłe
- pauza drukarska na myślnik

... i pewnie jeszcze trochę innych bajerów

UŻYCIE:

Jeśli program uruchomimy podając tylko nazwę pliku do konwersji to w wyniku dostaniemy skonwertowany plik z sufiksem .apl

np.

utf8toAmigaPL tekst.txt

wygeneruje

tekst.txt.apl

można też podać nazwę pliku wyjściówego np.

utf8toAmigaPL tekst.txt tekst_apl.txt

DOWNLOAD: https://github.com/tdolphin-org/UTF-8.to.AmigaPL.converter/releases/tag/0.1.0
REPOZYTORIUM NA GITHUB: https://github.com/tdolphin-org/UTF-8.to.AmigaPL.converter

Ostatnia aktualizacja: 08.03.2023 21:52:09 przez MarX
[#22] Re: Konwerter UTF-8 - APL

@MarX, post #21

Ogólnie to fajnie jakby ktoś przejął od jensa-mausa libcodeset
https://github.com/jens-maus/libcodesets
bo o ile podstawy tej biblioteki mają jakiś sens to implementacja utf8 woła o pomste do nieba.
Robienie utilków oczywiście poprawne, ale taki lib można użyć wszędzie (tzn teraz to nigdzie bo kiepawy).

MorphOS ma charset.library i mamy tam rozwijanie ligatur, konwertowanie utf8 do postaci normalnej etc.
1
Na stronie www.PPA.pl, podobnie jak na wielu innych stronach internetowych, wykorzystywane są tzw. cookies (ciasteczka). Służą ona m.in. do tego, aby zalogować się na swoje konto, czy brać udział w ankietach. Ze względu na nowe regulacje prawne jesteśmy zobowiązani do poinformowania Cię o tym w wyraźniejszy niż dotychczas sposób. Dalsze korzystanie z naszej strony bez zmiany ustawień przeglądarki internetowej będzie oznaczać, że zgadzasz się na ich wykorzystywanie.
OK, rozumiem