Úvod: ---- Toto je prvé verejné vydanie podpory slovenèiny pre kontrolu pravopisu aspell. Je výsledkom môjho viac ako roèného úsilia o vytvorenie celkom slu¹nej databázy pre aspell. Významná èas» vznikla po mojom zapojení sa do revízie podpory slovenèiny programu Ispell. V tejto verzii je 675 741 slov, èo som pova¾oval za dostatoèné mno¾stvo, aby bolo mo¾né urobi» prvé vydanie. Pokiaµ viem, slovník by nemal obsahova» nesprávne slová, resp. nesprávne tvary slov, ale moja osobná skúsenos» s rôznymi slovníkmi (ak komerènými) je taká, ¾e niè nie je dokonalé a chyba sú v ka¾dej µudskej práci. Preto, ak nájdete chybu informujte ma o nej na zdpo@mailbox.sk. Verím, ¾e spoloèným úsilím budeme môc» vytvori» slovník, ktorý sa bude pribli¾ova» k dokonalosti. ©írenie: ------- ASpell-slovak je ABSOLÚTNE BEZ ZÁRUKY. Ide o voµne ¹íriteµný softvér a jeho ¹írenie za istých podmienok je vítané; podrobnosti získate v súboroch COPYING, Copyright alebo gnu.sk.html (slovenský preklad V¹eobecnej zverejòovacej licencie - GNU General Public Licence, od Juraja Kolesára). Cieµ: ---- Dlhodobým cieµom pre aspell je vytvorenie dvoch základných slovníkov: prvý, hlavný, by sa prísne pridr¾iaval Pravidiel slovesného pravopisu a druhý by bol roz¹irujúci, ktorý by pokrýval èasto pou¾ívané slová, ktoré nie sú zahrnuté do Pravidiel. Upozoròujem, ¾e Pravidlá slovanského pravopisu pokrývajú je èas» slovenèiny. Vlastnosti: ---------- Hlavným cieµom Aspellu je lep¹ie vyhµadávanie 'ponúknutých slov' pri kontrole pravopisu. To znamená, ¾e pokiaµ aspell nájde nesprávne slovo, tak by vám mal ponúknu» to najvhodnej¹ie (správne) na èo najvy¹¹om mieste v ponuke. Aspell sa tie¾ sna¾í uèi» z va¹ich chýb - zaznamenáva va¹e preklepy a podµa nich sa sna¾í potom v budúcnosti nájs» najvhodnej¹ie slovo pri chybe. Pokiaµ je vytvorený osobný slovník (.aspell.slovak.pws) tento slovník sa kontroluje pri chybe ako prvý. Aspell umo¾òuje vytvori» pravidlá, ktoré mu pomáhajú pri hµadaní spraávnych slov. Je to u¾itoèné zvlá¹» keï sa slová inak vyslovujú ako pí¹u. ®iaµ pri príprave tohoto vydania som zistil, ¾e táto funkcia mi spôsobuje pád Aspellu pri slovenèine a preto je vypnutá. Problém sa mi nepodaril zatiaµ vyrie¹i». Z pou¾ívateµského hµadiska sa mi oveµa lep¹ie pracuje (hlavne k KDE aplikáciách) s aspellom ako s ispellom. Ale to je èisto subjektívny dojem. Je to jediná kontrola pravopisu, ktorá mi funguje v programe LyX. Pokiaµ viem, ako jediný umo¾òuje pou¾íva» viac slovníkov pre jeden jazyk. Pridanie ïal¹ieho slovníka je jednoduché. Vytvorte si svoj vlastný zoznam tak, aby jedno slovo bolo na jednom riadku. Tento zoznam usporiadajte ('sort -u -f <vas.zoznam> usporiadany.zoznam') a potom vygenerujete nový slovník pomocou príkazu: 'aspell --lang=slovak create master ./slovak-moj-slovnik <usporiadany.zoznam' Potom skopírujte 'slovak-moj-slovnik' do /usr/lib/aspell ('cp ./slovak-moj-slovnik /usr/lib/aspell') a do súboru /usr/lib/aspell/slovak.multi pridajte riadok "add slovak-moj-slovnik" Oproti Ispellu má Aspell hlavne tieto nevýhody: - je viac nároènej¹í na pamä» - nemá affix kompresiu a preto sú slovníky také veµké (aktuálny skompilovaný slovník má cez 17 Mb aj po kompresii je veµkos» veµmi veµká) a preto je aj pridávanie nových slov také pomalé (v¹etky tvary musia by» ruène vlo¾ené). Na druhú stranu je práve posledne spomenutá nevýhoda vlastne výhodou voèi slovenskej podpore ispellu - affix kompresia je tak zlo¾itá, ¾e v istých prípadoch Ispell generuje vïaka affix kompresií nesprávne tvary slov. - podµa niektorých reakcií je aspell pomal¹í ako Ispell (resp. je nároènej¹í na hardvér). V ka¾dom prípade ja som aspell zaèal pou¾íva» na pentiu 90MHz so 40M Ram (základná databáza asi 40 000 slov) a po upgrade na Duron 950MHz 256M Ram som zaznamenal zrýchlenie iba pri generovaní (kompilácii slovníka), ale nie pri samotnej kontrole. Tak¾e teoreticky by nemal by» problém pou¾íva» ASpell aj na slabom hardvére. TIP: Pokiaµ je aspell pomalý, skúste si vytvori» svoj vlastný slovník (napr. tak, ¾e zmeníte súbory z tohoto projektu), ktorý bude obsahova» iba vami pou¾ívané slová. Zo skúsenosti viem, ¾e èlovek málo kedy pou¾íva viac ako 20 000 slov v písomnom prejave a preto slovník o veµkosti 600 tisíc slov je pre vás zbytoèný resp. ho mô¾ete pou¾íva» iba obèas na kontrolu vá¹ho zoznamu slov). Ïal¹ie informácie (s angliètine) by ste mali ma» v /usr/share/doc/aspell-0.33.7.1/aspell/man-html/index.html In¹talácia: ---------- Predpoklad: In¹talaèný skript je dos» jednoduchý a predpokladá, ¾e máte nain¹talovaný program aspell v /usr (t.j. nie napr v /usr/local). Pokiaµ ste in¹talovali aspell z rpm archívu alebo priamo bol nain¹talovaný pri in¹talácií va¹ej distribúcie, nemali by ste ma» ¾iadne problémy. Rozbaµte archív aspell-slovak-1.0.tar.gz a spustite skript install tar zxfv aspell-slovak-1.0.tar.gz cd aspell-slovak-1.0 ./install V /usr/share/doc/aspell-slovak sa nachádza uká¾kový konfiguraèný súbor sample.aspell.conf. Pokiaµ chcete skopírujte ho do svojho domovského prieèinku pod názvom ".aspell.conf". Pokiaµ chcete, aby bol platný pre celý vá¹ operaèný systém, tak ho skopírujte do /etc pod názvom "aspell.conf". Aktuálne nastavenie aspellu získate po zadaní hotoho príkazu 'aspell dump config' ASpell-slovak bol testovaný na distribúcii Mandrake 8.0, 8.1, a 8.2 Na istých poèítaèových zostavách aspell mi pravidelne segfaultoval (sig11 alebo segmentation fault). V takomto prípade skúste nain¹talova» aspell a pspell z ni¾¹ích verzií va¹ej distribúcie. Tento postup mi pomohol v niektorých prípadoch. Dovoµujem si v¹ak upozorni», ¾e ak sa èasto stretávate z varovaním o 'segmentation fault', tak na 95% máte nejaký hardvérový problém (bli¾¹ie informácie sú napr. na http://www.BitWizard.nl/sig11/) Pou¾ívanie: ---------- V KDE spustite Ovládacie centrum (kliknutím ikonu, alebo príkazom 'kcontrol'). Choïte potom do Osobných nastavení (Osobné nastavenie) -> Kontrola pravopisu. Ako klienta si zvoµte "Aspell" (Pokiaµ ho nemáte v ponuke, tak máte problém z in¹taláciou - buï Aspellu alebo KDE), kódovanie nastavte na "ISO 8859-2" a slovník na "©tandardne - Slovenský [slovak]" prípadne "Neznámy [slova]". Teraz máte nastavené, aby v¹etky aplikácie KDE pou¾ívali ¹tandardne ako kontrolu pravopisu Aspell. Samozrejme , ¾e väè¹ina aplikácii umo¾òuje, aby ste pre ne pou¾ili iné nastavenie. Ak chcete pou¾íva» aspell v LyXe, tak do ~/.lyx/preferences (resp. lyxrc v ~/.lyx alebo v /usr/share/lyx/) dajte tieto riadky do sekcie "SPELLCHECKER SECTION" (prirodzene, nezabudnite odstráni» staré nastavenia): \spell_command "aspell" \accept_compound true \use_alt_language true \alternate_language "slovak" \use_escape_chars true \escape_chars "áÁäÄèÈïÏéÉìÌëËí͵¥åÅòÒóÓôÔöÖøعàÀ©»«úÚùÙüÜýݾ®" Pou¾itie Aspellu na konzole je jednoduché. Pokiaµ chcete interaktívnu kontrolu, pou¾ite: 'aspell -d slovak -c kontrolovany.subor' Pre neinteraktívnu kontrolu pou¾ite: 'aspell -d slovak -l <kontrolovany.subor >chybne.slova' Pokiaµ máte nastavený ~/.aspell.conf na slovenèinu (slovak), tak prepínaè '-d slovak' nemusíte pou¾íva». Pokiaµ máte záujem kontrolova» pravopis v html, php, sgml súboroch (prípadne aj iných súboroch, ktoré 'riadiace príkazy' resp. 'tagy' dávajú do sekvencie <>, tak pou¾ite pre súbor koncovku '.sgml'. V¹etky slová umiestnené v <> budú potom ignorované. Chcete pomôc»? ------------- "Slovník slovenského jazyka obsahuje asi 120 869 slov, Pravidlá slovenského pravopisu asi 40 000 slov. Na to, aby sa èlovek dohovoril o najnevyhnutej¹ích veciach, staèí 500 slov. Výskumami sa zistilo, ¾e telesne pracujúcemu èloveku staèí na dorozumenie oveµa menej slov." "Pasívna slovná zásoba ¹es»roèného die»a»a je 2000-3000 slov, ¹trnás» roèný ¾iak u¾ pozná 20 000 slov a 24-roèný èlovek a¾ 30 000 slov. Aktívne pou¾ívajú ¾iaci základnej ¹koly 1 500-3 000 slov, dospelí µudia a¾ 10 000. Goethe pou¾il vo svojich dielach spolu asi 20 000 slov a Pu¹kin 21 197 slov." - Jozef Mistrík, Slovenèina pre ka¾dého, 1967 Z vy¹¹ie uvedených výrokov je zrejmé, ¾e pre jednotlivé oblasti pou¾ívanie je mo¾né vytvori» "dokonalý slovník" resp. slovník, ktorý bude pokrýva» v¹etky pou¾ívané slová. Zvlá¹» sa to týka napr. firiem alebo úradov, kde sa pou¾íva formalizovaný písomný styk. Preto nemám záujem o prepisovanie Pravidiel, alebo export databáz slov (okrem iného, asi by ste sa pravdepodobne dostali do konfliktu so zákonom). Navy¹e výsledkom prepisovaní sú èasto chyba. Rad¹ej preferujem pomalú, ale zato presnú a bezchybnú prácu. Pomoc hµadám hlavne v týchto oblastiach: a) Pokiaµ nájdete chybné slovo (preklep, nesprávny tvar) - oznámte to. b) Potrebné je tie¾ vyselektova» slová, ktoré nie sú v Pravidlách do zvlá¹tneho súboru (ak také nájdete, po¹lite mi info: toto slovo podµa mòa nie je v Pravidlách...). Nemusíte èaka», kým nájdete veµa takýchto slov. Skúste ich posla» tak raz za mesiac. c) Neznáme slová sa ukladajú do domovského prieèinka do súboru '.aspell.slovak.pws '. Skúste ho raz za mesiac skontrolova» podµa Pravidiel, rozdeµte tieto slová na spisovné a nespisovné (resp. odborné - Pravidlá veµmi málo toti¾to popisujú práve rôzne odborné termíny) skomprimujte ich (vyskú¹ajte, èo vám dá lep¹í kompresný pomer: gzip alebo bzip2?). d) Do budúcnosti by som chcel rozdeli» celý slovník na niekoµko èastí podµa frekvencie pou¾ívania - pokiaµ máte prístup k rozsiahlej¹ím textom v slovenèine zistite prosím frekvenciu slov a po¹lite mi ju. Tento príkaz by vám pritom mohol pomôc»: 'tr "." " " <clanok_.txt | tr "?" " " |tr ":" " " |tr "\!" " " | \ tr "(" " " | tr "," " " |tr "-" " "|tr ")" " " |tr "\"" " "| tr " " "\n" \ | tr A-Z a-z | sort -f | uniq -i -c | sort -r -n > frekvencia_slov.txt' Príkaz 'aspell -d slovak -l <kontrolovany.subor | sort -f -u >nezname.slova' vám skontroluje súbor 'kontrolovany.subor' a vytvorí zoznam slov 'nezname.slova', ktoré v súbore nepoznal. Pri takejto kontrole sa neznáme slova naukladajú do '~/.aspell.slovak.pws ' Pokiaµ nemáte prístup súborom vhodným na kontrolovanie, skúste prekontrolova» slovenské preklady (súbory .po) (odporúèam stránku http://slovencina.linux.sk/) alebo preklady KDE (balík kde-i18n-sk) a KOFFICE (koffice-i18n-sk) v programe kbabel (balík kdesdk, resp kdesdk3) alebo gtranslator (www.gtranslator.org) a informujte autora prekladu (je v¾dy uvedený v hlavièke 'po' súboru) o preklepe. Neinformujte ho o nespisovných slovách a podobne, lebo autori prekladov sa èasto musia uchyµova» k rôznym slovám. Takto pomô¾e aj k zlep¹eniu úrovne prekladov. Podobným rie¹ením je "hacknutie" prekladov nain¹talovaných vo va¹om systéme. Príklad: 'msgunfmt /usr/share/locale/sk/LC_MESSAGES/mc.mo >mc.sk.po' Prosím NEPOSIELAJTE mi emaily väè¹ie ako 100kb. Rad¹ej jeden veµký email rozdeµte na niekoµko men¹ích. Problémy: -------- Pri príprave tohoto prvého vydania som zistil, ¾e pri povolení niektorých vlastností aspellu, dochádza k ukonèeniu Aspellu resp. dochádza k problémom. Preto som v súbore slovak.dat (/usr/share/aspell) zakomentoval tieto vlastnosti. Pokiaµ zistíte v èom je problém, dajte mi prosím vedie» na zdpo@mailbox.sk. Rôzne informácie: ---------------- Aký je vz»ah medzi slovenskou podporou pre Ispell, Aspell a MySpell? Veµmi blízky a to hlavne vïaka tomu, ¾e pracuje ne v¹etkých troch. Dôvod pre to je nasledovný: Aspell pou¾ívam osobne viac ako rok a v nedávnej minulosti som potreboval slovenskú podporu pre OpenOffice (MySpell). MySpell prevzal engine z Pspell/Aspell a z Ispellu affix kompresiu. Tak som som sa zaèal hra» s Ispellom a zistil som, ¾e ma isté nedostatky. Keï¾e nikto v tom èase (teda pokiaµ viem nikto okrem Jána Matisa) sa o slovenskú podporu pre Ispell nezaujímal, zaèal som robi» jeho revíziu. Verzia ispell-sk-0.1.7 bola vytvorená hlavne pre tých, ktorý sa zapojili/zapoja vo revízie (dos» veµa slov bolo odobraných, veµa preklepov opravených...). Z tejto verzie boli potom exportnuté niektoré (správne) slová pre Aspell. Podpora pre MySpell je robená priebe¾ne. Teda vz»ah medzi týmito spellmi je taká, ¾e pokiaµ nieèo nenájde jeden z nich, na 90% ich nenájdu ani ostatné. Podµa môjho osobného hodnotenia je kvalita vy¹¹ie spomenutých nasledovná: Najlep¹í je Aspell-slovak, potom MySpell-sk a posledný je Ispell. Momentálne hlavne pracujem na Ispelle, tak¾e ten je a bude asi najèastej¹ie vydávaný. Potom nasleduje MySpell a posledným je Aspell (predpokladám, ¾e do konca roka by mohla vyjs» e¹te jedna, dve vezie Aspellu - keby sa nejaký µudia pripojili k jeho tvorbe, alebo by ho niekto chcel spravova», situácia by sa mohla zmeni» k lep¹iemu - potenciálny záujemcovia nech mi dajú vedie»). Pokiaµ za¹lete slová do hociktorého projektu, po istej dobre (urèite nie hneï) sa objavia vo v¹etkých troch a preto ich neposielajte do v¹etkých troch (ak by ste ich upravili podµa ispellovskej affix kompresie - u¹etríte mi kopu práce a slová sa objavia aj Aspelly aj v MySpelly). V¹etky projekty sú priebe¾ne obnovované na http://ispell.hq.alert.sk Poïakovania =========== Moja vïaka patrí µuïom zo serveru hq.sk a zvlá¹» Jánovi Matisovi <matis@hq.sk>, za to, ¾e umiestòujú túto podporu na svoj server. Poïakovanie za pomoc patrí Marekovi Grácovi <xgrac@informatics.muni.cz> ASpell-slovak-1.0, Copyright (C) 2002 Zdenko Podobný <zdpo@mailbox.sk>