Sophie

Sophie

distrib > Mandriva > 9.1 > ppc > by-pkgid > 62a9e1a5e29b95beffe04e3659ca516c > files > 8

aspell-sk-0.50.3-3mdk.ppc.rpm

Úvod:
----

Toto je prvé verejné vydanie podpory slovenèiny pre kontrolu pravopisu aspell.
Je výsledkom môjho viac ako roèného úsilia o vytvorenie celkom slu¹nej databázy
pre aspell. Významná èas» vznikla po mojom zapojení sa do revízie podpory
slovenèiny programu Ispell.

V tejto verzii je 675 741 slov, èo som pova¾oval za dostatoèné mno¾stvo, aby
bolo mo¾né urobi» prvé vydanie. Pokiaµ viem, slovník by nemal obsahova»
nesprávne slová, resp. nesprávne tvary slov, ale moja osobná skúsenos» 
s rôznymi slovníkmi (ak komerènými) je taká, ¾e niè nie je dokonalé a chyba sú
v ka¾dej µudskej práci. Preto, ak nájdete chybu informujte ma o nej na
zdpo@mailbox.sk. Verím, ¾e spoloèným úsilím budeme môc» vytvori» slovník, ktorý
sa bude pribli¾ova» k dokonalosti.


©írenie:
-------
ASpell-slovak je ABSOLÚTNE BEZ ZÁRUKY. Ide o voµne ¹íriteµný softvér a jeho
¹írenie za istých podmienok je vítané; podrobnosti získate v súboroch COPYING,
Copyright alebo gnu.sk.html (slovenský preklad V¹eobecnej zverejòovacej
licencie - GNU General Public Licence, od Juraja Kolesára).


Cieµ:
----
Dlhodobým cieµom pre aspell je vytvorenie dvoch základných slovníkov:
prvý, hlavný, by sa prísne pridr¾iaval Pravidiel slovesného pravopisu a druhý
by bol roz¹irujúci, ktorý by pokrýval èasto pou¾ívané slová, ktoré nie sú
zahrnuté do Pravidiel. Upozoròujem, ¾e Pravidlá slovanského pravopisu pokrývajú
je èas» slovenèiny. 


Vlastnosti:
----------

Hlavným cieµom Aspellu je lep¹ie vyhµadávanie 'ponúknutých slov' pri kontrole
pravopisu. To znamená, ¾e pokiaµ aspell nájde nesprávne slovo, tak by vám mal
ponúknu» to najvhodnej¹ie (správne) na èo najvy¹¹om mieste v ponuke.

Aspell sa tie¾ sna¾í uèi» z va¹ich chýb - zaznamenáva va¹e preklepy a podµa
nich sa sna¾í potom v budúcnosti nájs» najvhodnej¹ie slovo pri chybe.

Pokiaµ je vytvorený osobný slovník (.aspell.slovak.pws) tento slovník sa
kontroluje pri chybe ako prvý.

Aspell umo¾òuje vytvori» pravidlá, ktoré mu pomáhajú pri hµadaní spraávnych
slov. Je to u¾itoèné zvlá¹» keï sa slová inak vyslovujú ako pí¹u. ®iaµ pri
príprave tohoto vydania som zistil, ¾e táto funkcia mi spôsobuje pád Aspellu pri
slovenèine a preto je vypnutá. Problém sa mi nepodaril zatiaµ vyrie¹i».

Z pou¾ívateµského hµadiska sa mi oveµa lep¹ie pracuje (hlavne k KDE
aplikáciách) s aspellom ako s ispellom. Ale to je èisto subjektívny dojem.

Je to jediná kontrola pravopisu, ktorá mi funguje v programe LyX.

Pokiaµ viem, ako jediný umo¾òuje pou¾íva» viac slovníkov pre jeden jazyk.
Pridanie ïal¹ieho slovníka je jednoduché. Vytvorte si svoj vlastný zoznam tak,
aby jedno slovo bolo na jednom riadku. Tento zoznam usporiadajte ('sort -u -f
<vas.zoznam> usporiadany.zoznam') a potom vygenerujete nový slovník pomocou
príkazu:
'aspell --lang=slovak create master ./slovak-moj-slovnik <usporiadany.zoznam'
Potom skopírujte 'slovak-moj-slovnik' do /usr/lib/aspell 
('cp ./slovak-moj-slovnik /usr/lib/aspell') a do súboru 
/usr/lib/aspell/slovak.multi pridajte riadok "add slovak-moj-slovnik"

Oproti Ispellu má Aspell hlavne tieto nevýhody:
- je viac nároènej¹í na pamä»
- nemá affix kompresiu a preto sú slovníky také veµké (aktuálny skompilovaný
  slovník má cez 17 Mb aj po kompresii je veµkos» veµmi veµká) a preto je aj
  pridávanie nových slov také pomalé (v¹etky tvary musia by» ruène vlo¾ené). Na
  druhú stranu je práve posledne spomenutá nevýhoda vlastne výhodou voèi
  slovenskej podpore ispellu - affix kompresia je tak zlo¾itá, ¾e v istých
  prípadoch Ispell generuje vïaka affix kompresií nesprávne tvary slov.
- podµa niektorých reakcií je aspell pomal¹í ako Ispell (resp. je nároènej¹í na
  hardvér). V ka¾dom prípade ja som aspell zaèal pou¾íva» na pentiu 90MHz so
  40M Ram (základná databáza asi 40 000 slov) a po upgrade na Duron 950MHz 256M 
  Ram som zaznamenal zrýchlenie iba pri generovaní (kompilácii slovníka), ale nie 
  pri samotnej kontrole. Tak¾e teoreticky by nemal by» problém pou¾íva» ASpell 
  aj na slabom hardvére.

TIP: Pokiaµ je aspell pomalý, skúste si vytvori» svoj vlastný slovník (napr.
  tak, ¾e zmeníte súbory z tohoto projektu), ktorý bude obsahova» iba vami
  pou¾ívané slová. Zo skúsenosti viem, ¾e èlovek málo kedy pou¾íva viac
  ako 20 000 slov v písomnom prejave a preto slovník o veµkosti 600 tisíc slov
  je pre vás zbytoèný resp. ho mô¾ete pou¾íva» iba obèas na kontrolu vá¹ho
  zoznamu slov).

Ïal¹ie informácie (s angliètine) by ste mali ma» v
/usr/share/doc/aspell-0.33.7.1/aspell/man-html/index.html


In¹talácia:
----------

Predpoklad:
In¹talaèný skript je dos» jednoduchý a predpokladá, ¾e máte nain¹talovaný
program aspell v /usr (t.j. nie napr v /usr/local). Pokiaµ ste in¹talovali
aspell z rpm archívu alebo priamo bol nain¹talovaný pri in¹talácií va¹ej
distribúcie, nemali by ste ma» ¾iadne problémy. 

Rozbaµte archív aspell-slovak-1.0.tar.gz a spustite skript install

tar zxfv aspell-slovak-1.0.tar.gz
cd aspell-slovak-1.0
./install

V /usr/share/doc/aspell-slovak sa nachádza uká¾kový konfiguraèný súbor
sample.aspell.conf. Pokiaµ chcete skopírujte ho do svojho domovského prieèinku
pod názvom ".aspell.conf". Pokiaµ chcete, aby bol platný pre celý vá¹ operaèný
systém, tak ho skopírujte do /etc pod názvom "aspell.conf". Aktuálne nastavenie
aspellu získate po zadaní hotoho príkazu 'aspell dump config'

ASpell-slovak bol testovaný na distribúcii Mandrake 8.0, 8.1, a 8.2
Na istých poèítaèových zostavách aspell mi pravidelne segfaultoval (sig11 alebo
segmentation fault). V takomto prípade skúste nain¹talova» aspell a pspell z
ni¾¹ích verzií va¹ej distribúcie. Tento postup mi pomohol v niektorých
prípadoch. Dovoµujem si v¹ak upozorni», ¾e ak sa èasto stretávate z varovaním o
'segmentation fault', tak na 95% máte nejaký hardvérový problém (bli¾¹ie
informácie sú napr. na http://www.BitWizard.nl/sig11/)



Pou¾ívanie:
----------

V KDE spustite Ovládacie centrum (kliknutím ikonu, alebo príkazom 'kcontrol').
Choïte potom do Osobných nastavení (Osobné nastavenie) -> Kontrola pravopisu.
Ako klienta si zvoµte "Aspell" (Pokiaµ ho nemáte v ponuke, tak máte problém z
in¹taláciou - buï Aspellu alebo KDE), kódovanie nastavte na "ISO 8859-2" a
slovník na "©tandardne - Slovenský [slovak]" prípadne "Neznámy [slova]".
Teraz máte nastavené, aby v¹etky aplikácie KDE pou¾ívali ¹tandardne ako
kontrolu pravopisu Aspell. Samozrejme , ¾e väè¹ina aplikácii umo¾òuje, aby ste
pre ne pou¾ili iné nastavenie.

Ak chcete pou¾íva» aspell v LyXe, tak do ~/.lyx/preferences (resp. lyxrc v
~/.lyx alebo v /usr/share/lyx/) dajte tieto riadky do sekcie "SPELLCHECKER
SECTION" (prirodzene, nezabudnite odstráni» staré nastavenia):
\spell_command "aspell"
\accept_compound true
\use_alt_language true
\alternate_language "slovak"
\use_escape_chars true
\escape_chars "áÁäÄèÈïÏéÉìÌëËí͵¥åÅòÒóÓôÔöÖøعàÀ©»«úÚùÙüÜýݾ®"

Pou¾itie Aspellu na konzole je jednoduché. Pokiaµ chcete interaktívnu kontrolu,
pou¾ite:
'aspell -d slovak -c kontrolovany.subor'

Pre neinteraktívnu kontrolu pou¾ite:
'aspell -d slovak -l <kontrolovany.subor >chybne.slova'

Pokiaµ máte  nastavený  ~/.aspell.conf na slovenèinu (slovak), tak prepínaè
'-d slovak' nemusíte pou¾íva».

Pokiaµ máte záujem kontrolova» pravopis v html, php, sgml súboroch (prípadne aj
iných súboroch, ktoré 'riadiace príkazy' resp. 'tagy' dávajú do sekvencie <>,
tak pou¾ite pre súbor koncovku '.sgml'. V¹etky slová umiestnené v <> budú potom
ignorované.


Chcete pomôc»?
-------------
"Slovník slovenského jazyka obsahuje asi 120 869 slov, Pravidlá slovenského
pravopisu asi 40 000 slov. Na to, aby sa èlovek dohovoril o najnevyhnutej¹ích
veciach, staèí 500 slov. Výskumami sa zistilo, ¾e telesne pracujúcemu èloveku
staèí na dorozumenie oveµa menej slov."

"Pasívna slovná zásoba ¹es»roèného die»a»a je 2000-3000 slov, ¹trnás» roèný
¾iak u¾ pozná 20 000 slov a 24-roèný èlovek a¾ 30 000 slov. Aktívne pou¾ívajú
¾iaci základnej ¹koly 1 500-3 000 slov, dospelí µudia a¾ 10 000. Goethe pou¾il
vo svojich dielach spolu asi 20 000 slov a Pu¹kin 21 197 slov."

        - Jozef Mistrík, Slovenèina pre ka¾dého, 1967

Z vy¹¹ie uvedených výrokov je zrejmé, ¾e pre jednotlivé oblasti pou¾ívanie je
mo¾né vytvori» "dokonalý slovník" resp. slovník, ktorý bude pokrýva» v¹etky
pou¾ívané slová. Zvlá¹» sa to týka napr. firiem alebo úradov, kde sa pou¾íva
formalizovaný písomný styk. Preto nemám záujem o prepisovanie Pravidiel, alebo
export databáz slov (okrem iného, asi by ste sa pravdepodobne dostali do
konfliktu so zákonom). Navy¹e výsledkom prepisovaní sú èasto chyba. Rad¹ej
preferujem pomalú, ale zato presnú a bezchybnú prácu.

Pomoc hµadám hlavne v týchto oblastiach:
a) Pokiaµ nájdete chybné slovo (preklep, nesprávny tvar) - oznámte to.
b) Potrebné je tie¾ vyselektova» slová, ktoré nie sú v Pravidlách do zvlá¹tneho
   súboru (ak také nájdete, po¹lite mi info: toto slovo podµa mòa nie je v
   Pravidlách...). Nemusíte èaka», kým nájdete veµa takýchto slov. Skúste ich
   posla» tak raz za mesiac.
c) Neznáme slová sa ukladajú do domovského prieèinka do súboru
   '.aspell.slovak.pws '. Skúste ho raz za mesiac skontrolova» podµa Pravidiel,
   rozdeµte tieto slová na spisovné a nespisovné (resp. odborné - Pravidlá
   veµmi málo toti¾to popisujú práve rôzne odborné termíny) skomprimujte ich
   (vyskú¹ajte, èo vám dá lep¹í kompresný pomer: gzip alebo bzip2?). 
d) Do budúcnosti by som chcel rozdeli» celý slovník na niekoµko èastí podµa
   frekvencie pou¾ívania - pokiaµ máte prístup k rozsiahlej¹ím textom v
   slovenèine zistite prosím frekvenciu slov a po¹lite mi ju. Tento príkaz by
   vám pritom mohol pomôc»:
   'tr "." " " <clanok_.txt | tr "?" " " |tr ":" " " |tr "\!" " " | \
   tr "(" " " | tr "," " " |tr "-" " "|tr ")" " " |tr "\"" " "| tr " " "\n" \
   | tr A-Z a-z | sort -f | uniq -i -c | sort -r -n > frekvencia_slov.txt'
   

Príkaz 'aspell -d slovak -l <kontrolovany.subor | sort -f -u >nezname.slova'
vám skontroluje súbor 'kontrolovany.subor' a vytvorí zoznam slov
'nezname.slova', ktoré v súbore nepoznal. Pri takejto kontrole sa neznáme slova
naukladajú do '~/.aspell.slovak.pws '

Pokiaµ nemáte prístup súborom vhodným na kontrolovanie, skúste prekontrolova»
slovenské preklady (súbory .po) (odporúèam stránku http://slovencina.linux.sk/)
alebo preklady KDE (balík kde-i18n-sk) a KOFFICE (koffice-i18n-sk) v programe
kbabel (balík kdesdk, resp kdesdk3) alebo gtranslator (www.gtranslator.org) a
informujte autora prekladu (je v¾dy uvedený v hlavièke 'po' súboru) o preklepe.
Neinformujte ho o nespisovných slovách a podobne, lebo autori prekladov sa
èasto musia uchyµova» k rôznym slovám. Takto pomô¾e aj k zlep¹eniu úrovne
prekladov.

Podobným rie¹ením je "hacknutie" prekladov nain¹talovaných vo va¹om systéme.
Príklad:
'msgunfmt /usr/share/locale/sk/LC_MESSAGES/mc.mo >mc.sk.po'

Prosím NEPOSIELAJTE mi emaily väè¹ie ako 100kb. Rad¹ej jeden veµký email
rozdeµte na niekoµko men¹ích.


Problémy:
--------

Pri príprave tohoto prvého vydania som zistil, ¾e pri povolení niektorých
vlastností aspellu, dochádza k ukonèeniu Aspellu resp. dochádza k problémom.
Preto som v súbore slovak.dat (/usr/share/aspell) zakomentoval tieto
vlastnosti. Pokiaµ zistíte v èom je problém, dajte mi prosím vedie» na
zdpo@mailbox.sk.


Rôzne informácie:
----------------

Aký je vz»ah medzi slovenskou podporou pre Ispell, Aspell a MySpell?
Veµmi blízky a to hlavne vïaka tomu, ¾e pracuje ne v¹etkých troch. Dôvod pre
to je nasledovný: Aspell pou¾ívam osobne viac ako rok a v nedávnej minulosti
som potreboval slovenskú podporu pre OpenOffice (MySpell). MySpell prevzal
engine z Pspell/Aspell a z Ispellu affix kompresiu. Tak som som sa zaèal hra» s
Ispellom a zistil som, ¾e ma isté nedostatky. Keï¾e nikto v tom èase (teda
pokiaµ viem nikto okrem Jána Matisa) sa o slovenskú podporu pre Ispell
nezaujímal, zaèal som
robi» jeho revíziu. Verzia ispell-sk-0.1.7 bola vytvorená hlavne pre tých,
ktorý sa zapojili/zapoja vo revízie (dos» veµa slov bolo odobraných, veµa
preklepov opravených...). Z tejto verzie boli potom exportnuté niektoré
(správne) slová pre Aspell. Podpora pre MySpell je robená priebe¾ne.
Teda vz»ah medzi týmito spellmi je taká, ¾e pokiaµ nieèo nenájde jeden z nich,
na 90% ich nenájdu ani ostatné.

Podµa môjho osobného hodnotenia je kvalita vy¹¹ie spomenutých nasledovná:
Najlep¹í je Aspell-slovak, potom MySpell-sk a posledný je Ispell.

Momentálne hlavne pracujem na Ispelle, tak¾e ten je a bude asi najèastej¹ie
vydávaný. Potom nasleduje MySpell a posledným je Aspell (predpokladám, ¾e
do konca roka by mohla vyjs» e¹te jedna, dve vezie Aspellu - keby sa nejaký
µudia
pripojili k jeho tvorbe, alebo by ho niekto chcel spravova», situácia by sa
mohla zmeni» k lep¹iemu - potenciálny záujemcovia nech mi dajú vedie»).

Pokiaµ za¹lete slová do hociktorého projektu, po istej dobre (urèite nie hneï)
sa objavia vo v¹etkých troch a preto ich neposielajte do v¹etkých troch (ak by
ste ich upravili podµa ispellovskej affix kompresie - u¹etríte mi kopu práce a
slová sa objavia aj Aspelly aj v MySpelly).

V¹etky projekty sú priebe¾ne obnovované na http://ispell.hq.alert.sk


Poïakovania
===========

Moja vïaka patrí µuïom zo serveru hq.sk a zvlá¹» Jánovi Matisovi <matis@hq.sk>,
za to, ¾e umiestòujú túto podporu na svoj server.
Poïakovanie za pomoc patrí Marekovi Grácovi <xgrac@informatics.muni.cz>
ASpell-slovak-1.0, Copyright (C) 2002 Zdenko Podobný <zdpo@mailbox.sk>