Filewatcher File Search File Search
Catalog
Content Search
» » » » » » » » dicts-1.5-260.x86_64.rpm » Content »
pkg://dicts-1.5-260.x86_64.rpm:20155085/usr/src/dicts/ispell-czech/  info  HEADER  downloads

dicts - Ispell Dictionary Files…  more info»

README

                         Czech data for ispell

The dictionary is rapidly evolving - see ftp://ftp.vslib.cz/pub/unix/ispell/
for actual version!

                         �esk� data pro ispell

V�echny tyto soubory jsou ve st�diu pom�rn� rychl�ch zm�n. Sledujte
ftp://ftp.vslib.cz/pub/unix/ispell/, kde jsou zve�ej�ov�ny nejnov�j�� verze.

Slovn�k je rozd�len na n�sleduj�c� ��sti:

hlavni.cat	Pravideln� sklo�ovan� podstatn� jm�na a p��davn� jm�na,
		(v�etn� t�ch, kter� maj� krom� pravideln�ch tvar� jeden
		nebo v�ce tvar� nepravideln�ch), v�echna slovesa, a
		p��slovce odvozen� od p��davn�ch jmen flagem R
nepravid.cat	Nepravideln� podstatn� jm�na a p��davn� jm�na (jsou
		uvedeny v�echny tvary bez flag�)
nesklon.cat	Nesklonn� podstatn� a p��davn� jm�na (maj� jedin� tvar)
zajmena.cat	Z�jmena
cislovk.cat	��slovky
prislovc.cat	P��slovce (krom� p��slovc� odvozen�ch z p��davn�ch jmen
		flagem R)
predlozk.cat	P�edlo�ky (v�etn� v�ceslovn�ch)
spojky.cat	Spojky (v�etn� v�ceslovn�ch)
citoslov.cat	Citoslovce
castice.cat	��stice
zkratky.cat	Inici�lov� zkratky a zkratky typu nap�., apod.
nezaraz.cat	Dosud neza�azen� slova
krestni.cat     K�estn� jm�na
prijmeni.cat    �esk� p��jmen�
narstjaz.cat    Jm�na n�rod�, st�t� a jazyk�
obce.cat        Jm�na obc� v �R
geogr.cat       Zem�pisn� jm�na v �R i ve sv�t�, jm�na m�st mimo �R
cizi.cat        Ciz� jm�na
nazvy.cat       Ostatn� n�zvy

Zdrojov� soubor czech.a-z pro vytvo�en� slovn�ku pro ispell se z�sk� takto:

    perl -pe 'print "echo "' *.cat | sh - | \
      perl -pe 's/ +/\n/g; s/[{}\.]//g; s/-/\n/g' > czech.a-z

Slou�en� soubor se zpracuje p��kazem buildhash:

    buildhash czech.a-z czech.aff czech.hash

kter� vytvo�� slovn�k pro ispell. Po zkop�rov�n� souboru czech.aff a
czech.hash do adres��e, ve kter�m ispell o�ek�v� slovn�ky, lze ispell
pou��vat p��kazem

    ispell -d czech kontrolovan�_soubor

Pokud p�i nalezen� nezn�m�ho slova p�i kontrole textu zvol�te mo�nost
I)nsert, p�id� se slovo do souboru $HOME/.ispell_czech. Chcete-li pomoci
s vytv��en�m slovn�ku, za�lete tento soubor (pokud mo�no vy�i�t�n� od
nespisovn�ch a ciz�ch slov a p��padn�ch HTML zna�ek nebo p��kaz� pro
TeX) na adresu Petr.Kolar@vslib.cz.

Pokud chcete pouze p�isp�t k roz���en� slovn�ku a nechcete text zdlouhav�
interaktivn� kontrolovat, m��ete pou��t p��kaz

    ispell -d czech -l < kontrolovan�_soubor > v�stup

kter� pracuje neinteraktivn� a ulo�� do souboru v�stup v�echna slova
ze vstupn�ho souboru, kter� nejsou obsa�ena ve slovn�ku spell checkeru.
Tento v�stupn� soubor za�lete pro ��ely roz�i�ov�n� slovn�ku. Zas�lejte
pouze slovn�ky vznikl� kontrolou sou�asn�ch p�ev��n� spisovn�ch text�
(M�cha nebo Neruda pravd�podobn� nen� na z�vadu, ale t�eba Bible Kralick�
u� vhodn� nen�).

Rozd�len� zdrojov�ho slovn�ku na ��sti je provedeno z toho d�vodu, aby
bylo mo�n� slovn�k snadno dopl�ovat (zat�m ov�em pom��e v�ce, kdy� po�lete
syrov� seznam nezn�m�ch slov):

Soubor v�stup se slou�� se souborem hlavni.cat, retrogr�dn� set��d�
(slova se set��d� jako by byla napsan� pozp�tku, aby se snadno dopl�ovaly
flagy):

    perl retro.p hlavni.cat v�stup | perl sort.p | perl retro.p > hlavni1.cat

V souboru hlavni1.cat je pak t�eba (na ��dc�ch, kter� neobsahuj� ��dn�
lom�tko) doplnit flagy. Slova, kter� do souboru nepat�� (p��slovce apod.),
se potom p�em�st� do jin�ch soubor�. Na z�v�r se p�ipoj� dosud neza�azen�
slova do nezaraz.cat a v�sledkem je nov� verze souboru hlavni.cat:

    grep -v / hlavni1.cat >> nezaraz.cat
    grep / hlavni1.cat > hlavni.cat

Pro dopl�ov�n� flag� lze pou��t i skript blemma - viz soubor ceskeaff.txt.
Jeho ��innost je v�ak pom�rn� n�zk� a chybovost pom�rn� velk�.

                                                  Petr.Kolar@vslib.cz
Results 1 - 1 of 1
Help - FTP Sites List - Software Dir.
Search over 15 billion files
© 1997-2017 FileWatcher.com