hunspell

Autres langues

Langue: hu

Version: 2008. ĂĄprilis 11. (fedora - 06/07/09)

Section: 1 (Commandes utilisateur)

NÉV

hunspell - unicode-os helyesírás-ellenőrző, szótövező és morfológiai elemző program

ÁTTEKINTÉS

hunspell [-1aDGHhLlmnstvw] [--check-url] [-d szĂłtĂĄr[,...]] [-p sajĂĄtszĂłtĂĄr] [ĂĄllomĂĄny(ok)]

LEÍRÁS

A hunspell felismeri ĂŠs javĂ­tja az elĂźtĂŠseket ĂŠs tĂ­pushibĂĄkat egyszerĹą szĂśveges, (La)TeX, HTML ĂŠs groff (kĂŠzikĂśnyv oldal) ĂĄllomĂĄnyokban.

Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispell csőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja, és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó, és # vagy & jellel, ha rossz. A csőfelület parancsait viszont az Ispellhez hasonlóan csak a -a kapcsoló megadásával értelmezi.

ÁllomånynÊv paramÊter esetÊn elindul egy az IspellÊhez hasonló interaktív felßlet.

KAPCSOLÓK

-1
Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak az első tabulátorjel előtti karaktersorozatot vizsgálja meg.
-a
Ispellhez csőfelület. A !, +, -, @, #, vagy ^ jellel kezdődő sorok a csőfelület parancsai, jelentésüket az Ispell kézikönyvoldal részletezi. A -a kapcsoló hatására a kimenetben a jó szavakat csak csillaggal jelzi a Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programok némelyikével (például a LyX-szel). Ekkor nem kell megadnunk a -a kapcsolót, mivel az Ispellt használó programok automatikusan ezzel a kapcsolóval indítják el az Ispell nevében futó Hunspellt is.
-d szĂłtĂĄr[,szĂłtĂĄr2,...]
BeĂĄllĂ­tja a helyesĂ­rĂĄsi szĂłtĂĄrakat a kiterjesztĂŠs nĂŠlkĂźli szĂłtĂĄrnevek, Ăştvonalak megadĂĄsĂĄval.

PĂŠldĂĄul a

hunspell -d hu_HU,hu_geo,hu_med,de_DE,de_med

a magyar alapszótárat és kiegészítő szótárait, valamint német alapszótárat és annak egy kiegészítő szótárát tölti be. Az alapszótárak egy aff és egy dic kiterjesztésű állományból állnak, a kiegészítő szótárak csak dic állományból. A kiegészítő szótárak nevére vonatkozóan nincs szabály (csak a dic kiterjesztés), a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoz töltődnek be a kiegészítő szótárak (ami pedig meghatározza a javaslattevést). Az első szótár mindig alapszótár.

Az alapĂŠrtelmezett szĂłtĂĄr a kĂśrnyezet nyelvi beĂĄllĂ­tĂĄsĂĄtĂłl fĂźgg az Unix rendszereken. Locale hiĂĄnyĂĄban a /usr/share/hunspell/default az alapĂŠrtelmezett szĂłtĂĄr.

A megadott útvonal lehet abszolút és relatív is. Relatív útvonal esetén először az aktuális, majd a /usr/share/hunspell és még több más könyvtárban keresi a szótárt a program. L. -D és a PÉLDÁK.

-D
A keresési útvonalak, az elérhető és betöltött szótárak útvonalának kijelzése.
-G
A -l, -w, és -L kapcsolókat kiegészítő kapcsoló. A standard bemenetről érkező hibás szavak, illetve sorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítését kérhetjük vele. Ha mást nem adunk meg, a -l kapcsoló hatásának megfelelően működik, csak a rossz helyett a jó szavakat írja a standard kimenetre.
-h, --help
A beĂŠpĂ­tett leĂ­rĂĄs megjelenĂ­tĂŠse.
-H
HTML bemeneti ĂĄllomĂĄnyformĂĄtum beĂĄllĂ­tĂĄsa. Ha az ĂĄllomĂĄny nevĂŠnek .html, .htm, vagy .xml a kiterjesztĂŠse, ez automatikusan bekĂśvetkezik.
-l
Kiírja a hibás szavakat a standard bemenetről érkező állományból. Használható a -H, -t, -n, -1 kapcsolókkal együtt is. A -G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.
-L
Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból. Használható a -H, -t, -n, -1 kapcsolókkal együtt is. A -G kapcsoló megfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egy hibás szót sem tartalmaznak.
-m
Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótári morfológiai leírás hiányában a toldalékolt szavak kapcsolóinak kijelzése (szótárfejlesztőknek).
-n
Nroff/troff bemeneti állományformátum beállítása, elsősorban a kézikönyvlapok ellenőrzésére.
-p sajĂĄt_szĂłtĂĄr
A felhasznĂĄlĂł sajĂĄt szĂłtĂĄrĂĄnak beĂĄllĂ­tĂĄsĂĄra szolgĂĄl.

Az alapĂŠrtelmezett sajĂĄt szĂłtĂĄr a $HOME/.hunspell_default ĂĄllomĂĄny. Ha szĂłtĂĄrat is megadunk a -d kapcsolĂłval, vagy a DICTIONARY kĂśrnyezeti vĂĄltozĂłval, a sajĂĄt szĂłtĂĄr a $HOME/.hunspell_szĂłtĂĄrnĂŠv lesz. Ha a sajĂĄt szĂłtĂĄr nem lĂŠtezik, lĂŠtrehozza.

Ha az aktuĂĄlis kĂśnyvtĂĄrban is van egy ugyanilyen nevĹą ĂĄllomĂĄny, akkor annak tartalma is beolvasĂĄsra kerĂźl, mint sajĂĄt szĂłtĂĄr, ĂŠs az Ăşjonnan felvett szavak is ide kerĂźlnek.

A -p , vagy a WORDLIST kĂśrnyezeti vĂĄltozĂł megadĂĄsĂĄval Ăşj sajĂĄt szĂłtĂĄrat jelĂślĂźnk ki. A sajĂĄt szĂłtĂĄrat az aktuĂĄlis kĂśnyvtĂĄrban, ĂŠs a sajĂĄt kĂśnyvtĂĄr gyĂśkerĂŠben ($HOME) keresi a Hunspell. Ha nem talĂĄlhatĂł, akkor az Ăşjonnan felvett szavak mentĂŠsĂŠnĂŠl lĂŠtrehozza a sajĂĄt kĂśnyvtĂĄr gyĂśkerĂŠben.

-s
Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függő pontossággal).
-t
LaTeX bemeneti ĂĄllomĂĄnyformĂĄtum beĂĄllĂ­tĂĄsa. Ha az ĂĄllomĂĄny nevĂŠnek .tex a kiterjesztĂŠse, ez automatikusan bekĂśvetkezik.
-u
Tipikus hibĂĄk kijelzĂŠse az ĂĄllomĂĄnybĂłl, cserejavaslattal.
-u2
Tipikus hibák és javításuk kijelzése módosítható, és a sed programmal végrehajtatható formában. Irányítsuk a Hunspell kimenetét egy állományba. Törüljük azokat a sorokat az elmentett állományból, amelyek sed paranccsal megadott javítását nem szeretnénk. Mentsük el az állományt, és a sed -f javítás eredeti_állomány >javított_állomány paranccsal javíthatjuk az állományt gyorsan és egyszerűen. (A sok hibát tartalmazó állományok javítását gyorsítja meg ez a lehetőség.)
-U
Ha az -u kapcsolĂłval kapott javaslatokat mind el szeretnĂŠnk fogadni, akkor az -U kapcsolĂłval a Hunspell automatikusan vĂŠgrehajtja a cserĂŠket, ĂŠs a mĂłdosĂ­tott ĂĄllomĂĄnyt a szabvĂĄnyos kimenetre kĂźldi. PĂŠlda a javĂ­tĂĄsra: hunspell -U eredeti_ĂĄllomĂĄny >javĂ­tott_ĂĄllomĂĄny. A hibakimeneten megjelennek a javĂ­tĂĄsok is mĂŠg egyszer, a - kapcsolĂłhoz hasonlĂł mĂłdon.
-v
VerziĂłszĂĄm.
-vv
VerziĂłszĂĄm (Ispell kompatibilitĂĄs miatt).
-w
Csak a hibás szavakat írja ki a standard bemenetről érkező, soronként egy szót tartalmazó állományból. A sorok nincsenek szavakra bontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a -w kapcsolóval érhető el. A -G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.

INTERAKTÍV FELÜLET

A felület legfelső sorában a hibás szóalakot, és az éppen vizsgált állomány nevét látjuk. Amennyiben egy szóalak szótári tiltás miatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT! (FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nem hiányos szókincs, hanem szándékos tiltás miatt nem került a szó elfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, és szövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak.

A hasznĂĄlhatĂł billentyĹąkombinĂĄciĂłk:

SzĂłkĂśz
Továbblépés javítás nélkül a következő hibás szóra.
SzĂĄmok
A megfelelő javaslat kiválasztása.
c
Csere. A hibĂĄs szĂł cserĂŠje a megadott szĂłra, vagy szavakra. Az Escape billentyĹą kĂŠtszeri lenyomĂĄsĂĄval megszakĂ­thatjuk a a cserĂŠt.
j
A szó elfogadása a program futásának befejeződéséig.
f
A szĂł felvĂŠtele a sajĂĄt szĂłtĂĄrba.
k
A szĂł kisbetĹąskĂŠnt valĂł felvĂŠtele a sajĂĄt szĂłtĂĄrba.
t
Ragozott tőszó felvétele. A ragozás a másodikként megadott, mintául szolgáló szó alapján történik. Ha ez a szó nincs felvéve a szótárba, a tőszófelvételt elölről kell kezdeni.

Példa: gyakran hiányoznak az idegen és a mozaikszavak. Vegyük fel a hiányzó OTP szót a tv köznévi mozaikszó toldalékaival! Lenyomjuk a t billentyűt, beírjuk, hogy OTP, leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szó ugyanis már szerepel a szótárban, és ragozása mondja meg a programnak, hogy az OTP szót milyen toldalékokkal szeretnénk látni, pl. OTP-hez, OTP-met stb. a tv-hez, tv-met mintájára. A -val/-vel, -vá/-vé toldalékokat a kötőjellel kapcsolt toldalékú szavak esetében külön kell felvenni, de még így is sokkal kényelmesebb a speciális tőfelvétel, mint minden (akár több száz) toldalékos alakot külön-külön felvenni.

Egy kis segítség a minta kiválasztásához: első menetben a hangrend számít. Pl. mozaikszavaknál a mély hangrendű új szavak felvételénél használhatjuk a MÁV szót példaként, ajakréses magas hangrendnél pedig az említett tv-t. Ajakkerekítéses magas hangrend esetében a HÖK szót használhatjuk (amíg át nem lesz javítva a helyes hök-re). Ha a hiányzó szó nem mozaikszó, hanem például tulajdonnév, a Pál, Péter, Örs szavakat adhatjuk meg példának a hangrendtől függően. Ha meg egyszerű köznévről van szó, akkor használjuk az ok, ék, ük szavakat. Igéknél áll, vél, ül, ikes igéknél ázik, vérzik, nőzik lehet a példa (remélhetőleg a következő változatokban egyszerűsödik ez a tőfelvétel).

Az Escape billentyĹą kĂŠtszeri lenyomĂĄsĂĄval megszakĂ­thatjuk ezt a mĹąveletet.

Az itt felvett szavak automatikusan a sajĂĄt szĂłtĂĄrba kerĂźlnek. Ha ezt innen tĂśrĂślni szeretnĂŠnk, a programbĂłl kilĂŠpve a sajĂĄt szĂłtĂĄr kĂŠzi ĂĄtszerkesztĂŠsĂŠvel tehetjĂźk meg.

m
Kilépés a változtatások mentése nélkül. A program változtatás megléte esetén megerősítést kér.
v
Az állomány ellenőrzésének megszakítása a változtatások mentésével. Ha van következő állomány, akkor a program annak ellenőrzését kezdi el.
?
SegĂ­tsĂŠg. HasonlĂł rĂśvid leĂ­rĂĄs megjelenĂ­tĂŠse a billentyĹąparancsokrĂłl.

CSŐFELÜLET

A Hunspell soronként dolgozza fel az állományokat, a helyes szavakat * (tőszó), - (összetett szó), vagy + (ragozott szó) karakterrel jelöli, a helyteleneket # (nincs javaslat) , vagy & (van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő. A # jel után a hibás szó, és kezdőpozíciója van feltüntetve. A & jelet követi a hibás szó; a javaslatok száma; a hibás szó kezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva:
 macska
 *
 macskabajusz
 -
 macskĂĄk
 + macska
 mcsk
 # mcsk 0
 macka
 & macka 7 0: macska, maca, racka, packa, vacka, marka, mackĂł
 

PÉLDÁK

hunspell -d en_US english.html
Az amerikai angol helyesĂ­rĂĄsi szĂłtĂĄr kivĂĄlasztĂĄsa (aktuĂĄlis, vagy a /usr/share/hunspell kĂśnyvtĂĄrbĂłl.
hunspell -d /opt/OpenOffice.org1.0.1/share/dict/ooo/de_DE
A nĂŠmet helyesĂ­rĂĄsi szĂłtĂĄr kivĂĄlasztĂĄsa a megadott abszolĂşt ĂştvonalrĂłl, a standard bemenet feldolgozĂĄsĂĄval.
hunspell *.html
Az aktuális könyvtárban található összes HTML állomány interaktív ellenőrzése.
hunspell -l szĂśveg.html
A megadott ĂĄllomĂĄny hibĂĄs szavainak kiĂ­rĂĄsa.

KÖRNYEZET

DICTIONARY
A szĂłtĂĄr helyĂŠnek megadĂĄsĂĄra szolgĂĄl. Szerepe megegyezik a -d kapcsolĂłval.
DICPATH
A szĂłtĂĄrkeresĂŠsi Ăştvonalat tartalmazĂł vĂĄltozĂł.
WORDLIST
A sajĂĄt szĂłtĂĄr helyĂŠnek megadĂĄsĂĄra szolgĂĄl. Szerepe megegyezik a -p kapcsolĂłval.

ÁLLOMÁNYOK

/usr/share/default.aff Az alapĂŠrtelmezett ragozĂĄsi tĂĄblĂĄzat. LĂĄsd hunspell(4).

/usr/share/default.dic Az alapértelmezett szótár az előző ragozási táblázathoz. Lásd hunspell(4). $HOME/.hunspell_default Az alapértelmezett saját szótár. Az állományt létrehozza a Hunspell, ha nem létezik. Lásd ispell(1).

LÁSD MÉG

hunspell (4), hunstem (1), makedb (1), lookdb (1), ispell (1), ispell (4), Magyar Ispell dokumentĂĄciĂł.

ELŐNYÖK

A program a következő előnyöket nyújtja a hasonló célokat szolgáló Ispell-lel szemben:
-
Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tette lehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.)
-
HomonimĂĄk kezelĂŠse (nincsenek pĂŠldĂĄul olyan alakok elfogadva, mint megvĂĄrban).
-
Helyes javaslatok a tĂśbb karakter vĂĄltozĂĄsĂĄval jĂĄrĂł tipikus hibĂĄkra (j/ly, Ă­j/ijj, nyj/nny ĂŠs mĂŠg tĂśbb tucatnyi tĂŠvesztĂŠs megvizsgĂĄlĂĄsĂĄval). Az Ispell csak kĂŠt karakter felcserĂŠlĂŠse; vagy egy karakter hiĂĄnya, cserĂŠje, illetve felesleges jelenlĂŠte esetĂŠn ad helyes javaslatot.
-
Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.)
-
Javaslatok valĂłszĂ­nĹąsĂŠgi sorrendben jelennek meg (tipikus hibĂĄk, i/Ă­, o/Ăł, u/Ăş tĂŠvesztĂŠsek stb.).
-
Összetett szavak esetén 6–3-as szabály alkalmazása (helyesírás-ellenőrző, gépkocsi-összeszerelés).
-
MozgĂłszabĂĄly alkalmazĂĄsa (kiviteli engedĂŠly, kiviteliengedĂŠly-kĂŠrĂŠs).
-
A magyar nyelv egyĂŠb ĂśsszetĂŠteli szabĂĄlyainak alkalmazĂĄsa (pĂŠldĂĄul hatlĂśvetĹą, tizenkĂŠt lĂśvetĹą, kĂŠthavi, kĂŠt hĂłnapos, mĂĄsodmagĂĄval).
-
Leg-, legesleg- ĂŠs -bb confixum helyes kezelĂŠse (nincs pl. legĂŠdes, csak legĂŠdesebb).
-
Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön-külön történő felvételét a saját szótárba.
-
Javaslatok mĂĄssalhangzĂł-triplĂĄzĂĄsok (sakkkĂśr, baletttĂĄncos, dzsesszszak) esetĂŠn. (Ispell helyesnek fogadja el ezeket.)
-
Javaslatok szĂłtagduplĂĄzĂĄsok (oktatatĂĄs, igenenevet) esetĂŠn.
-
Javaslatok ĂŠkezet nĂŠlkĂźli szĂśvegre (tukorfurogep->tĂźkĂśrfĂşrĂłgĂŠp).
-
Kötőjeles szavak kezelése (unos-untalan).
-
ToldalĂŠkolt szĂĄmok (1-jĂŠn, 11-ĂŠn, 5.-et) kezelĂŠse.
-
°, %, Ês § jelek (%-kal) toldalÊkolt alakjainak kezelÊse.
-
Mozaikszavak (MÁV-osokat) kezelÊse.
-
Y-ra végződő szavak (boyjal, pennyvel) kezelése.
-
Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire-nek) kezelése.
-
KĂŠt szĂłbĂłl ĂĄllĂł fĂśldrajzi nevek (San FranciscĂł-i) kezelĂŠse.
-
HibĂĄs alakok tiltĂĄsa (Babitssal, tanit, alkotĂłmĹąvĂŠsz stb.)
-
TiltĂĄsok jelzĂŠse a felhasznĂĄlĂłi felĂźleten.
-
EgyÊb (pÊldåul az Ispell ragozott utószó esetÊben bårmilyen szóÜsszetÊtelt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg).
-
Magyar nyelvű (illetve locale (7) függő) felület.
-
Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival.

SZERZŐ

A Hunspell az OpenOffice.org MySpell fĂźggvĂŠnykĂśnyvtĂĄrĂĄn tovĂĄbbfejlesztĂŠse. A MySpell affixumtĂśmĂśrĂ­tĂŠsĂŠnek mintĂĄja az International Ispell program volt.

A mintaként szolgáló International Ispell szerzője Geoff Kuenning, sok más elődje munkájára támaszkodva (l. ispell(1)).

A Myspellt Kevin Hendricks készítette a legjelentősebb nyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001-2002-ben (l. http://hu.openoffice.org).

A Hunspell programkĂśnyvtĂĄrat ĂŠs parancssori programot NĂŠmeth LĂĄszlĂł <nemeth@openoffice PONT org> kĂŠszĂ­tette 2002-2008-ban.