Offline eszközök
NooJ: a linguistic development environment
Fejlesztő: MTA Nyelvtudományi Intézet
A NooJ rendszer egy nagyon gyors, hatékony szövegelemző rendszer. Nevezhetjük integrált nyelvelemző környezetnek (INYEK) is a programozók által használt integrált fejlesztői környezetnek (IDE) mintájára. Max Silberztein francia nyelvész készítette, és számos egyetemen használják tucatnyi nyelv elemzésére. Elődje az INTEX rendszer.
Hunpos -- nyílt forráskódú szófaji egyértelműsítő
Fejlesztő: BME MOKK
Huntoken -- tokenizáló és mondatrabontó
Fejlesztő: BME MOKK
A HunToken program egy gyors shell szűrő sor, amely a természetes nyelvű magyar szövegeket mondatokra és tokenekre (szavakra) bontja. Lexikonépítéshez, információ-visszakereséshez, szövegbányászathoz és sok egyéb természetesnyelv-feldolgozó alkalmazáshoz is használható.
Fejlesztő: BME MOKK
A Hunmorph egy nyílt forráskódú eszköz és programkönyvtár, amely helyesírás-ellenőrzére, szótövesítésre és morfológiai elemzésre használható agglutináló nyelvekben, mint például a magyar, a németben és egyéb nyelvekben.
Hunalign -- mondatszintű párhuzamosító
Fejlesztő: BME MOKK
A Hunalign egy szabadon felhasználható automatikus mondatillesztő program párhuzamos korpuszok építésére.
Hunpars -- szintaktikai elemző magyar nyelvre
Fejlesztő: BME MOKK
A Hunpars egy szintaktikai elemző magyar nyelvre. Bemenetként egy szövegfájlt kap mondatokkal, kimenetként pedig megadja a mondatok szintaktikai fáját egy egyszerű zárójelezéses jelölésben és GrahpViz dot nyelvű fájlokban.