Korpusová lingvistika
Korpusová lingvistika je studium jazyka jak vyjadřovaný v ochutná (soubory) nebo “skutečný světový” text. Pult přiblížení na přistání k Noam Chomsky' s názor, že skutečný jazyk je prošpikovaný výkonem-příbuzné chyby, tak vyžadovat opatrnou analýzu malých řečových vzorků získaných ve velmi kontrolovaném laboratorním nastavení. Korpusová lingvistika se zbaví Chomsky schopnost/výkon se rozštěpí, sledovací že my můžeme jen někdy spolehlivě zkoumat jazyk jestliže výzkumník nepřekáží.V některých oblastech je překrývání s matematickou lingvistikoujak druhými pohyby k jazykovému vyřízení žádostí. Toto znamená zabývat se skutečnými vstupními údaji, kde popisy založené na intuici lingvisty nejsou obvykle nápomocné.
Pole bylo založeno v roce 1967 když Henry Kucera a Nelson Francis publikoval jejich klasickou knihu Výpočetní analýza dnešní americké angličtiny, na východisku pro hnědý soubor, opatrně zkompilovaný výběr aktuální americké angličtiny, tvořit o miliónu slova kreslená od široké palety zdrojů. Kucera a Francis podřizoval to paletě výpočetních analýz, od kterého oni kompilovali bohatý a pestrý opus, spojující se prvky lingvistiky, psychologii, statistiky a sociologii.
Krátce potom Boston publikovatel Houghton-Mifflin blížil se k Kucerovi dodávat slovo miliónu, tři-lemovat základ pochvalné zmínky pro jeho nový Americký dědický slovník, první slovník být sestaven používat korpusovou lingvistiku. AHD udělal inovační krok kombinovat nařizovací elementy (jak jazyk should být používán) s popisnými informacemi (jak to vlastně je použitý).
Jiní publikovatelé drželi barvu. Britský vydavatel Collins je COBUILD slovníky, určený pro uživatele se učit angličtinu jako cizí jazyk, byl také kompilován používat korpusovou lingvistiku.
- soubor
- shoda (KWIC)
- kolokace
- sémantická prozódie
- lexikální profily
- strojový překlad
- paměť překladu