Strojový překlad
Strojový překlad (MT) je proces automatu překlad od jednoho přirozeného jazyka k jinému na počítači. Jeden z velmi nejčasnějších pronásledování v informatice, MT dokázal být nepolapitelný cíl, ale dnes množství systémů být dostupný který výstup produkce který, jestliže ne dokonalý, je dostatečné kvality být užitečný v množství oblastí, a pomoci lidským překladatelům.
Na 7 lednu 1954, první veřejná demonstrace MT systému byla držena v New Yorku u vrchní kanceláře IBM. Demonstrace byla široce ohlásena v novinách a dostal hodně veřejný úrok. Systém sám, nicméně, byl už žádná než co dnes by bylo nazýváno “hračkovým” systémem, mít jen 250 slov a překládat jen 49 opatrně vybraných ruských vět do angličtiny -- hlavně v poli chemie. Přesto to povzbudilo názor, že MT byl hrozící -- a zvláště povzbudil financování MT výzkumu, ne jen v USA ale celosvětový.
| Tabulka s obsahem |
| 1 úvod 2 lingvistické přístupy 3 uživatelé 4 vidět také 5 bezplatného softwaru 6 externích spojení |
Překlad je něco ale jednoduchý. To není pouhé nahrazení každého slova ale bytí schopné vědět to “všichni slov” v vyneseném rozsudku nebo frázi a jak jeden může ovlivnit jiný. Lidské jazyky sestávají z morfologie (slova cesty jsou stavěna od malého významu-nést jednotky), syntax (větná struktura), a sémantika (mínit). Dokonce jednoduché texty mohou být naplněné dvojznačnostma.
To je často argumentoval, že problém strojového překladu vyžaduje problém pochopení přirozeného jazyka být řešen nejprve. Nicméně, množství heuristických metod práce strojového překladu překvapivě dobře, včetně:
- Lexikální metody vyhledávání
- Gramatika založila metody
- Sémantika založila metody (znalosti-založený strojový překlad)
- Statistické metody
- Příklad založil metody
Statistický-založené metody (poslední dva) se vyvarovat manuální lexikální stavby a pravidla-psaní a místo toho pokusit se tvořit překlady umístěný na dvojjazyčný textové soubory, takový jako Kanaďan Hansard soubor, angličtina-francouzský záznam kanadského parlamentu. Kde takové soubory jsou dostupné, působivé výsledky mohou být dosáhl překládajících textů podobného druhu ale takových souborů být ještě velmi vzácný.
Daný dost dat, nejvíce MT programy pracují dobře dost pro rodilého mluvčího jednoho jazyka dostat přibližný význam co je napsáno jiným rodilým mluvčím. Obtíž dostane dost dat pravého druhu podporovat zvláštní metodu. Velký vícejazyčný soubor data potřebovaná pro statistické metody k práci nejsou nutná pro gramatiku založené metody, například. Ale pak, metody gramatiky potřebují zručného lingvistu opatrně navrhnout gramatiku, kterou oni používají.
Uživatelé
Přes jejich vlastní limitace, MT programy jsou současně používány různými organizacemi ve světě. Pravděpodobně největší institucionální uživatel je Evropské pověření, který používá vysoce přizpůsobenou verzi komerčního MT systému SYSTRAN se zabývat automatickým překladem velkého objemu předběžné návrhy dokumentů pro vnitřní užití.
To bylo nedávno odhalil to v dubnu 2003 Microsoft začal používat hybridní MT systém pro překlad databáze technických podpůrných dokumentů od angličtiny k španělštině. Systém byl vyvinut vnitrostátně Microsoft je přirozený jazyk výzkumná skupina. Skupina současně testuje angličtinu - japonský systém stejně jako přinášející angličtina - francouzský a anglický - německé tunelovací metody online. Latter dva systémy mluví učeným jazykem generační komponenta zatímco první dva mají ručně rozvinuté generační komponenty. Systémy byly rozvinuté a cvičily používat překladové pamětové databáze s přes milión odsoudí každého.
Bezplatný software
Externí odkazy
- Strojový překlad, úvodní průvodce MT D.J.Arnold al et. (1994)
- Altavista Babelfish, online služba strojového překladu
- Google překládá, online strojový překlad opravit (betu)
- Evropská asociace pro strojový překlad, nevýdělečné org