Kontrolované učení
Kontrolované učení je strojová učící technika pro vytvářet funkci z tréninkových dat. Data školení sestávají z párů objektů vstupu (typicky vektory), a požadované výstupy. Výstup funkce může být nepřetržitá hodnota (volala návrat), nebo moci předpovídat popiska třídy objektu vstupu (volala klasifikaci). Úloha kontrolovaného žáka má předpovídat hodnotu funkce pro nějaký platný vstupní objekt poté, co viděl jediný malé množství příkladů tréninku (tj. páry vstupu a cílové výroby). To dosáhne tohoto, žák musí zevšeobecnit z představovaných dat k neviditelným situacím v “rozumné” cestě (viz indukční zaujatost). (vyrovnat se unsupervised učení.)Aby řešil daný problém kontrolovaného učení (např. učit se poznat rukopis) jeden musí zvažovat různé kroky:
- Určujte druh příkladů tréninku. Dříve dělat něco jiného, inženýr by měl rozhodnout co druh dat má být používán jako příklad. Například, toto by mohlo být jeden ručně psaný charakter, celé ručně psané slovo nebo celá řada písma.
- Sbírat soubor tréninku. Soubor tréninku potřebuje být charakteristický pro skutečné použití funkce. Tak, soubor objektů vstupu je sbírán a korespondenční výstupy jsou také sbírány, jeden od expertů člověka nebo od měření.
- Určujte vstupní rysovou reprezentaci učené funkce. Přesnost učené funkce závisí silně na jak objekt vstupu je reprezentován. Typicky, objekt vstupu je transformován do vektoru rysa, který obsahuje množství rysů, které jsou popisné objektu. Množství rysů by nemělo být příliš velké, protože prokletí rozměrnosti; ale should být velký dost přesně předvídat výstup.
- Určujte strukturu učené funkce a korespondenční učící algoritmus. Například, inženýr může rozhodnout se používat neuronové sítě nebo rozhodovací stromy.
- Dokončete design. Inženýr pak provozuje algoritmus učení na sbírané tréninkové scéně. Parametry algoritmu učení mohou být nastaveny tím, že optimalizuje výkon na podmnožině (volal validační soubor) souboru tréninku, nebo přes kříž-validace. Po upravení parametru a učení, výkon algoritmu může být změřen na souboru testu, který je oddělený od souboru tréninku.
| Tabulka s obsahem |
| 1 přístupy a algoritmy 2 aplikace 3 obecné záležitosti |
- analytické učení
- umělý neuronové sítě
- backpropagation
- podporovat
- Bayesian statistiky
- případ-založená úvaha
- rozhodovací strom učení
- programování induktivní logiky
- se učit teorii automatů
- naivní Bayesian klasifikace
- pravděpodobně přibližně opravit učení (PAC) učení
- symbolické strojové učící algoritmy
- subsymbolic strojové učící algoritmy
- podpůrné vektorové stroje
Aplikace
- bioinformatics
- rozpoznávání psaného písma
- získávání informací
- uznání objektu v vizi počítače
- optické rozpoznávání znaků
- detekce nevyžádaného e-mailu
- rozpoznávání vzorů
- rozpoznání řeči
Obecné záležitosti
- výpočetní učící teorie
- indukční zaujatost
- overfitting
- prostory verze