Český a slovenský zahraniční časopis  
     
 

Leden 2008


Naučil počítače poslouchat

Karel Pacner

Frederick Jelínek je jedním ze zakladatelů moderního směru využití statistických metod v počítačovém zpracování jazyka. Dnes téměř všechny komerční i výzkumné systémy pro rozpoznávání řeči na světě používají metody, které on se svou skupinou rozpracovával ve výzkumném středisku IBM T. J. Watsona ve Spojených státech.

Z Československa se vystěhoval Frederick Jelínek - původním jménem Bedřich Jelínek - spolu s matkou legálně. Nicméně, když v roce 1957 dostal od bonnské vlády odškodnění za smrt otce v nacistickém koncentračním táboře, rozhodl se, že se podívá do Evropy. Ve Vídni ho napadlo, že by mohl zajet domů. Na československém konzulátu požádal o vízum.

Frederick se sešel s mnoha známými a hlavně potkal životní lásku Milenu Tobolovou, studentku Filmové fakulty Akademie múzických umění. Jelínkovi byla sympatická hned od prvního okamžiku. Několikrát se s ní sešel. Z Mnichova jí zavolal: „Chtěl bych si tě vzít. Souhlasíš?“ Jak ona dostane možnost k odjezdu z republiky, ovšem nevěděli.

Se žlutou hvězdou na kabátu

Bedřich se narodil 18. listopadu 1932 v rodině zubního lékaře na Kladně. MUDr. Vilém Jelínek byl žid, musel se obávat pronásledování a plánoval odchod do Británie. Známí mu odjezd rozmluvili: „Pane doktore, jste váženým občanem. Vám se přece nic stát nemůže...“ Na podzim 1941 se museli Jelínkovi odstěhovat do Prahy a později si museli otec a syn připevnit na kabáty žluté hvězdy - označení pro židy. V únoru 1945 byl otec zařazen do transportu do Terezína. Bedřich vyvázl, protože matka, která nebyla židovka, už dřív písemně prohlásila, že Bedřichovým otcem není její manžel, ale árijec. Přes různé lidi podplatili gestapáky, aby této pohádce uvěřili. Koncem dubna 1945 vypukla v Terezíně epidemie tyfu. MUDr. Jelínek se při ošetřování pacientů nakazil a 11. května zemřel. Bedřich nastoupil do gymnázia v Dušní ulici. Matka po převratu v únoru 1948 Gottwaldův režim prokoukla a rozhodla, že se vystěhují. „Podruhé už takovou chybu neudělám, abych zůstala,“ říkala. Energetická paní vyřídila pro sebe a syna vystěhovalecké pasy. Současně požádala o vízum ve Spojených státech. „Matka se narodila českým rodičům v Curychu, a proto měla nárok na to, aby ji Američané brali jako Švýcarku,“ vysvětluje Jelínek. Koncem října dorazili do New Yorku. Matka si zprvu vydělávala tím, že vařila v několika rodinách, nakonec se usadila jako kuchařka v české sokolovně a v Národním domě.

Tvrdá léta studentská

„Ještě doma jsem přemýšlel o tom, že se stanu právníkem. Ale v Americe byla tahle dráha pro mne zavřená. Vždycky zůstane v mé angličtině neamerický přízvuk - a ten by u soudů nevypadal dobře. Kromě toho studium práv tam trvá sedm let - a já musel vydělávat peníze, abych přispíval matce,“ říká Jelínek. Rozhodl se pro elektrotechniku, která trvá jenom čtyři roky. Aby měl na školné, zapsal se na večerní studium v newyorské City College. Ve dne jezdil do továrny vyrábějící transformátory, vypomáhal v laboratoři. Po dvou letech získal stipendium od Výboru pro Svobodnou Evropu. Musel podepsat závazek, že jakmile se Československo stane opět svobodným státem, hned se tam vrátí. Udělal to rád, taková představa ho lákala. Mohl tedy nastoupit na denní studium na technice svých snů - na Massachusettský technický institut u Bostonu. V roce 1956 získal titul bakaláře věd v oboru elektrotechniky. Zůstal na technice jako asistent a pracoval na velkém doktorátu. Americkým občanem se stal v roce 1955. Jeho přítelkyně Milena Tobolová usilovala o to, aby ji československé úřady pustily za ním do USA. Marně. Ani FAMU jí nedovolili dokončit, protože se chtěla vystěhovat. Když si ji chtěl Frederick vzít, úřady jim svatbu nepovolily. A Milena zůstala nezaměstnaná. Nakonec prostřednictvím ředitele laboratoře pro výzkum elektroniky Jerome Wiesnera požádali o pomoc průmyslníka Cyruse Eatona, který se přátelil se sovětským vůdcem Chruščovem. Začátkem ledna 1961 slečnu Tobolovou propustily úřady z československého občanství a umožnily jí odjezd do Mnichova. V pátek 4. února 1961 se v Cambridge konala svatba. Po čtyřletém úsilí.

Na čas u IBM

V témže roce obhájil Jelínek doktorskou práci z kybernetiky. Avšak přitahovala ho lingvistika. Na podzim 1962 se přestěhoval na prestižní Cornellovu univerzitu ve státě New York. O každých letních prázdninách si zařídil nějakou práci mimo univerzitu. A tak se dostal do střediska IBM pro zpracování jazyka a řeči v Yorktown Heightsu. Když pak vedoucí střediska odcházel do funkce ředitele filiálky v Tel Avivu a nového nemohli sehnat, vzpomněli si na Jelínka: „Nevzal bys to? Aspoň na čas.“ Požádal tedy univerzitu o roční neplacené volno. A po roce, kdy ho nová práce zaujala a pořád nebyli hotovi, o další rok. Po dvou letech na profesorské místo rezignoval. „Hledali jsme principy, které by počítači umožnily, aby zachytil, rozpoznal a správně zapsal mluvené slovo,“ vysvětluje profesor Jelínek. „Můj indický kolega a já jsme se dosud zabývali teorií informace, americký kolega byl fyzik. Šli jsme na tento problém víceméně jako laici, jako lidé, kteří nejsou zajatci obvyklých lingvistických přístupů. Mohli jsme proto zvolit úplně novou cestu, kterou by lingvisté možná považovali za nesmyslnou. Dřeli jsme na tom dvě desetiletí. Každý člověk má jinou výslovnost, u každého slova existuje mnoho variant, proto není dokonalý převod hlasu do stroje jednoduchý. Zjistili jsme, že pravděpodobnost správného zachycení se dá statisticky zpracovat. To je princip, který se stal základem pro všechny další práce,“ vzpomíná.

„Profesor Jelínek šel proti proudu tehdejších teorií, a to mu umožnilo, aby se stal průkopníkem využití statistických metod na lidskou řeč,“ říká docent Jan Hajič, ředitel Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze. „Proto v amerických vědeckých kruzích zazářil jako hvězda první velikosti.“ Sám Jelínek říká: „Současné počítače, které umějí rozpoznávat lidskou řeč, používají slovník asi 60 tisíc slov. I když do počítače neuložíte všechny možné varianty slov, tak pro mluvenou angličtinu je tento počet dostatečný, protože pokrývá až 99 procent všech možných promluv.“ Metody, které navrhl, pracují na statistickém principu. Využívají například poznatku, jak často se v daném jazyku objevují za sebou určitá slova. Statisticky se popisují i krátké zvuky, které člověk postupně vysloví při promluvě nějaké věty. Na základě počítačového rozpoznávání řeči vznikly například automaty pro nákup jízdenek - cestující vysloví stanici, kam chce jet, a dobu odjezdu vlaku a automat cestujícího obslouží. Ve Spojených státech existují též některé telefonní informační služby, kde vám počítač odpoví hlasem na dotaz ohledně nejbližší čínské restaurace nebo policejní stanice či obchodu s elektronikou. Na stejném principu se konstruují i miniaturní překládací stroje. Uloží se do nich základní věty a jejich překlad v jiném jazyce. Pomocí statistických metod program zjistí, jak byly jednotlivé formulace přeloženy, a zapamatuje si ty nejčastější.

Americká armáda si těchto aparátů nechala vyrobit stovky, zkouší je v Afghánistánu a v Iráku. Samozřejmě mají omezenou kapacitu, ale pro první porozumění jsou důležitá. V roce 1998 shrnul Jelínek tyto poznatky v knize, která je dnes biblí rozpoznávání řeči pomocí počítačů. „Dnešní výzkum se soustřeďuje na získávání informací z namluvených souborů,“ říká Jelínek. „Jde o schopnost počítačů analyzovat lidskou řeč. Některé počítače už můžeme naučit zachycovat určitá konkrétní témata. Například se používají při zpracování výpovědí lidí, kteří přežili holocaust - ty byly zaznamenány v mnoha jazycích v rámci projektu Malach, což v hebrejštině znamená Anděl. Počítače by v nich měly najít témata a zážitky, které se opakují, ty roztřídit a umožnit tak historikům, aby získali obecnější pohled na tyto strašlivé události.“

Společné projekty s Prahou

„Béďa“, jak mu čeští kolegové říkají, navázal styk s Ústavem formální a analytické lingvistiky Matematickofyzikální fakulty Univerzity Karlovy. Strávil tam rok 2001 jako hostující profesor a „bez nároku na plat“. V listopadu mu univerzita udělila titul doktora honoris causa. S lingvistickým ústavem pracoval i na několika projektech včetně automatického rozpoznávání češtiny a strojového překladu. „Za těch víc než třicet let jsme v počítačové lingvistice neudělali žádný zásadně nový objev,“ konstatuje Jelínek. „Pořád se snažíme zdokonalovat věci už vymyšlené. A kdy začnou počítače mluvit a myslet jako člověk? Nevím, zatím taková představa není na obzoru.“

(MFDNES)Zpátky