Meetup III. – O. Plátek, L. Žilka – Učíme se mluvit s počítačem (29.10.2014)

Ve středu 29.10.2014 jsme se opět sešli, tentokrát v krásných prostorách Paralelního Polis v Holešovicích, na přednášku s názvem Učíme se mluvit s počítačem. Ondra Plátek a Lukáš Žilka z Ústavu formální a aplikované lingvistiky na MFF UK. Představili nám hlavní komponenty jejích dialogového systému Alex. Pokud si jej chcete vyzkoušet a zároveň pomoci rozšířit trénovací množinu učících algoritmů, zavolejte na 800 899 998.

mlmu3b

Začátek přednášky. Proč si povídat s počítačem?

Pipeline systému Alex začíná speech recognition komponentou, která nejprve provede základní techniky zpracování signálů – low pass filter, filtrace šumu apod. Dále se signál segmentuje do časových okýnek, které zhruba reprezentují trifonémy. Ty jsou zclusterovány (pro redukci dimenze) a dále jsou poslány pro evaluaci do akustického modelu, který spočítá pravděpodobnost pozorování signálu za podmínky nějaké hypotézy (slova). Tento model je realizován pomocí HMM. Dále se bere ještě v úvahu pravděpodobnost vlastní hypotézy (language model) realizovaný pomocí n-gram modelu natrénovaného specificky pro doménu Alex.

Takto se vybere list best-n hypotéz, které poté prochází dalšími komponentami, jako například entity recognition, aby se z textu vyparsovala důležitá slova, na které se uživatel vlastně ptá. Následuje komponenta která formou stavového automatu určí, zda-li má dostatek informací k poskytnutí odpovědi nebo jestli se ještě na něco zeptá.

Po syntéze odpovědi (šablonový systém) je výsledek předán do komerčního speech syntetizátoru a přehrán přes telefon.

mlmu3a

Po krátké diskusi po přednášce jsme se přesunuli do blízkého restauračního zařízení, kde jsme dále diskutovali nápady na vylepšení Alex, pravděpodobnostní interpretaci výstupu SVM a řeč přišla i na jazyk Python a jeho varianty Cython, PyPI apod.

Těšíme se opět na dalším meetupu.