Meetup IV – Lighting talks (12. 11. 2014)

Po dvou týdenní pauze jsme se opět sešli v Paralelní Polis ale tentokrát trochu s jiným programem – viděli jsme 5 (+1) cca deseti minutových lighting talků z různých zajímavých oblastí. Pojme si je shrnout.

IMG_20141112_183519

Jako první se slova ujali slova Jana Papoušková a Lukáš Drápal ze společnosti CGI a řekli nám něco o platformě Kaggle.com – místo, kde (většinou) velké společnosti vypisují soutěže týkající se jejich problémů, ktIMG_20141112_184102eré mohou data scientists řešit. Jana a Lukáš dokonce jednu z těchto soutěží vyhráli v konkurenci dalších 1400 týmů a dali nám všem tipy, jak v podobných challenges uspět.

IMG_20141112_184102

 

Jako další nastoupil Ondřej Pluskal – student doktorského programu na FEL ČVUT a data scientist ve společnosti Geewa. Mluvil o využití machine learningu v počítačových hrách – například k segmentaci hráčů či predikci in-app nákupů v online hrách, čímž se právě v Geewě zabývá.

IMG_20141112_185358

Petr Baudiš mluvil o svém Question answering systému pro otevřenou doménu dotazů, což znamá, že umí odpovídat na otázky ohledně čehokoliv. Pipeline jeho systému (vlastním jménem brmson) je podobná jako v případě IBM Watson – po anotaci vstupní otázky lingistickými příznaky dojde na entity recognition, poté fulltext search v anglické Wikipedii, čímž se získá seznam kandidátů na odpověď. Ty se ohodnotí logistickou regresí a vrátí se nejpravděpodobnější odpověď. Důležitým příznakem pro tuto poslední fázi je určení, zda vyhledaná odpověď je „stejného typu“ jako otázka (je to řeka? je to osoba? apod.).

IMG_20141112_190852

Marek Modrý ze Seznam.cz nám představil problém Learning to Rank – jak se naučit řadit množinu elementů? Vymezil se oproti přístupům používající regresi či klasifikaci a představil dnešní state-of-the-art metody založené na MART (Multiple Additive Regression Trees). Ty fungují tak, že se snaží aproximovat kriteriální funkci reprezentující kvalitu seřazení (která není diferencovatelná a celkově není hezky vychovaná) pomocí mnoha (stovky až tisíce) mělkých stromů.

IMG_20141112_192944

 

Další byl na řadě Josef Moudřík z MFF UK. Představil nám problémy AI ve hře Go a metodu, jak je částečně řešit pomocí pattern miningu z odehraných her profesionálních hráčů. Díky tomu je schopen predikovat herní styly protivníků či klasifikovat chybné tahy pravděpodobně vedoucí k prohře.

IMG_20141112_194417

Jako poslední promluvil zástupce společnosti Plantyst zabývající se monitoringem průmyslových provozů a různých jiných strojů. Chtěl od nás zjistit nějaké nápady co by se dalo dělat s daty, která mají uloženy za několik posledních let, popřípadě chtěl nahirovat někoho, kdo by jim problém pomohl řešit. V podstatě se jedná o hledání rozličných anomalit a predikci budoucího selhání systému tak, aby včasné řešení minimalizoval ztráty na výrobě.

IMG_20141112_200047

Podle vašich ohlasů se vám všechny talky líbili a chtěli byste speakery pozvat znovu na kompletní přednášku. Díky za vaši přízeň!