Puheen tunnistaminen on osoittautunut tietotekniikan alalla haastavaksi tehtäväksi, eikä läheskään täydellisiä järjestelmiä vielä ole. Käyttökelpoisella tasolla sentään olla jo, ainakin jos puhujan äidinkielenä on englanti.
Bing Blogsin julkaisemassa jutussa kerrotaan, kuinka Bingin puheentunnistusta on parannettu niin sanotun DNN-tekniikan (Deep Neural Networks) avulla. DNN-tekniikan inspiraationa on käytetty aivojen neuroneja ja niiden rakennetta. Sen avulla äänikomennot suoritetaan nyt kaksi kertaa nopeammin ja tunnistetaan noin 15 prosenttia tarkemmin kuin ennen.
Edit: Korjattu Microsoft Researchin osallisuutta juttuun.
Kommentoi artikkelia