Milyen felismerési arány érhető el magyar nyelven?

Showing revision 2

Milyen felismerési arány érhető el magyar nyelven?

Ha a felhasználó lefuttatja egyszer azt a tanító programot, amivel felkészíti a beszédfelismerő gépet a saját beszédmódjára, beszédstílusára, akkor a betanítás hosszától, a hangminőségtől, mikrofontól, az alkalmazási területtől függően akár 90-98 százalékos felismerési arányt érhetünk el.

A tanító program két perces futtatása, már látványos javulást eredményez, de általában 15 percnyi diktálással lehet a rendszer működését lényegesen megjavítani.

A telefonos alkalmazási területeken (pl. ügyfélszolgálati rendszer) nincs mód a felismerőt a felhasználó beszédmódjára felkészíteni. Ilyenkor egy un. beszélő független felismeréssel kell dolgoznunk. Hogy a felismerési ráta elfogadható legyen, ilyenkor a szabadszótáras felismerés helyett megkísérelünk kevesebb szóval is vezérelhető kötött nyelvű (szabály alapú) alkalmazásokkal dolgozni. (Pár ezer mondat).

Ügyfélszolgálati alkalmazásoknál nemcsak a felismerési arány az érdekes, hanem legalább annyira fontos, hogy nehogy rossz mondatot, vagy szabályt ismerjen fel a rendszer. A Philips technológia alkalmas arra, hogy érzékelje, ha a felismerés nem eléggé megbízható. A dialógus vezérelt rendszer ekkor az operátorhoz irányítja az ügyfelet.

A beszédfelismerési technológia lényeges tulajdonsága, hogy képes a háttér állandó jellegű zajait kiszűrni, oly módon, hogy a rendszert szintén meg lehet tanítani a háttér zajaira. A beszélő hangjának átmeneti változásaira (megfázás, hangmagasság változás) a rendszer szintén nem érzékeny. Hümmögést, krákogást képes kiszűrni, a nem beszédhang jellegű audio jeleket detektálni. Hirtelen zajokra, vagy a telefonvonal minőségére a rendszer érzékeny. Képes érzékelni és értékelni, ha a várható felismerési arány nem lenne elfogadható.

Az egyes felhasználókat képes megkülönböztetni, de ez a technológia nem alkalmas hangfelismerésre, hang alapján történő azonosításra. A technológia lehetővé teszi, hogy a rendszer nagyszámú, előre megadott szó, kifejezés elhangzását felügyelje (audio mining).


Copyright © 2012 StartVox Kft     Oldaltérkép