Neuronová přesnost nad 95 procent
Model převodu řeči na text zpracovává audio pomocí hluboké neuronové sítě trénované na více než 100 000 hodinách vícejazyčných řečových dat. Zvládá přízvuky, překrývající se dialogy a technický žargon při zachování přesnosti slov nad 95 procent u čistých studiových nahrávek.
Podpora více než padesáti jazyků
Přepisujte audio ve více než 50 jazycích včetně angličtiny, španělštiny, mandarínštiny, arabštiny, hindštiny, portugalštiny a japonštiny. Software pro rozpoznávání řeči automaticky detekuje mluvený jazyk nebo jej můžete nastavit ručně u vícejazyčných nahrávek.
Diarizace mluvčích až pro deset hlasů
Engine pro rozpoznávání řeči s umělou inteligencí odděluje až deset různých mluvčích v rozhovorech, panelových diskuzích a podcastech. Každý segment mluvčího je označen a opatřen časovým razítkem, abyste mohli sledovat, kdo co řekl, aniž byste museli procházet audio.