发布时间:2018-11-13 12:36:21编辑:下1个好软件
分割聚类(Diarization)是指根据“谁说了什么”将多人语言样本分割成相应的碎片段,再对所有碎片段进行聚类,把属于同一个说话人的片段都聚在一起,标注出这些碎片段属于谁。对于机器来说整个处理过程并不能像人类那样得心应手,而且机器学习算法的培训也要比想象中的更难。一个强大的分割聚类系统还要识别出此前并未关联的新语音碎片段。
不过朝着高性能模式发展的道路上,谷歌的人工智能研究部门已经取得了令人鼓舞的突破性进展。在最新发表的论文“Fully Supervised Speaker Diarization”[PDF]以及官方博文中,谷歌研究人员描述了一种全新的人工智能系统,能够让系统以更又有效的方式来使用声音样本标签。
这篇论文的核心算法在 NIST SRE 2000 CALLHOME的跑分中,能够在实时语音聊天应用中将在线分割聚类错误率(EDR)降低至7.6%。而谷歌此前在GitHub上开源的方式EDR为8.8%。谷歌研究人员的新方法就是通过递归神经网络(RNN)模拟说话者的输入(例如用数字方法表示说话者的单词和短语),这种机器学习模型类型能够使用内部状态来处理输入序列。
2024-11-05
姬成川姬云武小说 第13章无错版阅读
主角姬成川姬云武 小说老六皇子?开局请父皇砍头在线阅读
第5章小说无广告阅读 明昭月十八郎小说
小说废柴嫡女退婚后,满京都是裙下臣在线阅读
无广告小说废柴嫡女退婚后,满京都是裙下臣 明昭月十八郎在线阅读
废柴嫡女退婚后,满京都是裙下臣全文试读 明昭月十八郎小说全本无弹窗
明昭月十八郎小说无广告阅读
最新小说《绿茶往后让让,池夫人才是顶配黑莲花》大结局阅读
小说绿茶往后让让,池夫人才是顶配黑莲花 第2章