通义上线Fun-ASR1.5,主打方言识别
快链头条 2026-04-20 14:29:55
据 动察 Beating 监测,通义实验室 4 月 20 日发布语音识别模型 Fun-ASR1.5,并已在阿里云百炼上线 API、在魔搭社区开放在线体验。官方称,这一版用单模型覆盖 30 种语言、汉语七大方言体系和 20 多种地区口音,不再按方言单独切模型。
通义给出的内部评测显示,典型方言场景的字错误率较上一版相对下降 56.2%,已有 5 种方言准确率超过 90%,15 种超过 80%。古诗词识别也被单列出来做了专项优化,官方给出的内部字符级准确率是 97%。这些数字都来自通义自测,不是第三方基准。
中文语音识别里最难处理的方言长尾,开始被收进同一套可直接商用的能力。对教育直播、地方政务热线、采访整理这类场景来说,接入方不用再按地区口音拆多套识别链路,部署会简单一些。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
伊朗副总统称将严厉回击对伊朗能源设施的袭击
04-24 17:02(2分钟前)
Glassnode:Hyperliquid上巨鲸持续做多,认为比特币将突破震荡区间
04-24 16:52(11分钟前)
Willy Woo:比特币走势更接近纳斯达克,或仍需十年被认可为避险资产
04-24 16:46(18分钟前)
前字节工程师:中国AI从业者普遍依赖美国Agent工具,国产编码Agent「完全不实用」
04-24 16:41(22分钟前)
前字节Seed工程师:字节一轮迭代要半年,谷歌传闻只需三个月
04-24 16:40(23分钟前)
发布季度报告或成非必选项,但分析师预计绝大多数美国公司仍将按季度发布财报
04-24 16:31(32分钟前)
DeepSeek V4发布首日中美开发者反应:架构创新获认可,但「仍落后前沿半年」成共识
04-24 16:26(38分钟前)
Aave Chan创始人提议设立存款金库:以收益偿还Aave缺口,以避免市场恐慌
04-24 16:23(40分钟前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。