资讯
2023-09-13 15:25 来源:快科技 作者:快科技
用手机看
9月13日消息,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。
以公开数据集AudioSet-2M的音频数据作为训练集的音频标记模型,首次突破50 mAP的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一。
据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。
此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。
这项技术的突破意味着小米的声音识别算法能力再次精进,小米的众多智能硬件设备应用此项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。
小米此次精进后的声音识别算法,具有极高的应用价值。它能够广泛应用于小米的智能设备中,大幅提升用户的智能生活体验。具体来说,音频标记算法能够识别广泛的环境声音,比如婴儿的啼哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让环境中的声音以文字等模态表达。
此外,这项算法技术还广泛应用于小米机器人的研发中,大幅提升了机器人的感知能力。人形机器人CyberOne可以识别85种环境声音,能够通过听觉感知6类、45种人类情绪。而小米第二代仿生四足机器人CyberDog 2则可以识别38种环境声音,实现更强大的动态响应能力。
2023-09-13 开云电竞大平台报道:原始征途新区齐聚冲星大赛
2023-09-13 开云电竞大平台报道:御龙在天年度版空中国战(下)
2023-09-13 开云电竞大平台报道:御龙在天年度版空中国战(上)
2023-09-13 开云电竞大平台报道:银河恶魔城冒险游戏ULTROS演示
2023-09-13 开云电竞大平台报道:西游「泰初测试」现已开启
2023-09-13 开云电竞大平台报道:武林外传手游全新坐骑登场
2023-09-13 开云电竞大平台报道:天际线2预告介绍声音和音乐
2023-09-13 开云电竞大平台报道:死亡爱丽丝国际服宣布停运
2023-09-13 开云电竞大平台报道:蜀门新服龙骧虎啸携手登峰
2023-09-13 开云电竞大平台报道:命运之神公布托塔天王和嫦娥
2023-09-13 开云电竞大平台报道:免费吃鸡端游无限法则停运
2023-09-13 开云电竞大平台报道:梦幻聊斋新区重温经典
2023-09-13 开云电竞大平台报道:剑侠世界还原帮派恩怨情仇
2023-09-13 开云电竞大平台报道:航海王燃烧意志一起出航吧
2023-09-13 开云电竞大平台报道:海之乐章2新区群鸿戏海来袭
2023-09-13 开云电竞大平台报道:海战网游碧海黑帆破新的纪录
2023-09-13 开云电竞大平台报道:古剑奇谭网络版战意如血夕阳
2023-09-13 开云电竞大平台报道:高能英雄定档 官宣代言人王鹤棣
2023-09-13 开云电竞大平台报道:伏魔今日公测修真逆袭不是梦
2023-09-13 开云电竞大平台报道:飞吧龙骑士UR风龙华丽登场
2023-09-13 开云电竞大平台报道:传说级武器翎雀泣惊艳开屏
2023-09-13 开云电竞大平台报道:暗黑破坏神4推出新资料片
2023-09-13 云中君技能连招技巧,开云电竞大平台进行讲解
2023-09-13 云顶s8怪兽阵容开云电竞大平台攻略
2023-09-13 原神中值得培养的五星角色开云电竞稳定攻略
手游巴士
手游巴士