您的位置:首页 >业界 >

2020 CES,搜狗人工智能之路上的一张答卷

时间:2020-01-15 15:59:00 来源:网络整理

2019年8月28日,搜狗推出升级版AI录音笔C1 Pro。随后三天股价连续收涨,资本市场和投资者也认可了搜狗在AI录音笔上的不断加码。

一只小小的录音笔,究竟有怎样的魔力?

被改变的录音笔行业

受功能单一、易被智能手机替代等因素影响,传统录音笔一直供大于求,产量年均复合增长率连年下降。面对这种状况,录音笔厂商们也在不断寻找新的增长点,试图突破行业规模天花板。

2018年3月,搜狗推出智能翻译录音笔。一年后,搜狗发布主打录音转写功能的AI录音笔C1,不久便占领多个主流电商平台单品总销量第一名。

随着用户数量的不断增多,搜狗获得了更清晰的用户画像:每周录音频次超过三次以上的用户占比达60%;每周有41%的用户录音时间超过10分钟;商务会议、企业内部培训及记者采访为三大高频使用场景。

同质化产品只能打价格战,解决未被满足的需求才能拓展新市场。人工智能技术的加入,让传统录音笔行业焕发了新活力。

在C1 Pro录音笔发布当天,搜狗与爱国者、纽曼、索尼录音笔等合作伙伴成立了AI创新联盟,并开放了搜狗转写、同传等增值服务。在搜狗看来,只有让整个行业从降低成本的劣性竞争转变为软硬件服务联合,才能促进商业模式的升级。

业内人士也表示满足消费者更多需求的人工智能录音笔,将会带动行业反弹。

AI 录音笔的背后

触及需求考验的是产品定向能力,满足需求离不开技术支持。

保障转写质量的第一步是获得清晰的语音。除了双麦克风阵列的硬件支持,搜狗自研的purevoice AI降噪算法能应对环境音等噪音,针对室内混响等问题进行多重优化,有效增强目标声源拾音效果。

早在2011年,搜狗便已投身语音识别,采用行业前沿的深度学习方法解决这一难题。其中基于DTSS(Deep Transformer-based Sequence to Sequence model)的端到端声学模型、神经网络语言模型等技术,有效提升了搜狗语音识别的效果和体验。据称C1 Pro录音笔在0.3米范围内录音转文字准确率高达97%,2米内录音转写准确率达94%。

不止于此,在2018年10月举办的国际顶级口语机器翻译大赛IWSLT上,搜狗提交的翻译系统一举夺魁。2019年1月,搜狗搜索人工智能研究团队在对话型机器阅读理解挑战赛CoQA中夺得冠军,刷新了所有评价指标。

顶尖的技术能力不仅让AI录音笔成为现实,更催生了搜狗人工智能产品矩阵。能够充当同声传译的翻译宝PRO、保障儿童安全的糖猫智能手表,还有搜狗同传、搜狗分身术,此次CES展示的软硬件产品无不基于搜狗长期积累的人工智能技术。

过去和现在

早在2017年,搜狗在递交的上市招股书中就反复强调人工智能对于公司未来发展的重要性,称人工智能是智能硬件的关键推动力。

在一年前发布的内部信中,搜狗CEO王小川不仅以一系列数据佐证搜狗向人工智能转向的正确性,还表示将围绕人工智能投入更多资金,强化以语言为核心的人工智能技术的积累和探索,帮助用户在更多场景表达和获取信息。

以搜索起家,以输入法深入人心,今天的搜狗为何走上人工智能之路?

搜索、输入法、浏览器,搜狗PC时代的三级火箭本质上是人与机器的交互,是信息的输入和输出。人工智能能够改善的正是这一部分——未来人们需要的不该是“1=1”的刻板工具,而是辅助用户思考、作出判断选择的帮手。

搜狗的人工智能路径很清晰,是以语言为核心,让人机交互更加自然、让机器更聪明。

在一次采访中,搜狗CEO王小川曾提到“分身术、智能硬件只是一个大方向上的子集”。录音笔、翻译宝……这些硬件从来不是搜狗探索人工智能的终点,是阶段性成熟技术的应用,是探索人工智能之路上一份随堂答卷。

从浏览器、搜索、输入法,到人工智能技术加持智能硬件,搜狗接下来会走向哪儿?

时间会给我们答案。


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。