实时翻译、解说加聊天…… 科技公司为何纷纷布局AI耳机?

2024年,被很多人看作是AI硬件的元年,不少有趣的AI可穿戴设备在这一年诞生,其中就包括AI耳机。AI耳机的好处在于,在充分利用AI感知能力的同时,最大限度地优化了便捷性,与手机形成了明显的差异化。

科技大厂布局AI耳机

随着手机中音频、视频内容占比的逐渐增加,人们对长时间佩戴耳机的需求越来越大。这标志着耳机从仅用于听音乐或打电话的单一功能,转变为多功能普适性产品,成为接收各类多媒体信息的设备。也就是说,耳机已经能够完成多媒体内容与日常信息交流的处理,论重要性、计算能力它已成为仅次于手机的第二大可携带计算设备。从目前看,多家科技大厂有意布局AI耳机并且有所行动。

据国外媒体报道,Meta平台正在探索开发带有摄像头的人工智能耳机,希望这种设备能用来识别物体和翻译外语。这个项目在Meta内部被称为“Camerabuds”。OpenAI则有消息传出,正在探索开发带摄像头的耳机设备。不仅如此,苹果也在探索在其耳机中加入摄像头和AI。

今年4月,Alphabet 旗下实验室Google X孵化的Iyo公司,推出了一款AI蓝牙耳机Iyo One。它的外观是一副体型更大的蓝牙耳机,没有屏幕,专注于自然语言的语音交互。在应用场景上,比如收到邮件或短信时,不必拿出手机、滑动、打字,完全可以一边坐着喝咖啡,一边用耳朵和嘴巴收发信息。

录音转写实时翻译方便办公

国内方面,科大讯飞近两年推出数款面向办公场景的AI耳机。它们搭载了先进的AI技术,具备精准的语音识别、录音转写、实时翻译和AI总结及问答等功能,能够轻松应对各种会议商务和学习等场景,为用户提供高效、便捷的沟通体验。

2024年4月,智能声学品牌Cleer发布了全球首款开放式AI耳机CleerARC3音弧,面向的则是个人生活场景。该款耳机中内置了AI运动算法,可帮助用户实时监控运动生理数据;在交互上集成了出门问问的语音控制技术,升级了AI语音控制,无须提示词唤醒语音助手,使用“下一首”“接听电话”等快捷口令即可进行相应操作;另外还实现了AI降噪效果。

接入大模型拥有通用智能

近日,字节跳动旗下豆包发布了首款 AI 智能体耳机 Ola Friend。该款耳机接入豆包大模型,并与豆包App深度结合。用户戴上耳机后,无须打开手机,便能通过语音,调用手机上的App进行交流。由于耳机接入大模型后拥有了通用智能,因此在旅游、英语学习、聊天等场景中有了新的体验。比如游览博物馆、艺术馆时,用户可以向它询问展品、艺术品的由来及背景,它还能延展至朝代变迁、艺术家理念等话题,一定程度上充当了导游角色,非常便捷。此外,针对一些“突发奇想”的闲聊和情绪表达,它的回复也非常亲切,能够表现出高兴、意外等情绪,让用户能够像和朋友聊天一样与AI交流。并且,用户在沟通时可以“边听边说、随时打断”,还能随时切换话题。

此外,还有一些耳机厂商通过为耳机充电盒上加入屏幕,并且通过配备SIM卡槽、搭载深度定制的操作系统,以及引入AI功能来增强产品的竞争力,比如iKKO ActiveBuds就是这种设计思路的产物。它内置独立智能系统,将耳机与移动通信、AI语音、翻译等功能融合在一起,支持超过45种语言的双向实时翻译,无须额外设备即可实现。并且,由于可以通过SIM卡独立网络连接,跑步时不带手机,也可通过耳机流量聆听爱心歌单,打电话发短信等。

更多精彩内容,请下载科普中国客户端。

返回人民网科普频道

(责编:邢郑、孙娜)

分享让更多人看到

千百度
© 版权声明
THE END
喜欢就支持一下吧
点赞286 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容