会“眼观六路”的摄像机,再加一个“能说会道”的功能,能有多受宠?开年不久,萤石智能摄像机就悄悄上线了很多实用功能,其中就包括网络收音等语音方面的能力,部分消费者已经率先感受了一把物超所值的体验。
而在更广大的行业市场,开发者也向我们提问,除了家用场景,部署于更多行业的海康/萤石摄像机,也可以使用这些语音能力吗?答案是当然可以,不仅如此,语音内容还可以根据场景需要丰富形式,实现针对性的信息精选和输出。
作为开发者,如果您服务的行业场景需要增加、完善设备的语音能力,我们已为你做好开发准备,并且,得益于快速发展的大模型能力,当前的语音服务也真正做到了快捷与精准,更好满足场景应用需求。
股市、新闻、英语学习展示(开发者服务):
摄像头DIY语音玩法
融合大模型自定义语音演示视频
开发方案技术路径:
(点击查看大图)
① 服务-检索能力: 根据场景需求设置,进行相关语音内容(如新闻)检索。
② AI-LLM能力:对检索到的语音内容,进行加工和处理。
③ AI-文本转语音:将大模型处理后的文本,转成设备支持音频文件。
④ 服务-云广播:通过萤石开放平台上传、下发指定音频文件。
⑤ 设备-音频能力:根据指定的文件进行音频播放(涵盖海康、萤石设备)。
开发者小贴士
内容检索和转化工具可参考:
https://dify.ai/
触发设备发起广播相关接口:
https://open.ys7.com/help/1430
以智能设备为载体,围绕视觉和音频服务,具有广阔的应用拓展空间,视频AI看懂万事万物的强大能力有目共睹,而得益于大模型技术的成熟使用,拥有慧眼的摄像机,又完善了语言表达的能力。
不止于家用,在行业应用中,基于萤石开放平台,摄像机等设备能看、能说、能听、能动的原子化能力进一步释放,结合萤石云AI服务,通过开发者的创新集成,更聪明的设备将服务于智能化场景中。