人工智能
文章平均质量分 67
tinygone
保险技术人,技术保险人
跑者
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OpenClaw+FunASR识别飞书发来的音频文件
本文介绍了为OpenClaw增加语音识别功能的实现过程。作者通过部署FunASR语音识别服务,将飞书接收的ogg音频转换为wav格式后发送给FunASR进行识别。详细记录了环境搭建步骤,包括创建conda环境、安装依赖库、启动FunASR服务器等。同时开发了OpenClaw的语音处理技能和中间件脚本,实现了从接收语音消息到文本转换的完整流程。最终测试显示该功能在GLM-5和本地Ollama运行的qwen3.5:9b模型上都能正常工作,成功将语音消息转换为可处理的文本内容。原创 2026-03-15 17:33:09 · 1127 阅读 · 0 评论 -
FunASR识别独立的语音文件问题
第一次使用FunASR,对于它的原理、用法还不熟,借用AI,只是提高效率,对于我不熟、AI也不熟的地方,实在没有好的方法,只能一步一个脚印、走一步踩一坑地走下去。维度WebSocket服务器本地直接调用正确率大部分一样,最后一段差优加载速度优,免加载差,耗时识别速度同同性能消耗差,不用也会消耗优,按需调用内存占用差,持续占用内存优,按需调用由于我是要在OpenClaw中使用飞书调用FunASR识别我发的语音,两种方案都差不多。我就暂时先按照WebSocket服务器来用。原创 2026-03-14 23:06:14 · 540 阅读 · 0 评论 -
反馈一下GLM套餐使用感受
由于之前的没有截图,只凭记忆,PRO套餐每5小时有600次左右的prompt,且没有周的限制。这次更新套餐计划后,增加了周prompt次数限制。在使用上体验就觉得变差了,经常遇到模型限制、API速率限制。我是GLM Coding Plan PRO套餐,26年1月底购买的,刚好用上了跨年优惠,觉得还挺实惠的。网上有人说智谱卖太多了,一核算发现要亏钱,赶紧偷偷改套餐,想挽回点损失。虽然也收到了退款的通知,但是考虑到性价比还可以,暂时还不计划退款。在马年之前,智谱更新了GLM-5,同时也更新了套餐计划。原创 2026-03-06 22:13:24 · 696 阅读 · 0 评论 -
本地部署通义FunASR服务(中)
上一篇只是将FunASR在本地环境调试好,解决了基本问题,并验证可行性。本文将实现在本地启动一个实时处理语音识别的服务。原创 2026-03-03 23:21:48 · 85 阅读 · 0 评论 -
本地部署通义FunASR服务进行语音识别
本文记录了在本地部署通义实验室Fun-ASR语音识别服务的完整过程。使用Anaconda创建Python 3.12环境,从源码安装FunASR,并下载Fun-ASR-Nano模型。通过示例代码验证了中文语音识别功能,支持31种语言识别。部署过程中遇到官方文档不够详细的问题,作者详细记录了每个步骤供后续参考。最后反思了技术实践的重要性,认为亲自部署虽然困难但能加深理解,如同取经之路需要亲身经历才能真正掌握工具使用。整个部署涉及环境配置、模型下载和功能验证三个主要环节。原创 2026-03-02 23:32:20 · 670 阅读 · 0 评论
分享