- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 OddASR:基于FunASR的API封装,支持离线转写+流式转写
github上有好多FunASR的API封装,但是全是离线文件转写的,没有一个同时支持离线文件转写和流式转写的API封装项目,想了一下干脆直接把它开源出来吧。希望对有ASR需求的同学有帮助。
2025-06-09 18:54:23
952
原创 快速入手最新的Gemma 3n:一个手机、平板、笔记本皆可运行的多模态文本+图像+音频的全能模型
Google 把这玩意儿一出,好了,我又有得搞了。小落同学又要大改了。但是我又对我的小落同学有了更多的一些期待了。之前的ASR用了一些小模型,结果识别准确率太差;然后用白嫖的百度文心一言LLM API,它的上下文只有8K,稍长一点的记忆他就忘记。这下有了32K上下文并且全能的Gemma 3n,咱可以看来搞搞看,效果会是如何。加油!
2025-05-25 02:12:39
659
原创 Three.js:经过一番痛苦的思想斗争,我还是放弃了3D虚拟人,转投2D
在过去的一段时间里,我花费了大量精力钻研three.js技术,期望能将小落同学的形象塑造为3D虚拟人,实现与用户的交互功能。为此,我对vrm/obj/fbx模型进行了反复调整,还结合mixamo的动作资源进行适配。然而,无论我如何努力,始终无法达到理想的效果。在实际展示中,模型与动作之间总是存在各种问题,比如部分动作出现模型撕裂现象,或是动作呈现出不自然的颤抖,这让我十分苦恼。经过五一假期的深思熟虑,我决定暂时搁置3D方案,转向2D领域寻求解决办法。
2025-05-04 16:17:00
694
原创 ASR引擎测试:FunASR,再给阿里点一个赞
凭良心讲,阿里在开源FunASR的时候是真的够诚意,很地道。FunASR这玩意儿TMD基本上就是一个商业化的东西直接开源出来给大家用了。
2025-04-27 13:40:33
1110
原创 可能是最紧凑、最轻量级的ASR模型:Vosk实战解析
前面在我的笔记本上用FunASR和PaddleSpeech为小落同学整合了一下ASR的功能,但是发现在我的阿里云ECS上跑不动,由于是乎就想找一个最轻量级的ASR模型,让小落同学也可以用上免费白嫖的ASR功能。
2025-04-20 23:24:11
785
原创 关于String转化的问题
现有一个文本文件里边内容如下:0x88;0xB2;0x01; 我把这个文本文件读出来后要把这些数字转换成一个char* szBuffer;szBuffer = (char*)malloc(3);szBuffer[0] = 0x88;szBuffer[1] = 0xB2;szBuffer[2] = 0x01;sscanf( token, "%x", &i );
2006-02-24 13:56:00
658
将TS流文件发送到以太网络上(源码)
2009-11-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人