自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

罗索工作室

Rosoo Studio

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 OddASR:基于FunASR的API封装,支持离线转写+流式转写

github上有好多FunASR的API封装,但是全是离线文件转写的,没有一个同时支持离线文件转写和流式转写的API封装项目,想了一下干脆直接把它开源出来吧。希望对有ASR需求的同学有帮助。

2025-06-09 18:54:23 952

原创 快速入手最新的Gemma 3n:一个手机、平板、笔记本皆可运行的多模态文本+图像+音频的全能模型

Google 把这玩意儿一出,好了,我又有得搞了。小落同学又要大改了。但是我又对我的小落同学有了更多的一些期待了。之前的ASR用了一些小模型,结果识别准确率太差;然后用白嫖的百度文心一言LLM API,它的上下文只有8K,稍长一点的记忆他就忘记。这下有了32K上下文并且全能的Gemma 3n,咱可以看来搞搞看,效果会是如何。加油!

2025-05-25 02:12:39 659

原创 Three.js:经过一番痛苦的思想斗争,我还是放弃了3D虚拟人,转投2D

在过去的一段时间里,我花费了大量精力钻研three.js技术,期望能将小落同学的形象塑造为3D虚拟人,实现与用户的交互功能。为此,我对vrm/obj/fbx模型进行了反复调整,还结合mixamo的动作资源进行适配。然而,无论我如何努力,始终无法达到理想的效果。在实际展示中,模型与动作之间总是存在各种问题,比如部分动作出现模型撕裂现象,或是动作呈现出不自然的颤抖,这让我十分苦恼。经过五一假期的深思熟虑,我决定暂时搁置3D方案,转向2D领域寻求解决办法。

2025-05-04 16:17:00 694

原创 ASR引擎测试:FunASR,再给阿里点一个赞

凭良心讲,阿里在开源FunASR的时候是真的够诚意,很地道。FunASR这玩意儿TMD基本上就是一个商业化的东西直接开源出来给大家用了。

2025-04-27 13:40:33 1110

原创 可能是最紧凑、最轻量级的ASR模型:Vosk实战解析

前面在我的笔记本上用FunASR和PaddleSpeech为小落同学整合了一下ASR的功能,但是发现在我的阿里云ECS上跑不动,由于是乎就想找一个最轻量级的ASR模型,让小落同学也可以用上免费白嫖的ASR功能。

2025-04-20 23:24:11 785

原创 Dify + 知识库预研:性能、部署与测试全揭秘

Dify + 知识库预研:性能、部署与测试全揭秘

2025-04-15 23:02:12 924

原创 关于String转化的问题

现有一个文本文件里边内容如下:0x88;0xB2;0x01;  我把这个文本文件读出来后要把这些数字转换成一个char* szBuffer;szBuffer = (char*)malloc(3);szBuffer[0] = 0x88;szBuffer[1] = 0xB2;szBuffer[2] = 0x01;sscanf( token, "%x", &i );

2006-02-24 13:56:00 658

将TS流文件发送到以太网络上(源码)

一个小工具,将TS流文件发送到以太网络上。 支持使用UDP或者RTP协议。 根据TS流的PCR值跟踪时间同步发送。 我用的GetTickCount进行发送时间同步,线程按照10毫秒进行轮回,按照Win32系统普通线程切换时间,应该可以保证到10毫秒左右的同步精度。 但听人提过使用GetTickCount进行时间同步,长时间会有时间漂移现象,而且误差会逐渐累加,直到客户端缓冲溢出。对方提出的解决方案是使用GPS卫星时间同步... 个人以为GetTickCount是使用Win32底层的某个高精度时间结果。在微观上不是很精确,但是宏观上应该是很精确。 我实际曾经使用这个工具,发送过同一个文件三天三夜,客户端使用VideoLan进行在线播放,缓冲设置300ms,没有发现VideoLan缓冲有溢出的情况。 如果这种同步方式,长时间发送,确实有精度问题,希望有同志给出例证和解决方案(除了使用GPS卫星时间以外的方案...)。以便我改进。 demo中根据以太网通常的MTU值直接按7个TS包进行封装: SetGetTsPacketDataCB(GetTsPacketData, NULL, TS_PACKET_SIZE_MIN*7); 如果是其他网络类型,需要根据网络的MTU值调整TS包数量。

2009-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除