- 博客(5)
- 收藏
- 关注
原创 pandas读取wps编辑后的csv文件报错
用wps编辑b一个csv文件,保存后用pandas.read_csv方法读取后一直报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte,网上找资料也主要是两种方法,一种是read_csv方法加encoding参数,另一种是Notepad++、wps等软件将文件“另存为”的方式指定编码格式,然后再取读取。
2026-03-24 10:06:07
172
原创 milvus的lite、standalone两版本的几个区别
之前为了在项目中快速体验milvus,采用的是milvus lite版(版本号:2.4.12,pymilvus版本号:2.5.6/2.5.7),结果引出来一堆问题,这才发现两个版本区别还是挺大的。以后还是尽量用standalone版的吧。
2025-04-29 14:28:09
969
原创 docker ubuntu容器中matplotlib中文乱码之解决
今天在docker的ubuntu容器中执行matplotlib时发现中文乱码问题,查找资料得知,是缺少中文字体的原因。
2025-04-18 15:04:23
369
原创 VAD流式处理之 pysilero与fsmn-vad的对比
其中value为一个数组,若其长度为0,表明这段样本数据中没有检测到【活动段开始】、也没检测到【活动段结束】。若长度大于0,则value中的每一项也是一个数组,比如这个数组[59820, -1],表示59820ms时检测到活动开始,-1表示未检测到活动结束时间。注意,若当前推理的数据段中全是静音或全是活动,则value为空数组[],除非它是最后一次(语音结束)。表示这次迭代的样本数据。通常,含有‘start’的迭代项的样本数据长度为2112,其他段的样本数据长度为512。
2025-03-20 15:07:13
1354
原创 记录tritonserver PythonBackend调试过程中的一个巨坑
这段代码在triton server中执行时,前6个print正常输出,后4个print都没有输出。而将这段代码直接在python环境中执行,则按正常代码逻辑,前6个print正常输出,11行、17行正常输出。print执行过程中会对str使用defaultencoding进行encode,而在tritonserver python backend执行时defaultencoding是‘ascii’(可能可以通过环境变量、或者启动参数配置,待研究),导致encode报错,所以,以后开发还得尽量用英文了。
2025-02-12 12:12:01
330
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅