weixin_44021268-CSDN博客

原创 pandas读取wps编辑后的csv文件报错

用wps编辑b一个csv文件，保存后用pandas.read_csv方法读取后一直报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte，网上找资料也主要是两种方法，一种是read_csv方法加encoding参数，另一种是Notepad++、wps等软件将文件“另存为”的方式指定编码格式，然后再取读取。

2026-03-24 10:06:07 172

原创 milvus的lite、standalone两版本的几个区别

之前为了在项目中快速体验milvus，采用的是milvus lite版（版本号：2.4.12，pymilvus版本号：2.5.6/2.5.7)，结果引出来一堆问题，这才发现两个版本区别还是挺大的。以后还是尽量用standalone版的吧。

2025-04-29 14:28:09 969

原创 docker ubuntu容器中matplotlib中文乱码之解决

今天在docker的ubuntu容器中执行matplotlib时发现中文乱码问题，查找资料得知，是缺少中文字体的原因。

2025-04-18 15:04:23 369

原创 VAD流式处理之 pysilero与fsmn-vad的对比

其中value为一个数组，若其长度为0，表明这段样本数据中没有检测到【活动段开始】、也没检测到【活动段结束】。若长度大于0，则value中的每一项也是一个数组，比如这个数组[59820, -1]，表示59820ms时检测到活动开始，-1表示未检测到活动结束时间。注意，若当前推理的数据段中全是静音或全是活动，则value为空数组[]，除非它是最后一次（语音结束）。表示这次迭代的样本数据。通常，含有‘start’的迭代项的样本数据长度为2112，其他段的样本数据长度为512。

2025-03-20 15:07:13 1354

原创记录tritonserver PythonBackend调试过程中的一个巨坑

这段代码在triton server中执行时，前6个print正常输出，后4个print都没有输出。而将这段代码直接在python环境中执行，则按正常代码逻辑，前6个print正常输出，11行、17行正常输出。print执行过程中会对str使用defaultencoding进行encode，而在tritonserver python backend执行时defaultencoding是‘ascii’（可能可以通过环境变量、或者启动参数配置，待研究），导致encode报错，所以，以后开发还得尽量用英文了。

2025-02-12 12:12:01 330

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 pandas读取wps编辑后的csv文件报错

原创 milvus的lite、standalone两版本的几个区别

原创 docker ubuntu容器中matplotlib中文乱码之解决

原创 VAD流式处理之 pysilero与fsmn-vad的对比

原创 记录tritonserver PythonBackend调试过程中的一个巨坑

空空如也

空空如也

原创记录tritonserver PythonBackend调试过程中的一个巨坑