根据milvus官方文档搭建好了问答系统,拿到官方提供的英文测试数据,可以正常导入,自己把内容改成中文就报错了:
MYSQL ERROR: (1366, "Incorrect string value: '\\xE4\\xB8\\x96\\xE7\\x95\\x8C...' for column 'question' at row 1") with sql: insert into milvus_qa_search_1 (milvus_id,question,answer) values (%s,%s,%s);
看到是数据库报的错,这是字符集的问题,连接上数据库,查看milvus创建的表信息,默认字符集是用的latin1,不支持中文字符
手动修改成UTF-8
改好之后,上传的csv文件也要改成UTF-8编码,中文它默认是GB2312的
修改方法:用notepad++打开csv,清空数据,修改编码,再把数据贴回去
再次导入就成功了,效果如下: