如何解决用pandas读取数据库中的表格的乱码问题

最新推荐文章于 2022-09-24 11:35:49 发布

羽中飞人

最新推荐文章于 2022-09-24 11:35:49 发布

阅读量1.3k

点赞数 1

分类专栏：数据库

本文链接：https://blog.csdn.net/weixin_49096826/article/details/114286739

版权

数据库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

数据库是sybase,读取时，中文列出现乱码，解决如下：

sybase_engine = create_engine(f"sybase+pyodbc://dba:sql@sybase_second")
tab = pd.read_sql_query("SELECT * FROM product", sybase_engine)
tab = tab.apply(lambda x: x.astype(str).str.encode('cp850').str.decode('gbk'))
print(tab)

思路如下：

先找到数据库中的编码，sybase查看编码的语法：select id,name from syscharsets（我的sybase编码是cp850）
把dataframe的每列转换为str
把每一列先encode(编码)成cp850，再encode(解码)成gbk，就成功了
我测试过了，encode（解码）成utf-8，或者gbk2312都还是乱码，只有解码成gbk能读取出来
整个过程的解决的转折点在于，试过把某一个中文乱码，用如下代码，解读出来了

print("▄╦▒®║ýÍ╣┐╚║¤╝┴".encode('cp850').decode('gbk'))

最后，奉劝大家，不要接触sybase数据库，不然真的头发不保！

优惠劵

羽中飞人

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
如何解决用pandas读取数据库中的表格的乱码问题

数据库是sybase,读取时，中文列出现乱码，解决如下：sybase_engine = create_engine(f"sybase+pyodbc://dba:sql@sybase_second")tab = pd.read_sql_query("SELECT * FROM product", sybase_engine)tab = tab.apply(lambda x: x.astype(str).str.encode('cp850').str.decode('gbk'))print(tab)
复制链接

扫一扫