首先,可以肯定的是python对于中文的处理非常的蛋疼。读取excel文件这里要用到xlrd模块,里面有很多有用的方法,例如获取excel的行数,列数,通过索引来获取某一个单元格的值等等。详细的请百度查看,刚开始想的是从表格里读取文件内容后先构造成python的字典,然后再利用python里的json模块的dumps方法直接转换成json对象,最后又file的write方法写入到文件,这个想法获得了成功,但是我打开了转换后的json文件发现了一个问题,所有的中文字符都被转换成unicode保存到了json文件中,例如"/u1223u1452",问了一下需要这个脚本的人可不可以这样,他说最好显示成中文,好吧··继续尝试,各种百度,首先是看到dumps方法会把非ascii编码的字符默认的转换为unicode,但是如何加上一个参数就不会了,就是ensure_ascii = False,然后写入文件,这个时候又发生了一个问题,就是写不进去文件,经过各种思考我认为应该是中文字符的编码(utf-8)不允许直接用file里的write写到文件里。。。这可怎么办,又各种百度,查询到python里一个专门处理编码的模块,可以很轻松的将中文写到文件中,这个模块就是codecs。从excel文件里读取出的值为unicode格式的编码,假设值为s,首先我要用s_utf8 = s.enable("UTF-8")把这个编码进行转换一下,之后我直接调用codecs的方法就好啦,方法如下f = codecs.open("1.json", w), f.write(s_utf8),这样就可以把中文直接写到json文
python把excel文件转换为指定的json格式
最新推荐文章于 2024-03-19 14:17:40 发布