假设现在有个n行的excel数据,如下:
需要统计每个品类出现的次数,并保存到新建的csv中。
操作代码如下:
注:这里的all_list1.count(name)
意思是‘all_list1这个列表里面出现name的总数’
这里需要提一下,为什么使用encoding=“utf_8_sig”,而不使用encoding=“utf-8”,主要是为了防止utf-8导出时中文乱码。
UTF-8以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序的问题,也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。程序输出中出现乱码的原因是因为python2中中文编码的问题,需要注意的是要将处理的中文文件的编码和python源文件的编码保持一致,这样不会出现中文乱码。在程序中能够正常输出中文,但是导出到文件后使用excel打开是出现中文乱码是因为excel能够正确识别用gb2312、gbk、gb18030或utf_8 with BOM 编码的中文,如果是utf_8 no BOM编码的中文文件,excel打开会乱码。
如果喜欢,记得关注小编,给个赞哟!