python3.6 读取csv时编码问题

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd4 in position 0: invalid continuation byte

原因:csv文件的编码不是utf-8

解决方法:将文件重新保存为utf-8

步骤:用记事本的方式打开csv,然后在记事本中将文件另存为,--->保存类型为"所有文件",文件名加后缀,右下角的编码选择UTF-8----->保存  



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如果你的数据量太大,无法一次性将所有数据转换为一个CSV文件,你可以考虑将数据分割成多个CSV文件,每个文件对应一个sheet表。 以下是一个示例代码,可以将大型JSON文件分割成多个CSV文件,每个文件包含指定数量的数据,并分别保存为不同的sheet表: ```python import pandas as pd import json # 读取大型JSON文件 with open("large_data.json", "r") as f: data = json.load(f) # 指定每个CSV文件中的数据量 chunk_size = 10000 # 计算需要分割的次数 num_chunks = len(data) // chunk_size + 1 # 创建Excel文件 writer = pd.ExcelWriter("output.xlsx", engine="xlsxwriter") for i in range(num_chunks): # 计算当前切片的起始和结束位置 start = i * chunk_size end = start + chunk_size # 切片数据 chunk_data = data[start:end] # 将切片数据转换为DataFrame df = pd.DataFrame(chunk_data) # 将DataFrame保存到当前sheet表 sheet_name = f"Sheet{i+1}" df.to_excel(writer, sheet_name=sheet_name, index=False) # 保存Excel文件 writer.save() ``` 在上述示例中,我们使用`pandas`库将JSON数据转换为DataFrame,并使用`xlsxwriter`库将DataFrame保存到多个sheet表中。你可以根据需要调整`chunk_size`参数来控制每个CSV文件中的数据量。 请注意,你需要安装`xlsxwriter`库来运行上述示例代码,可以使用以下命令进行安装: ``` pip install xlsxwriter ``` 希望这个示例能够帮助你解决问题!如果还有其他问题,请随提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值