[Python数据处理] 怎样用Python预处理csv文档提取数据

本文介绍了如何使用Python的pandas库读取GBK和UTF-8编码的CSV文件,展示从文件中提取数据的方法,并给出了完整的代码示例。
摘要由CSDN通过智能技术生成

[问题背景]

处理以下文本文件:

grade_gbk.csv  (GBK编码格式)

grade_uft-8.csv (UTF-8编码格式)

每个文件内容相同,共三条数据,每条数据的第一项是姓名,第二项是语文,第三项是数学,第四项是英语

首先打开Excel,输入以下内容:

姓名 语文 数学 英语
张三 128 136 112
李四 99 106 73
王五 102 148 88

然后另存为两次,第一次的文件名为'grade_gbk.csv',保存类型为'CSV (逗号分隔)(*.csv)';第二次的文件名为'grade_utf-8.csv',保存类型为'CSV UTF-8 (逗号分隔)(*.csv)',这样就得到了两种不同编码格式的.csv文件,实际应用中两种编码都可能遇到,所以下面的演示对两种编码的.csv文件的读取都作一个简单的介绍。

[问题分析]

在.csv文件所在目录下新建.py文件,注意.py文件名可以自取,但不能是csv.py,否则代码中调用csv时会调到自身报错AttributeError: module 'csv' has no attribute 'excel'。(关

  • 6
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值