python 读取csv_Python基础复习

b3137ae5813e080c0f095b8320f3438e.png

Python基础知识复习一边是结合教学视频,一边是结合官方Tutorial一起整理。

首先查看当前的使用版本,然后到官网查看指定版本的文档。

ed7ead2671f5e6afa2bc34cec30fec94.png
The Python Tutorial​docs.python.org

因为很久以前使用过Python,对于基础数据类型的增、删、查改和control flow tools部分,跟着视频和教程熟悉一边不做赘述。这里记录一下在模块使用遇到的问题。

  1. 问题描述

案例中,是使用pandas的excelfile读取给定的.xlsx文件。修改本地文件路径后,顺利读取。

1cc98815e052c8131df6e9a77b55cd56.png

回想起第一关给定的数据,那能否读取.csv格式的文件呢?

23de03e9fb5f10e992b04d7bcca36bdb.png

替换文件路径后,报错Unsupported format。

2. 解决思路

2.1 思考问题原因

首先反思为啥不能读取?CSV是似乎是标准的纯文本格式,也并非excel的特定文件格式。ExcelFile功能似乎只能读取纯Excel格式的文件。那么CSV如何读取呢?

2.2 思考解决办法

不知道就查文档吧!首先看当前的pandas安装版本。

fc249fdbdca22c93b1f2cac8a98105f1.png

搜索pandas官网对应版本文档。

pandas: powerful Python data analysis toolkit​pandas.pydata.org

果然在IO操作里面介绍不同文件的读取办法,CSV为read_csv。

4cabbf0bb2aa582b745227bb2c30b377.png

3.解决问题

2113faf68cefd01e68cd00a683b1b124.png

顺利输出CSV文件。

4. 更多问题

4.1 文件里面有多行多列,如果我想读取指定列如何实现呢?例如读取'id'列。

是否类似列表组成的矩阵?尝试csv[0],不行报错。

95da2f2baf01023b8a1f308609aa54a4.png

是否类似字典的索引?尝试csv['id']。

02a4666a19cb38c22fb948a090f20b34.png

成功输出。是否有其他办法呢?查看文档有usecols可以实现过滤功能。

62b50a89884f2b802707910b27737e28.png

参考输出id和name两列。

1578bc64fabdbbe9c973433ab56ccfb1.png

4.2 查看数据中有多少个id

id列看起来重复的内容很多,想查看有多少个不重复的ID,使用集合的去重特性尝试一下。

逻辑为首先创建列表,用循环写入所有id,然后将列表转换为集合查看最终结果。

8b4425d924299fe0b28cf91865e1c5dd.png

尝试成功还是比较开心,虽然还有很多报错和警告不明白,但是记录一下这个自己发现问题解决问题的经过。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值