python入门 -文件读写和数据清洗

hi,斯人若彩虹

已于 2024-01-16 14:12:32 修改

阅读量1.5k

点赞数 2

分类专栏： python 文章标签： python

于 2022-08-18 11:13:35 首次发布

本文链接：https://blog.csdn.net/weixin_46942725/article/details/125865706

版权

本文介绍了Python中使用pandas进行文件操作，包括csv和excel文件的读写，并详细阐述了数据清洗的多个步骤，如数据去重、删除空值、删除行和列、重置索引、统计缺失值以及排序和修改列名的方法。

摘要由CSDN通过智能技术生成

一、文件操作

读取文件，以下两种方式：

import pandas as pd

df = pd.read_csv("test.csv",sheet_name='sheet1') #默认是utf-8编码

    #按行遍历
    for row in df:
        #修正
        row = row.replace('阴性','0').replace('00.','0.')
        ...
        print(row)

#建议用utf-8编码或者中文gbk编码,默认是utf-8编码,index=False表示不写出行索引
df.to_csv('df_new.csv',encoding='utf-8',index=False)

df = pd.read_excel('测试.xlsx',sheet_name='test')  
df = pd.read_excel(r'测试.xlsx') #默认读入第一个sheet

df = pd.read_excel('测试.xlsx',usecols=[5,6,7,8]) #读入5至8列 注意[5:8]会报错 ，usecols是列表参数，不支持切片写法

关注

专栏目录