Pandas
文章平均质量分 50
从入门开始学习
A_Coding_man
纵有疾风起 人生不言弃
展开
-
数据清洗
数据清洗定义数据清洗的流程数据读写数据探索与描述数据简单处理重复值处理缺失值处理异常值处理文本字符串处理时间序列处理 定义 数据清洗:把“脏数据”变为“干净数据”。 脏数据:残缺数据、错误数据、重复数据、不符合规则的数据、… 数据清洗的流程 数据读写 常用方法:pd.read_csv("文件路径"),pd.read_excel("文件路径") 数据探索与描述 常用方法:df.info(),df.describe() 数据简单处理 常用方法:去除数据间的空格,英文字母的大小写转换 重复值处理 常用方法:du原创 2021-05-21 09:00:13 · 656 阅读 · 0 评论 -
pandas无法打开.xlsx文件,xlrd.biffh.XLRDError: Excel xlsx file; not supported
原因是最近xlrd更新到了2.0.1版本,只支持.xls文件。 所以pandas.read_excel(‘xxx.xlsx’)会报错。 可以安装旧版xlrd,在cmd中运行: pip uninstall xlrd pip install xlrd==1.2.0 也可以用openpyxl代替xlrd打开.xlsx文件: df=pandas.read_excel(‘data.xlsx’,engine=‘openpyxl’) 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文转载 2021-01-11 10:21:29 · 1297 阅读 · 0 评论 -
pandas读写xlsx或csv文件 Python
import pandas as pd #任意的多组列表 a = [1,2,3] b = [4,5,6] #字典中的key值即为csv中列名 dataframe = pd.DataFrame({'a_name':a,'b_name':b}) #将DataFrame存储为csv,index表示是否显示行名,default=True dataframe.to_csv("test.csv",index=False,sep=',') 查看结果: 参考链接:https://www.cnblogs.c原创 2020-12-23 17:20:18 · 479 阅读 · 0 评论
分享