笔记重点
- pd.read_excel()的使用
- 查看导入数据的属性:维度、列名、数据格式、唯一值、所有值、前/后x行等
- 数据清理代码:填充格式、数据类型更改、大小写转换、更改列名、数据替换等
- loc和iloc的使用
1. 文件路径的2种引用方法
path = 'C:/Users/111/Desktop/分析报告/sales.xlsx'
# 将文件路径的"\"改成"/"
或者
path = r'C:\Users\111\Desktop\分析报告\sales.xlsx'
# 在文件路径前面加上"r",可以对后面路径中的"\"进行转义
2. 读取excel中指定位置的sheet
df = pd.read_excel(path,sheet_name=1)
- 如果省略sheet_name参数,则默认读取第一个sheet,也就是sheet_name=0;
- 也可以直接使用sheet表名来引用,如,第2个sheet名字为"order",则sheet_name=1等同于sheet_name=“order”
更多pd.read_excel( )里的参数细节参见 pd.read_excel( )
以下是参考https://www.cnblogs.com/wobujiaonaoxin/articles/11386046.html 的步骤尝试的pandas一些函数的用法记录
一、导入数据的属性查看函数
① df.shape维度查看
表示该数据为16598行*12列