学习内容:PANDAS
学习章节:1-1 查看数据
提示:导入 清洗数据
例如:
1、 导入库
import pandas as pd # 利用pandas库分析数据
2、 导入数据
df = pd.read_csv( # 设变量为 df 表示DataFrame数据类型 = 从pandas读取csv格式的文件
filepath_or_buffer = r ’ x:\xx\xx.csv ', # 路径变量名 = r ’ 数据路径地址 ',
encoding = ’ xxx ’ , # 编码变量 = 编码格式 可以为 gbk 或者 utf-8 等
sep = ’ 分隔符 ', # 数据分隔符变量 csv文件默认是逗号 竖线 ’ | ’ 其它常见的是‘ \t ’
skiprows=1, # 该参数代表跳过数据文件的的第1行不读入
)
3、打印输出
print( df ) # 打印 df 变量
# 使用 read_csv 导入数据非常方便
# 导入的数据类型是 DataFrame
# 导入的数据主要使用read 系列函数
# 还有 read_table read_excel read_json 等格式文件