导入库
import pandas as pd
import numpy as py
路径
相对路径 "文件名"
绝对路径 "具体的位置"
琐碎
chunker 数据块
frame = pd.DataFrame() 创建一个DataFrame对象
frame.sort_values(by= ["要排列的列",,……],ascending=排序的方式 True升序或False降序)
frame.sort_index() 行索引升序排序
frame.sort_index(axis=1) 列索引升序排序
frame.describe()可以描述数据大小,平均值,标准差,最小值,25%的时候的值,50%的时候的值,75%的时候的值,最大值。
df = pd.read(路径)
df.info() 检查数据类型,大小
df.head() 显示前几行数据
df.tail() 显示后几行数据
df.columns 查看每列名称
df["列名","列名"……]查看这几列所有值
df.列名 查看这一列所有值
del df["列名"] 删除这一列
df.drop(["列名","列名"……],axis=1) 隐藏这几列
df.isnull()判断数据是否为空,是返回True,反之False
df.to_csv("新路径")保存数据
加入encoding='GBK' 或者encoding = ’utf-8',解决乱码问题