1、pandas常用命令
数据的导入及结构查看:
import numpy as np
import pandas as pd
path='train.txt' #将下载的原始数据放到项目文件夹,即可不用写路径
data=pd.read_csv(path,sep=" +",header=None, engine='python') #具体参数可查看官方文档
print("原始数据data", data.shape,type(data)) #原始数据的结构
查看前十行第一列的值:
print(data.values[0:10, 0])
数据描述:每列的元素数、均值、标准差、最小值、25%、50%、75%分位数和最大值
print(data.describe())
前3行的值:
print(data.head(3))
第一行的值:
print(data.loc[1])
第一行第一列的值:
print(data.loc[1, 1])
第0列为1的所有行:
print(data[data[0]== 1])
第0列为1或2的所有行:
print(data[data[0].isin([1, 2])])
画出第0列的数据折线图、直方图: