1.导入pandas
import pandas as pd
2.读取一个csv
df = pd.read_csv('./data/titanic.csv')
3.读取前几条数据,指定前几条都可以
df.head(6)
4.返回当前的信息
df.info()
5.查看索引
df.index
6.查看列
df.columns
7.查看数据类型
df.dtypes
8.查看每一行对应指标的值
df.values
10.自己创建一个dataframe结构
data = {'country':['aaa','bbb','ccc'],
'population':[10,12,14]}
df_data = pd.DataFrame(data)
df_data
df_data.info()
11.取指定的数据
age = df['Age']
age[:5]
age.index
age.values[:5]
df['Age'][:5]
12.索引我们可以自己指定
df = df.set_index('Name')
df.head()
df['Age'][:5]
age = df['Age']
age[:5]
age['Allen, Mr. William Henry']
13.对值进行操作
age = age + 10
age[:5]
age = age *10
age[:5]
14.计算特征值以及获取数据的基本统计特性
age.mean()
age.max()
age.min()
describe()可以得到数据的基本统计特性
df.describe()