Pandas工具包实战(1)pandas介绍:pandas基本处理、创建dataframe、取指定数据、series、指定索引重设索引、统计函数

本文介绍了Pandas工具包在数据分析中的应用,包括如何创建DataFrame结构,选取特定数据,理解Series概念,自定义索引以及使用统计函数进行数据分析。
摘要由CSDN通过智能技术生成

1 Pandas:数据分析处理库

import pandas as pd

df = pd.read_csv('./data/titanic.csv')
print (help(pd.read_csv))

# .head()可以读取前几条数据,指定前几条都可以
df.head()
# .info返回当前的信息
df.info()

df.index  # RangeIndex(start=0, stop=891, step=1)
df.columns  # Index(['PassengerId',..., 'Embarked'], dtype='object')
df.values  
# array([[1, 0, 3, ..., 7.25, nan, 'S'],
#		[2, 1, 1, ..., 71.2833, 'C85', 'C'],
#		[3, 1, 3, ..., 7.925, nan, 'S'],
#		..., 
#		[889, 0, 3, ..., 23.45, nan, 'S'],
#		[890, 1, 1, ..., 30.0, 'C148', 'C'],
#		[891, 0, 3, ..., 7.75, nan, 'Q']], dtype=object)

2 自己创建一个dataframe结构

data = {'country':['aaa','bbb','ccc'],
       'population':[10,12,14]}
df_data = pd.DataFrame(data)
df_data
df_data.info()

3 取指定的数据

age = df['Age']
age[:5]

4 series: dataframe 中的一行/列

age.index
age.values[:5]

df.head()
df['Age'][:5]

5 索引我们可以自己指定

df = df.set_index('Name')  # 重新设置,以某一列为索引
df.head()

df['Age'][:5]

age = df['Age']
age[:5]

age['Allen, Mr. William Henry']  # 35.0

age = age + 10  # 这一操作是对该series中每一项都进行 +10 操作
age[:5]

age = age *10 
age[:5]


6 统计函数

age.mean()
age.max()
age.min()

# .describe()可以得到数据的基本统计特性
df.describe()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值