Pandas工具包实战（1）pandas介绍：pandas基本处理、创建dataframe、取指定数据、series、指定索引重设索引、统计函数

最新推荐文章于 2022-10-31 10:16:46 发布

太阳不热

最新推荐文章于 2022-10-31 10:16:46 发布

阅读量224

点赞数

分类专栏：自然语言处理-python必备工具包应用实战文章标签：数据分析 python 大数据

本文链接：https://blog.csdn.net/weixin_43595476/article/details/106521117

版权

自然语言处理-python必备工具包应用实战专栏收录该内容

18 篇文章 5 订阅

订阅专栏

本文介绍了Pandas工具包在数据分析中的应用，包括如何创建DataFrame结构，选取特定数据，理解Series概念，自定义索引以及使用统计函数进行数据分析。

摘要由CSDN通过智能技术生成

1 Pandas:数据分析处理库

import pandas as pd

df = pd.read_csv('./data/titanic.csv')
print (help(pd.read_csv))

# .head()可以读取前几条数据,指定前几条都可以
df.head()
# .info返回当前的信息
df.info()

df.index  # RangeIndex(start=0, stop=891, step=1)
df.columns  # Index(['PassengerId',..., 'Embarked'], dtype='object')
df.values  
# array([[1, 0, 3, ..., 7.25, nan, 'S'],
#		[2, 1, 1, ..., 71.2833, 'C85', 'C'],
#		[3, 1, 3, ..., 7.925, nan, 'S'],
#		..., 
#		[889, 0, 3, ..., 23.45, nan, 'S'],
#		[890, 1, 1, ..., 30.0, 'C148', 'C'],
#		[891, 0, 3, ..., 7.75, nan, 'Q']], dtype=object)

2 自己创建一个dataframe结构

data = {'country':['aaa','bbb','ccc'],
       'population':[10,12,14]}
df_data = pd.DataFrame(data)
df_data
df_data.info()

3 取指定的数据

age = df['Age']
age[:5]

4 series: dataframe 中的一行/列

age.index
age.values[:5]

df.head()
df['Age'][:5]

5 索引我们可以自己指定

df = df.set_index('Name')  # 重新设置，以某一列为索引
df.head()

df['Age'][:5]

age = df['Age']
age[:5]

age['Allen, Mr. William Henry']  # 35.0

age = age + 10  # 这一操作是对该series中每一项都进行 +10 操作
age[:5]

age = age *10 
age[:5]

6 统计函数

age.mean()
age.max()
age.min()

# .describe()可以得到数据的基本统计特性
df.describe()

太阳不热

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录