Python数据分析与机器学习实战笔记(2) - Pandas

本文详细介绍了Python数据分析库Pandas的使用,包括数据读取与展示、索引操作、重点讲解了Groupby函数和数据透视表的运用,还涵盖了数值运算、对象操作、数据合并、时间处理、字符串操作等核心功能。
摘要由CSDN通过智能技术生成

Pandas

Pandas 工具包使用

import pandas as pd

path = "data.csv"
df = pd.read_csv(path) 
df.head()
print(help(pd.read_csv))

数据信息读取与展示

df = pd.read_csv("data.csv")
df.info()

df.index
df.columns
df.dtypes
df.values#array结构输出dataframe 中的数据
# 创建一个dataframe

data =  {
   'country' : ['aaa','bbb', 'ccc','ddd'], 
'population': [10,12,14, np.nan]}
df_data = pd.DataFrame(data)
df_data

#取指定数据
age = df['age']
age.values
age = age+10
age.mean()
age.max()


#series: dataframe 中的一行/列

#自行指定索引
df.set_index('Name')


df.describe()#对所有数值数据进行统计

索引方法

#loc 用label来定位
#iloc 用position来定位

df.iloc[0]
df.loc['Tom Hanks','Fare']#显示 Tom Hanks 的船票价格

#bool 类型索引

df[df['Fare']>40]
df[df['sex']=='Male']

df.loc[df['sex']=='Male','Age'].mean()

(df['Age'>70]).sum()

⚠️ Groupby 函数的使用方法

df = pd.DataFrame({
   'key':['A', 'B', 'C', 'A', 'B', 'C','A'
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值