Python Pandas学习路线

1. Pandas数据结构

  1. Series
  2. Dataframe

2. Pandas快速入门

  1. 对象创建
  2. 查看数据
  3. 选择数据

3. Pandas Series

  1. 创建
  2. 检索

4. Pandas DataFrame

  1. 创建
  2. 列(选择,增加,删除)
  3. 行(选择,增加,删除)

5. Pandas Panel

  1. 创建
  2. 访问

6. Pandas基本功能

  1. Series基本功能
  2. Dataframe基本功能

7. Pandas描述性统计

  1. 常用统计方法

8. Pandas函数应用

  1. 表格函数应用
  2. 行或列合理函数应用
  3. 元素合理函数应用

9. Pandas重建索引

  1. 重建索引与其他对象对齐
  2. 填充时重新加注
  3. 重建索引时的填充限制
  4. 重命名

10. Pandas迭代

  1. 迭代DataFrame

11. Pandas排序

  1. 按标签排序
  2. 排序顺序
  3. 按列排列
  4. 按值排序
  5. 排序算法

12. Pandas字符串和文本数据

  1. 常用字符串函数

13. Pandas选项和自定义

  1. get_option()
  2. set_option()
  3. reset_option()
  4. describe_option()
  5. option_context()

14. Pandas索引和选择数据

  1. loc()
  2. iloc()
  3. ix()

15. Pandas统计函数

  1. pct_change()函数
  2. cov() 协方差
  3. corr() 相关性
  4. rank()数据排名

16. Pandas窗口函数

  1. rolling()函数
  2. expanding()函数
  3. ewm()函数

17. Pandas聚合

  1. DataFrame应用聚合
  2. 在整个数据框上应用聚合

18. Pandas缺失数据

  1. 检查缺失值
  2. 缺少数据的计算
  3. 清理/填充缺少数据
  4. 用标量值替换NaN
  5. 填写NA前进和后退
  6. 丢失缺少的值
  7. 替换丢失(或)通用值

19. Pandas分组(GroupBy)

  1. 将数据拆分成组
  2. 查看分组
  3. 迭代遍历分组
  4. 选择一个分组
  5. 聚合
  6. 一次应用多个聚合函数
  7. 转换
  8. 过滤

20. Pandas合并/连接

  1. merge()

21. Pandas级联

  1. concat()
  2. append()

22. Pandas日期功能

  1. 创建日期范围
  2. 更改日期频率
  3. bdate_range()函数
  4. 偏移别名

23. Pandas时间差(Timedelta)

  1. 字符串
  2. 整数
  3. 数据偏移
  4. 运算操作
  5. 相加操作
  6. 相减操作

24. Pandas分类数据

25. Pandas可视化

  1. 基本绘图:绘图
  2. 条形图
  3. 直方图
  4. 箱形图
  5. 区域块图形
  6. 散点图形
  7. 饼状图

26. Pandas IO工具

  1. pd.read_csv() 本地文件
  2. pd.read_sql() 数据库

27. Pandas稀疏数据

28. Pandas注意事项&窍门

29. Pandas与SQL比较


1. Pandas数据结构

  1. Series
    一维数组,大小不变。
  2. DataFrame
    二维数组,大小和形状可变的表结构

2. Pandas快速入门

  1. 对象创建
import pandas as pd
import numpy as np

s = pd.Series([1,3,5,np.nan,6,8])

print(s)
  1. 查看数据
import pandas as pd
import numpy as np

dates = pd.date_range('20170101', periods=7)
df = pd.DataFrame(np.random.randn(7,4), index=dates, columns=list('ABCD'))

print(df.head())  #查看表头

print(df.tail(3))  #查看前三行
  1. 选择数据

3. Pandas Series

Series是一维标记的数组,能够保存任何数据类型(integers, strings, floating point numbers, Python objects, 等)。轴标签统称为索引。创建Series的基本方法:

  1. 创建

首先导入包:

import numpy as np
import pandas as pd
s = pd.Series(data, index=index)

data 可以是一个dict,ndarray
index 轴标签列表
从dict创建:
在这里插入图片描述
从ndarray创建:
在这里插入图片描述

  1. Dataframe
    DataFrame是一个二维标记数据结构,是最常用的pandas对象,与Series一样,DataFrame接受许多不同类型的数据(ndarrays, lists, dicts, or Series,2-D numpy.ndarray)
    从dict创建:
import numpy as np
import pandas as pd
d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
     'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
pd.DataFrame(d)

输出:
在这里插入图片描述
从字典列表创建

data2 = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
pd.DataFrame(data2)

在这里插入图片描述
从元组字典创建

data = {('a', 'b'): {('A', 'B'): 1, ('A', 'C'): 2},
('a', 'a'): {('A', 'C'): 3, ('A', 'B'): 4},
('a', 'c'): {('A', 'B'): 5, ('A', 'C'): 6},
('b', 'a'): {('A', 'C'): 7, ('A', 'B'): 8},
('b', 'b'): {('A', 'D'): 9, ('A', 'B'): 10}}
pd.DataFrame(data)

在这里插入图片描述

  1. 检索

4. Pandas DataFrame

  1. 创建
  2. 列(选择,增加,删除)
  3. 行(选择,增加,删除)

5. Pandas Panel

  1. 创建
  2. 访问

6. Pandas基本功能

  1. Series基本功能
  2. Dataframe基本功能

7. Pandas描述性统计

  1. 常用统计方法

8. Pandas函数应用

  1. 表格函数应用
  2. 行或列合理函数应用
  3. 元素合理函数应用

9. Pandas重建索引

  1. 重建索引与其他对象对齐
  2. 填充时重新加注
  3. 重建索引时的填充限制
  4. 重命名

10. Pandas迭代

  1. 迭代DataFrame

11. Pandas排序

  1. 按标签排序
  2. 排序顺序
  3. 按列排列
  4. 按值排序
  5. 排序算法

12. Pandas字符串和文本数据

  1. 常用字符串函数

13. Pandas选项和自定义

  1. get_option()
  2. set_option()
  3. reset_option()
  4. describe_option()
  5. option_context()

14. Pandas索引和选择数据

  1. loc()
  2. iloc()
  3. ix()

15. Pandas统计函数

  1. pct_change()函数
  2. cov() 协方差
  3. corr() 相关性
  4. rank()数据排名

16. Pandas窗口函数

  1. rolling()函数
  2. expanding()函数
  3. ewm()函数

17. Pandas聚合

  1. DataFrame应用聚合
  2. 在整个数据框上应用聚合

18. Pandas缺失数据

  1. 检查缺失值
  2. 缺少数据的计算
  3. 清理/填充缺少数据
  4. 用标量值替换NaN
  5. 填写NA前进和后退
  6. 丢失缺少的值
  7. 替换丢失(或)通用值

19. Pandas分组(GroupBy)

  1. 将数据拆分成组
  2. 查看分组
  3. 迭代遍历分组
  4. 选择一个分组
  5. 聚合
  6. 一次应用多个聚合函数
  7. 转换
  8. 过滤

20. Pandas合并/连接

  1. merge()

21. Pandas级联

  1. concat()
  2. append()

22. Pandas日期功能

  1. 创建日期范围
  2. 更改日期频率
  3. bdate_range()函数
  4. 偏移别名

23. Pandas时间差(Timedelta)

  1. 字符串
  2. 整数
  3. 数据偏移
  4. 运算操作
  5. 相加操作
  6. 相减操作

24. Pandas分类数据

25. Pandas可视化

  1. 基本绘图:绘图
  2. 条形图
  3. 直方图
  4. 箱形图
  5. 区域块图形
  6. 散点图形
  7. 饼状图

26. Pandas IO工具

  1. pd.read_csv() 本地文件
  2. pd.read_sql() 数据库

27. Pandas稀疏数据

28. Pandas注意事项&窍门

29. Pandas与SQL比较


  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你开始学习pandas时,以下是一个简单的学习路线: 1. 学习Python基础知识:在使用pandas之前,建议先掌握Python的基本语法和数据结构,例如列表、字典和函数等。 2. 安装pandas库:使用pip或conda等工具安装pandas库,并确保安装正确。 3. 学习pandas的数据结构:pandas主要提供了两种数据结构,即Series和DataFrame。了解它们的特点、创建方式和基本操作方法。 4. 数据导入与导出:学习如何从不同的数据源(如CSV、Excel、数据库等)中导入数据到pandas的DataFrame中,并将处理后的数据导出。 5. 数据清洗与预处理:学习如何处理缺失值、重复值、异常值等数据清洗操作,并进行数据类型转换、重命名列名等预处理操作。 6. 数据选择与过滤:学习如何使用pandas提供的方法选择和过滤DataFrame中的数据,包括使用标签、位置、条件等进行选择。 7. 数据排序与排名:学习如何对DataFrame中的数据进行排序和排名操作,以便更好地理解和分析数据。 8. 数据聚合与分组:学习如何使用pandas进行数据聚合和分组操作,包括使用聚合函数、分组键等进行数据分析。 9. 数据合并与连接:学习如何使用pandas进行多个DataFrame的合并和连接操作,以便进行更复杂的数据分析和处理。 10. 数据可视化:学习如何使用pandas结合matplotlib或其他可视化库进行数据可视化,以便更直观地展示和分析数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值