数据分析打工人常用Pandas 75个基本操作(收藏查询用~)


 

 

 

目录

1、pandas导入、查看版本

2、使用python list、python dict、numpy.ndarray创建pandas.Series

3、将pandas.Series转化为pandas.DataFrame

4、将多个pandas.Series合并为一个pandas.DataFrame

5、修改pandas.Series index名称

6、 移除pandas.Series1中和pandas.Series2共同的部分

7、求pandas.Series1和pandas.Series2的交集、并集、差集

8、求pandas.Series分位数(最小值、1/4分位数、中位数、3/4分位数、最大值)

9、求pandas.Series()频数

10、输出pandas.Series()中频数排第一二位的、其它的替换为other

11、将pandas.Series()均分为10个区间、每个值使用区间名称标记

12、将pandas.Series()转换为指定shape的pandas.DataFrame

13、取出pandas.Series()中满足条件数据的位置index

14、取出pandas.Series()指定位置的数据

15、pandas.Series()水平、垂直合并

16、输出pandas.Series()子集的index号

17、求真实和预测pd.Series之间的均方误差损失函数(MSE,mean squared error)

18、pd.Series字符串型数据首字母大写转换

19、pd.Series字符串型数据字符长度计算

20、pd.Series中两两数之间差异

21、pd.Series中日期字符串转换为datetime格式

22、获取pd.Series日期字符串中时间对象

23、pd.Series日期字符串中修改为按指定日期输出

24、输出pd.Series中至少包含两个元音字符的数据

25、输出pd.Series中有效的email地址

26、pd.Series1按pd.Series2分组并求均值

27、计算两个pd.Series之间的欧式距离

28、求pd.Series局部峰值index

29、pd.Series字符串数据中使用最低频字符填充空格

30、创建时间序列数据,赋予随机值

31、缺省的时间序列值 不同方式填充

32、找出pd.Series中自相关性最大的数据

33、从一个csv 文件中每间隔50行取数据生成pandas.DataFrame

34、从一个csv 文件取数据生成pandas.DataFrame(新增加一分类列)

35、生成一个按规定步长平移的pandas.DataFrame

36、从一个csv 文件读取指定列生成pandas.DataFrame

37、输出DataFrame的行数、列数、数据类型、类型频数、Series转list

38、输出满足某个规则的DataFrame数据行和列号

39、修改DataFrame的列名称

40、DataFrame中是否有缺省值确认

41、DataFrame中缺省值统计

42、各自列均值填充DataFrame中各自列缺省值

43、各自列均值、中值填充DataFrame中各自列缺省值(使用apply)

44、从DataFrame选择子DataFrame

45、 改变DataFrame列顺序

46、大DataFrame修改默认显示的行和列数

47、DataFrame数据小数位数设置

48、 DataFrame数据小数转百分比显示

49、DataFrame数据每隔20行读取

50、创建DataFrame主键

51、获取DataFrame某一列中第n大的值索引

52、获取DataFrame某一列中第n大的值大于指定值得索引

53、获取DataFrame中行和大于100的行

54、 Series or DataFrame中使用分位数填充超限区域

55、去除指定值将DataFrame转换为最大方阵

56、DataFrame两行交换

57、DataFrame逆序输出

58、DataFrame转对角矩阵

59、DataFrame那一列含有最多行最大值

60、DataFrame创建新列:每行为行号(按欧几里得距离而来)

61、求DataFrame各列之间最大相关系数

62、DataFrame创建一列:包含每行中最小值与最大值比值

64、DataFrame每列按特定方式归一化

65、计算DataFrame每行与后一行的相关系数

66、DataFrame对角线元素替换为0

67、DataFrame按某列分组、提取某个分组

68、DataFrame按另外列分组、提取当前列中指定值(看下方例子,需求不好描述)

69、DataFrame分组(看下方例子,需求不好描述)

70、两个DataFrame使用类似SQL 中INNER JOIN拼接

72、取出DataFrame中两列值相等的行号

73、DataFrame中新建两列:滞后列和提前列(看下方例子,需求BT)

74、DataFrame中所有值出现频次统计

75、拆分DataFrame中某列文本为两列


1、pandas导入、查看版本

#pandas导入
import pandas as pd

#pandas输出版本信息
print(pd.__version__)

#pandas输出详细版本信息、 Python版本、相关程序包、操作系统等信息以json格式输出
print(pd.show_versions(as_json=True))

#pandas输出相关信息以默认格式输出
print(pd.show_versions())

2、使用python list、python dict、numpy.ndarray创建pandas.Series

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_21478261

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值