目录
2、使用python list、python dict、numpy.ndarray创建pandas.Series
3、将pandas.Series转化为pandas.DataFrame
4、将多个pandas.Series合并为一个pandas.DataFrame
6、 移除pandas.Series1中和pandas.Series2共同的部分
7、求pandas.Series1和pandas.Series2的交集、并集、差集
8、求pandas.Series分位数(最小值、1/4分位数、中位数、3/4分位数、最大值)
10、输出pandas.Series()中频数排第一二位的、其它的替换为other
11、将pandas.Series()均分为10个区间、每个值使用区间名称标记
12、将pandas.Series()转换为指定shape的pandas.DataFrame
13、取出pandas.Series()中满足条件数据的位置index
17、求真实和预测pd.Series之间的均方误差损失函数(MSE,mean squared error)
21、pd.Series中日期字符串转换为datetime格式
26、pd.Series1按pd.Series2分组并求均值
33、从一个csv 文件中每间隔50行取数据生成pandas.DataFrame
34、从一个csv 文件取数据生成pandas.DataFrame(新增加一分类列)
35、生成一个按规定步长平移的pandas.DataFrame
36、从一个csv 文件读取指定列生成pandas.DataFrame
37、输出DataFrame的行数、列数、数据类型、类型频数、Series转list
43、各自列均值、中值填充DataFrame中各自列缺省值(使用apply)
52、获取DataFrame某一列中第n大的值大于指定值得索引
54、 Series or DataFrame中使用分位数填充超限区域
60、DataFrame创建新列:每行为行号(按欧几里得距离而来)
62、DataFrame创建一列:包含每行中最小值与最大值比值
68、DataFrame按另外列分组、提取当前列中指定值(看下方例子,需求不好描述)
70、两个DataFrame使用类似SQL 中INNER JOIN拼接
73、DataFrame中新建两列:滞后列和提前列(看下方例子,需求BT)
1、pandas导入、查看版本
#pandas导入
import pandas as pd
#pandas输出版本信息
print(pd.__version__)
#pandas输出详细版本信息、 Python版本、相关程序包、操作系统等信息以json格式输出
print(pd.show_versions(as_json=True))
#pandas输出相关信息以默认格式输出
print(pd.show_versions())