在python上新建一个dataframe
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age']) # 将第一维度数据转为为行,第二维度数据转化为列,即 3 行 2 列,并设置列标签
print(df)
结果:
Name Age
0 Alex 10.0
1 Bob 12.0
2 Clarke 13.0
dataframe按列合并
(69条消息) Python - pandas DataFrame数据的合并与拼接(merge、join、concat)_hellosc01的博客-CSDN博客_dataframe两列合并成一列
dataframe取出两列,成为新的dataframe
Fre_df_search_count_plt = Fre_df_search_count[['level_0','search_num']]
注意是两个方括号。
对列进行筛选
pandas行筛选/列筛选(条件筛选/范围筛选)/计算 - chengjon - 博客园 (cnblogs.com)
将数据进行分区
(64条消息) python——numpy——数据分区(digitize,cut,qcut,quantile函数)_xia ge tou lia的博客-CSDN博客_numpy的digitize
分组求和,保留原来结构
在pandas中如何每隔n行分组并求和但保持原始结构 - 问答 - 腾讯云开发者社区-腾讯云 (tencent.com)
去重
python 去重和保留重复值方法 duplicated 和 drop_duplicates - 遗忘之前 - 博客园 (cnblogs.com)
pandas 根据索引值 取dataframe(值)
(64条消息) pandas 根据索引值 取dataframe(值)_进击的铁甲小宝的博客-CSDN博客_dataframe按索引取值
dataframe把指定列变为索引
df = pd.DataFrame({'a':[1,2],'b':[3,4]})
df.set_index(['a'],inplace=True)
pycharm如何看到全部的dataframe列
import pandas as pd
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_options('display.max_rows', None)
绘制帕累托图
效果:
(61条消息) 【python科研绘图】绘制帕累托图(Pareto)步骤解析,并封装后直接调用_百木从森的博客-CSDN博客_python绘制帕累托图
获取行数列数
返回列数:
df.shape[1]
df.shape[0]
删除数据表中某一列中包含指定字符串的行
使用pandas的字符串包含函数.str.contains:
df_search_dic.drop(df_search_dic[df_search_dic['oms_category_name1'].str.contains(pat='秒杀',regex=False)==True].index,inplace=True)
(14条消息) pandas.DataFrame删除含有指定字符串的行或列_Yale曼陀罗的博客-CSDN博客
如何在Pandas中删除包含特定字符串的行|极客教程 (geek-docs.com)
Python分组做累加累计占比
```python import pandas as pd
df = pd.read_excel(r"D:\data\分组求累计占比.xlsx")
df1 = df.sort_values(["品牌","类别","销量"],ascending=[True,True,False])
#对原表按照品牌、类别、销量进行排序,其中品牌和类别升序排序,销量降序排序
ss = df1.groupby(["品牌","类别"])["销量"].transform("cumsum")/df1.groupby(["品牌","类别"])["销量"].transform("sum")
# 按照品牌和类别分组,对分组后的数据按照分组求累计和,再对分组后的数据按照分组求和,两者相除得到组内累计占比,生成一个series
df1['类别累计占比'] = ss.apply(lambda x : format(x,'.2%'))
# 得到的累计占比是浮点数形式,修改成百分比形式 df1
#最终结果,这里没有重置索引,所以索引是乱的,最好对索引进行重置 ```
Python分组做累加累计占比怎么求? - 知乎 (zhihu.com)
给列表去重
python中如何去除列表中重复元素? - 老A队长 - 博客园 (cnblogs.com)
对df其中一列按分隔符进行分割
Python pandas数据分列,分割符号&固定宽度 - 简书 (jianshu.com)
对列中每个元素做操作
Python之对DataFrame的多列数据运用apply函数操作 - 飞哥霸气 - 博客园 (cnblogs.com)
删除列
df.drop('num',axis=1,inplace=True),改变内存,及输入df的时候,它显示改变后的数据
通过pandas删除列:
1.del df['columns'] #改变原始数据
2.df.drop('columns',axis=1)#删除不改表原始数据,可以通过重新赋值的方式赋值该数据
3.df.drop('columns',axis=1,inplace='True') #改变原始数据
pandas 中rank函数
pandas 中rank函数 - 简书 (jianshu.com)
用到的链接
(69条消息) 如何获取Dataframe的行数和列数_lwgkzl的博客-CSDN博客_dataframe列数
(14条消息) python 删除特定列_pandas删除某一列的方法(drop函数)_weixin_39611765的博客-CSDN博客
【P】python基础 Pycharm显示DataFrame全部列数据 - 代码先锋网 (codeleading.com)
未完待续。。。