Python基本用法

在python上新建一个dataframe

data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age']) # 将第一维度数据转为为行,第二维度数据转化为列,即 3 行 2 列,并设置列标签
print(df)

结果:

     Name   Age
0    Alex  10.0
1     Bob  12.0
2  Clarke  13.0

dataframe按列合并

(69条消息) Python - pandas DataFrame数据的合并与拼接(merge、join、concat)_hellosc01的博客-CSDN博客_dataframe两列合并成一列

dataframe取出两列,成为新的dataframe

Fre_df_search_count_plt = Fre_df_search_count[['level_0','search_num']]

注意是两个方括号。

对列进行筛选

pandas行筛选/列筛选(条件筛选/范围筛选)/计算 - chengjon - 博客园 (cnblogs.com)

将数据进行分区

(64条消息) python——numpy——数据分区(digitize,cut,qcut,quantile函数)_xia ge tou lia的博客-CSDN博客_numpy的digitize

分组求和,保留原来结构 

在pandas中如何每隔n行分组并求和但保持原始结构 - 问答 - 腾讯云开发者社区-腾讯云 (tencent.com)

去重

python 去重和保留重复值方法 duplicated 和 drop_duplicates - 遗忘之前 - 博客园 (cnblogs.com)

pandas 根据索引值 取dataframe(值)

(64条消息) pandas 根据索引值 取dataframe(值)_进击的铁甲小宝的博客-CSDN博客_dataframe按索引取值

dataframe把指定列变为索引 

df = pd.DataFrame({'a':[1,2],'b':[3,4]})

df.set_index(['a'],inplace=True) 

pycharm如何看到全部的dataframe列

import pandas as pd 
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_options('display.max_rows', None)

绘制帕累托图

效果:

(61条消息) 【python科研绘图】绘制帕累托图(Pareto)步骤解析,并封装后直接调用_百木从森的博客-CSDN博客_python绘制帕累托图

获取行数列数

返回列数:

df.shape[1]

返回行数:

df.shape[0]

删除数据表中某一列中包含指定字符串的行

使用pandas的字符串包含函数.str.contains:

df_search_dic.drop(df_search_dic[df_search_dic['oms_category_name1'].str.contains(pat='秒杀',regex=False)==True].index,inplace=True)

(14条消息) pandas.DataFrame删除含有指定字符串的行或列_Yale曼陀罗的博客-CSDN博客 

 如何在Pandas中删除包含特定字符串的行|极客教程 (geek-docs.com)

Python分组做累加累计占比

```python import pandas as pd

df = pd.read_excel(r"D:\data\分组求累计占比.xlsx")

df1 = df.sort_values(["品牌","类别","销量"],ascending=[True,True,False])

#对原表按照品牌、类别、销量进行排序,其中品牌和类别升序排序,销量降序排序

ss = df1.groupby(["品牌","类别"])["销量"].transform("cumsum")/df1.groupby(["品牌","类别"])["销量"].transform("sum")

# 按照品牌和类别分组,对分组后的数据按照分组求累计和,再对分组后的数据按照分组求和,两者相除得到组内累计占比,生成一个series

df1['类别累计占比'] = ss.apply(lambda x : format(x,'.2%'))

# 得到的累计占比是浮点数形式,修改成百分比形式 df1

#最终结果,这里没有重置索引,所以索引是乱的,最好对索引进行重置 ```

Python分组做累加累计占比怎么求? - 知乎 (zhihu.com)

给列表去重

python中如何去除列表中重复元素? - 老A队长 - 博客园 (cnblogs.com)

对df其中一列按分隔符进行分割

Python pandas数据分列,分割符号&固定宽度 - 简书 (jianshu.com)

对列中每个元素做操作 

Python之对DataFrame的多列数据运用apply函数操作 - 飞哥霸气 - 博客园 (cnblogs.com)

删除列

df.drop('num',axis=1,inplace=True),改变内存,及输入df的时候,它显示改变后的数据

通过pandas删除列:

1.del df['columns'] #改变原始数据

2.df.drop('columns',axis=1)#删除不改表原始数据,可以通过重新赋值的方式赋值该数据

3.df.drop('columns',axis=1,inplace='True') #改变原始数据
 

pandas 中rank函数

pandas 中rank函数 - 简书 (jianshu.com)

用到的链接

(69条消息) 如何获取Dataframe的行数和列数_lwgkzl的博客-CSDN博客_dataframe列数

(14条消息) python 删除特定列_pandas删除某一列的方法(drop函数)_weixin_39611765的博客-CSDN博客

【P】python基础 Pycharm显示DataFrame全部列数据 - 代码先锋网 (codeleading.com) 

未完待续。。。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值