weixin_45008698-CSDN博客

原创 apply lambda , 遍历列名

apply lambda , 遍历列名

2022-09-28 11:07:50 220

原创生成时间序列每月月初月末

stdate='2021-05-01'lst=[]z=zip(pd.date_range(stdate,periods=13,freq ='MS'),pd.date_range(stdate,periods=13,freq ='M'))for d in z: print(str(d[0])[:10],str(d[1])[:10])

2022-05-27 16:50:57 305

环境 CentOS7.5, Anaconda3,1. 开启端口，参考linux centos 7如何开放网络端口_Sam.Shi的博客-CSDN博客_centos开放8888端口2. 配置Jupter1. anaconda配置远程访问jupyter，并创建虚拟环境_bookjiang16的博客-CSDN博客设置jupyter从任意IP访问：jupyter notebook --ip='0.0.0.0'设置jupyter从指定IP访问：jupyter notebook --ip

2022-05-16 11:12:31 515

原创 python 月初月末

# 先导入包：import calendarimport datetimefrom datetime import timedelta# 获取今天日期：# 返回datetime格式：eg：2019-12-07 20:38:35.82816now = datetime.datetime.now()# 返回datetime格式：eg：2019-12-07now1 = datetime.datetime.now().date()now2 = datetime.date.today()#.

2022-04-04 19:04:13 679

原创 reset_index() 不显示索引

df=df.reset_index(drop=True)

2021-09-19 18:18:30 260

原创 merge 多个 dataframe

from functools import reducedfall = reduce(lambda x, y: pd.merge(x, y, on='中支名称', how='inner'),lst)

2021-09-16 18:32:17 106

原创 python 昨天今天明天

today= datetime.date.today().strftime('%Y-%m-%d')yesteday=(datetime.date.today() + datetime.timedelta(-1)).strftime('%Y-%m-%d')bfesteday=(datetime.date.today() + datetime.timedelta(-2)).strftime('%Y-%m-%d')now = datetime.datetime.now()month_start =.

2021-09-16 18:30:59 172

原创 pandas 百分比显示%

df04['活动率百分比']=df04['活动率'].map(lambda x: format(x,'.2%'))

2021-05-26 15:59:30 4438

原创 pandas pivot table转dataframe

df02=pd.pivot_table(df5yue[df5yue['是否转保']==1],index='险种名称',columns=['转保后险种名称'],values='业务员姓名', aggfunc=[np.size], fill_value=0,margins=True,margins_name='合计').reset_index()df03=pd.DataFrame(df02.to_records()).drop(['index'],axis=1)..

2021-05-08 12:21:05 1827

原创 pandas四舍五入

百分比(gp02['3000P率']).map(lambda x:format(x,'.2%'))设置小数位数，四舍五入f_grouped['comment'].map(lambda x:format(x,'.2%'))千分位分隔符df_grouped['view'].map(lambda x:format(x,','))

2021-03-15 14:34:59 2085

原创 dataframe调整列的顺序最后一列插入到第一列

#调整列的顺序最后一列插入到第一列cl=df.columns[-1:].tolist()cl.df( df.columns[0:3].tolist())df=df[cl]

2021-03-01 09:03:27 4773

原创 dataframe排序完成以后加入名次(排名)

df['排名']=df.reset_index().index+1

2021-03-01 08:58:04 379

原创 python 更新 update DataFrame

SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value instead更改数据集没有 warning 的正确姿势!df.loc[ row.index, '列名']df.loc[ df[df['代码ID']=='106'].index, '安装注册总人数'] ='XXX'

2020-11-06 19:36:45 902

原创 Python 字符串截取

a='200334.csv'a[:-4]# 剔除后4位的字符串 '200334'a[:4]#取前4位 '2003'a[-4:]#取后4位 '.csv'

2020-11-06 19:29:45 153

原创 python 替换字符串内容

msg=''' 【App安装注册进度】各位领导、同事好： [闪电]附图为App进度一览,请各位查阅！（截至{today}日），————————————————总体安装注册数量: {tos} ; 达成率:{rate} 达成率前三机构: [玫瑰] {top3}达成率后三机构: [炸弹] {lst3} ''' fmsg=msg.format(top3=top3,lst3=lst3,today=today,tos=tos[0],rate

2020-11-06 19:26:12 103

原创 python pandas Excel 生成图片

python pandas Excel 生成图片from PIL import ImageGrab#必须ex.Visible = Truews.Range("A1:F19").Select()ws.Range("A1:F19").CopyPicture()ws.Paste(ws.Range('K1')) # 变成图片ws.Shapes(ws.Shapes.Count).Cut() #图片至剪贴板img = ImageGrab.grabclipboard()img.save(file_

2020-11-06 19:24:35 2017

原创 python 分组累加

import pandas as pdimport numpy as npdf = pd.DataFrame.from_dict({'id': ['A', 'B', 'A', 'C', 'C', 'B', 'C'], 'val': [1,2,3,1,5,6,2], 'stuff':['12','23232','13','1234','3235','3236','732323']})print(df)df['cumsum']=df.groupby(['id'])['val'].cumsum()p.

2020-10-23 16:47:40 392

原创关于pandas groupby 的几点深入研究

在一个groupby 语句中实现计算dfgp=dfal.groupby(['机构代码','机构']) \ .agg( 人力=('姓名','size'),//计数预签人力=('是否预签','sum'),//求和预签率=('是否预签',lambda x:sum(x)/len(x)*100), //本列未0,1，求和作为分子，计数作为分母保费预估低档=('保费预估低档',lambda

2020-05-09 16:53:08 159

原创 python 10大装逼语法

(https://blog.csdn.net/xufive/article/details/102856921?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task)

2020-03-29 23:20:32 649

原创两个列表，元素数量相等，两两相乘以后再求和

#两个列表，元素数量相等，两两相乘以后再求和import numpy as nplstp=[100,200,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,1600]lstc=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16]#方法一List3 = np.multiply(np.array(...

2020-03-29 23:03:22 3519

原创日期时间字符串去掉时间的部分

#2020/3/25 19:00:13dfss[‘提交日期’]=pd.to_datetime(dfss[‘提交答卷时间’]).dt.date

2020-03-29 16:24:59 997

原创处理含有TAB和引号的CSV

for ec in df.columns: df.rename(columns={ec:ec.strip()},inplace=True)df.iloc[:,1:10]=df.iloc[:,1:10].astype(str).applymap(lambda x:x.strip())for ec in df.columns: df.rename(columns={ec:ec...

2020-03-04 00:30:45 393

原创 pandas-按照位数补0，时间转换日期，正则提取数字

# -*- coding: utf-8 -*-"""Created on Thu Feb 20 22:14:22 2020@author: zyxxs"""import pandas as pd import numpy as npimport timedfrl['agent_code']=dfrl['AGENT_CODE'].apply(lambda x:str(x).zf...

2020-03-03 02:18:51 962

weixin_45008698的博客

原创 python 生成月初月末

原创 groupby 的嵌套

原创同列多数值匹配