- 博客(27)
- 收藏
- 关注
原创 多个df横向拼接concat
result = pd.concat([df1, df2, df3,df4, df5, df6], axis=1)
2021-06-16 12:39:38
1253
原创 pandas 获取日期是星期几,周几
df[1] = df[0].dt.dayofweek+1data_all['weekday'] = data_all['结团时间'].dt.dayofweek+1
2021-05-18 15:33:46
4038
原创 pandas。agg多个函数
对数据分组后,对指定的列分别进行不同的运算data.groupby('race').agg( { 'age':['min', 'sum'], 'signs_of_mental_illness':['mean', 'sum'] } )
2021-05-17 16:10:08
646
原创 使group的列重复输出,(类似excel)使用reset_index
times = data_t_wek.groupby('userid')[['结团时间']].count().reset_index()
2021-05-16 15:19:46
167
原创 把字典转为df,然后再输出为excel
pd.DataFrame(dict_all,index=[0]).to_excel('dict_all.xlsx')# data = pd.DataFrame(dict_data,index=[0])
2021-05-15 21:02:19
1130
原创 透视表pandas
pd.pivot_table(df,index=["Manager","Rep"],values=["Price"],aggfunc=np.sum)pd.pivot_table(df,index=["Manager","Rep","Product"], values=["Price","Quantity"], aggfunc=[np.sum,np.mean],fill_value=0,margins=True)table =...
2021-05-14 18:33:01
234
原创 python pandas 分箱操作 cut
python pandas 分箱操作import numpy as npimport pandas as pddf = pd.DataFrame(data = np.random.randint(0,150,size = (100,3)),columns=['Python','Tensorflow','Keras'])# 1、等宽分箱pd.cut(df.Python,bins = 3)# 指定宽度分箱pd.cut(df.Keras,#分箱数据bins = [0,60,90,12..
2021-05-14 15:13:24
929
原创 列表推导式和for循环取出
lst1 = [i for i in range(30)]lst2 = []for i in lst1: j = cal_retention(data,i) lst2.append(i)
2021-05-14 14:11:35
209
原创 pandas查看当前日期
datetime.datetime.now()lst1 = [i for i in range(30)]lst2 = []for i in lst1: j = cal_retention(data,i) lst2.append(i)
2021-05-14 14:10:52
2422
原创 2021-05-07
1) 筛选出某列符合条件的行->筛选出换手率大于10的行df = df[df['turnoverratio']>10]2) 按某列的值排序->按换手率大小降序排列df= df.sort_values(by='turnoverratio',ascending=False)3) 只保留需要的列->只保留需要的股票代码,股票名和换手率列df = df[['code', 'name', 'turnoverratio']]...
2021-05-07 18:11:08
78
原创 pandas(Dataframe)里使用lambda匿名函数if..else表达式
df2['收益'] = df2['收益'].apply(lambda x: 10 if x==0 else x)
2021-05-07 18:10:02
1897
原创 dataFrame的多条件筛选
import pandas as pddata[(data.var1==1)&(data.var2>10])
2021-05-07 18:09:27
2978
1
原创 Tableau多轴变同一轴
https://www.jianshu.com/p/d06bf2b53329Tableau官网教程【在视图中为多个度量添加轴】:https://help.tableau.com/current/pro/desktop/zh-cn/multiple_measures.htm
2021-05-02 14:10:26
1670
原创 满足条件的某列函数操作
# 订单状态(含撤单)# 到款人数number_of_recipients=data_0401_10[data_0401_10['订单状态(含撤单)']!='撤单'].groupby(['结团时间'])['userid'].nunique()
2021-05-02 10:52:25
132
原创 series取值方法
(Ov2['2021-04-10']-Ov2['2021-04-09'])/Ov2['2021-04-09']# 日环比# series取值方法
2021-05-02 00:15:46
2258
原创 2021-05-01
对某一列进行操作对DataFrame对某一列求和输入:indextimes010100120200230300340400输出:sum_int=100sum_str='100200300400'Python用sum函数实现:importpandasaspddt={'index':[10,20,30,40],'times':['100','200','300',...
2021-05-01 23:14:50
193
原创 2021-04-30
字符串转为数字final_df["xx"] = pd.factorize(final_df["xx"])[0].astype(int)
2021-04-30 11:12:18
806
原创 时间处理
df2 = df2.sort_index()last_two_week = df2['2021-04-11':'2021-04-24']只有先排序才能使用索引取时间段
2021-04-26 14:58:46
58
原创 2021-04-25
SyntaxError:unexpectedEOFwhileparsing有时候莫名奇妙的出现那个错误 百度搜的结果: 这个错误是你语法有问题
2021-04-25 13:09:49
227
原创 2021-04-24
df22['精确时间'] = pd.to_datetime(df11['精确时间'],errors='coerce')如果时间字段是str类型,且有多种连接符格式(格式不统一),使用以上语句,要加errors参数,
2021-04-24 21:20:55
357
原创 2021-04-23
pandas 数据处理时间数据处理字符串和datetime的相互转换1)python标准库函数日期转换成字符串:利用str 或strftime字符串转换成日期:datetime.strptimestamp = datetime(2017,6,27)1str(stamp)1 '2017-06-27 00:00:00'1stamp.strftime('%y-%m-%d')#%Y是4位年,%y是2位年1 '17-06-27'1#对多个时间进行解析成字符...
2021-04-23 18:29:49
58
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人