自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 日期格式比较

某一列是日期格式datetime,将这一列和某一个日期比较将日期格式转为str之后再比较:R01_credit_mcht.ix[R01_credit_mcht['first_bill_date'].astype(str)>\                 utility.datetime_month_lag(-2)[4].format('YYYY-MM-DD'),'use_end_flag...

2018-04-28 10:16:07 567

原创 dataframe按照主键排序

lc_his = lc_his.sort_values(by = ['orgcode','month'],axis = 0,ascending = True)  

2018-04-27 13:38:08 1120

原创 判断dataframe、list是否为空

1、判断dataframe是否为空    如果df为空,则 df.empty 返回 True,反之 返回False。2、判断list是否为空if len(all)=0 为空,否则为非空

2018-04-26 16:27:42 65528 3

原创 定义空dataframe

lc_his =  pd.DataFrame(columns=['distance_km', 'imei_num', 'month'])

2018-04-26 11:42:20 5316

原创 在循环中动态生成变量

while (month_lag >= '201601'):   locals()["lc_"+month_lag] = get_month_lc(-i)   month_lag = utility.datetime_month_lag(-i)[3]   i=i+1   print('The iter_lc is:', month_lag)通过locals()["lc_"+month_lag...

2018-04-26 11:41:39 1925

原创 第三方时间处理库arrow

安装方法pip install arrow def datetime_month_lag(lag_n,datetime=arrow.now()):    datetime_lagn = datetime.shift(months=+lag_n)    return datetime_lagn.format('YYYY-MM-DD HH:MM:SS'),\    datetime_lagn.form...

2018-04-25 14:59:32 254

原创 如何安装arrow

pip install arrow

2018-04-24 18:17:16 2097

原创 两张表set在一起

oil_table_1 = pd.read_excel(u"D:\\20180418_1.xlsx")oil_table_2 = pd.read_excel(u"D:\\\20180418_2.xlsx")frame = [oil_table_1,oil_table_2]oil_table = pd.concat(frame)  

2018-04-18 17:24:47 341

原创 将index转为columns

方法一:df_orgcode = df_orgcode .reset_index()输出结果如下:方法二:df_orgcode['orgcode'] = df_orgcode.index

2018-04-17 16:29:40 8018

原创 对列名排序

pandas DataFram 如何制定列的顺序(默认列名字典顺序)1、以提取子集的方式处理df_mrg = df_mrg[['orgcode','is_etc', 'is_equip','platf_cnt',                       'contact', 'distributor'] 2、将表按照自己设想列的顺序输出到csv问题:默认的是按照列名的字典顺序排序的,要固定顺序...

2018-04-17 16:25:05 910

原创 删除某一列或多列

删除某一列或多列删除一列,del data['a']删除多列,raw_4.drop(labels=['orgcode','city'],axis=1)

2018-04-17 16:22:11 3202

原创 按列去重

data_np = data.drop_duplicates() ,data所有列完全相同才会删除data_np = data.drop_duplicates(['a','b']) 去重机制,去重是保留第一条记录还是最后一条记录,可以通过drop_duplicate中的参数keep控制data.drop_duplicates(['a','b'],keep='last'),默认保留第一个出现的值...

2018-04-17 16:21:22 339

原创 如何按照条件填充或者替换某一列

如果为空用其他列填充:df_mrg.ix[df_mrg.contact.isnull(),'contact'] = df_mrg['contact2']  如果contact为A用其他列填充:df_mrg.ix[df_mrg.contact==“A”,'contact'] = df_mrg['contact2']  ...

2018-04-17 16:20:12 3652 1

原创 pandas 去重删除等技巧

1、该列如果为空用其他列填充:df_mrg.ix[df_mrg.contact.isnull(),'contact'] = df_mrg['contact2']  2、去重data_np = data.drop_duplicates() ,data所有列完全相同才会删除data_np = data.drop_duplicates(['a','b']) 去重机制,去重是保留第一条记录还是最后一条记录...

2018-04-13 09:49:38 2746

原创 mysql的两个函数FROM_UNIXTIME和UNIX_TIMESTAMP

最近看数据库,每张表中都有time_version,而且取值又看不出什么意思,知道是时间戳,想把他转为人类能够识别的格式,FROM_UNIXTIME(1523177523)=2018-04-08 16:52:03同时,逆向的,可以将当前时间转为这种长时间戳,比如UNIX_TIMESTAMP(NOW()) 1523344195...

2018-04-10 15:11:10 146

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除