问题描述
如下图的日期dataframe,需要把开始日期和结束日期拼接在一起
原dataframe
开始日期 | 结束日期 |
---|---|
2020-08-03 | 2020-08-09 |
2020-08-10 | 2020-08-16 |
2020-08-17 | 2020-08-23 |
2020-08-24 | 2020-08-30 |
2020-08-31 | 2020-09-06 |
拼接后的dataframe
开始日期 | 结束日期 | 插入日期 |
---|---|---|
2020-08-03 | 2020-08-09 | 2020-08-03 ~ 2020-08-09 |
2020-08-10 | 2020-08-16 | 2020-08-10 ~ 2020-08-16 |
2020-08-17 | 2020-08-23 | 2020-08-17 ~ 2020-08-23 |
2020-08-24 | 2020-08-30 | 2020-08-24 ~ 2020-08-30 |
2020-08-31 | 2020-09-06 | 2020-08-31 ~ 2020-09-06 |
解决方案
方案一:apply映射
# 方案1
date_xl['插入日期']=date_xl.apply(lambda x:x['开始日期']+" ~ "+x['结束日期'],axis=1)
# 方案2
date_xl['插入日期']=date_xl.apply(lambda x:" ~ ".join(x.values),axis=1)
上面两种方法,原理基本一致
碰到Null值时,会报错,因为none不可与str运算
解决如下,加入if判断即可
df = pd.DataFrame([list("ABCDEF"),
list("ABCDE")]).T
df.columns=list('XY')
df.apply(lambda x:" ~ ".join(x.values) if (x.values[0]!= None) &(x.values[1] != None) else np.nan,axis=1)
方案二:转成嵌套数组/列表
# 转换成嵌套数组
df.values
np.array(df)
#转换成嵌套列表
df.values.tolist()
np.array(df).tolist()
# 拼接
pd.DataFrame([" ~ ".join(i) if (i[0]!= None) &(i[1] != None) else np.nan for i in np.array(df).tolist()])