1. 取DataFrame中其中几列并组合存储为新的DataFrame
trauma_demo = trauma_demo[['PERSON_ID','VISIT_DATE','VISIT_END_DATE']]
2. dataframe_转换日期格式
1 df1['付款时间1'] = pd.to_datetime(df1['付款时间'])
2 df1['year_month'] = df1['付款时间1'].apply(lambda x : x.strftime('%Y-%m-%d'))
3 print(df1['year_month'])
3. DataFrame实现两表连接
dataframe根据多个条件进行合并
pandas dataframe的各种合并
merge()
# 两表根据相同命名的列合并
df = pd.merge(df1, df2, how='left', on = ['colname'])
# 两表根据命名不同的两列合并:
df = pd.merge(df1, df2, left_on=['df1_colname1'], right_on=['df2_colname1`'])
4. dataframe计算两个日期之间天数
如果不用 .dt.days
会转成timedelta格式,可以试试看
trauma_demo['Length_Stay'] = (pd.to_datetime(trauma_demo['DISCHARGE_DATE']) - pd.to_datetime(trauma_demo['VISIT_DATE'])).dt.days
5. pandas DataFrame 交集并集补集
df1 = DataFrame([['a', 10, '男'],
['b', 11, '男'],
['c', 11, '女'],
['a', 10, '女'