在Pandas中,日期列的类型通常是`datetime64`。但是在某些情况下,我们只需要日期部分,而不需要时间部分。这时,可以通过以下几步去掉日期列后面的时间部分:
1. 导入所需的库
python
import pandas as pd
2. 创建示例DataFrame,包含完整的日期时间
python
df = pd.DataFrame({'date': ['2020-01-01 00:00:00', '2020-01-02 00:00:00']})
3. 使用`pd.to_datetime()`将`date`列转换为`DateTime`类型
python
df['date'] = pd.to_datetime(df['date'])
4. 使用`.loc`进行索引,选择`date`这一列,但只选择日期部分,去掉时间部分
python
df['date'] = df['date'].loc[:, 'date']
5. 此时`date`列就只剩下了日期部分
date
0 2020-01-01
1 2020-01-02
所以完整的代码是:
python
import pandas as pd
df = pd.DataFrame({'date': ['2020-01-01 00:00:00', '2020-01-02 00:00:00']})
df['date'] = pd.to_datetime(df['date'])
df['date'] = df['date'].loc[:, 'date']
print(df)
# 输出:
date
0 2020-01-01
1 2020-01-02
这就是在Pandas中去掉日期列后面的时间部分,只保留日期的简单而有效的方法。