1. 数据显示
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#设置value的显示长度为200,默认为50
pd.set_option('max_colwidth',200)
2. 合并数据
data = train.append(test).reset_index(drop=True)
3. 某列中将含 '长虹' 的元素替换
data.loc[data['make'].str.contains('长虹', na=False), 'make'] = 'changhong' #na=False遇到NaN返回False,而不是默认的NaN
4. 将某列中的 'PACM00' 替换成 'OPPO A5'
data['model'].replace('PBAM00',"OPPO A5",inplace=True)
5. pd.to_datetime()
from datetime import datetime
pd.to_datetime(
arg,#int, float, str, datetime, list, tuple, 1-d array, Series DataFrame/dict-like
errors='raise',# {'ignore', 'raise', 'coerce'}, default 'raise'
d