感想
经常使用的几个小技巧:
1、使用pandas必须导入两个包:
import numpy as np
import pandas as pd
2、当数据字段超过20个以上,需要使用以下语句来展示全部列:
#显示所有列
pd.set_option('display.max_columns', None)
#设置value的显示长度为100,默认为50
pd.set_option('max_colwidth',100)
3、2个常用函数、2个常用方法:
info():用于查看各字段数据类型、行数及是否存在缺失值;
head():查看数据;
columns:用于查看各字段名称,方便复制使用;
shape:查看维度,即几行几列;
4、列表推导式和lambda函数经常组合一起用,比如:
a=pd.DataFrame({'状态':['系统取消','用户取消','商家取消','已确认','已送达','配送中']})
a['新状态']=a['状态'].apply(lambda x:'取消' if '取消' in x else '成功')
一般地,apply、lambda、列表推导式一起组合处理数据。map是常用列表处理