特征工程的方法:
1.特征选择移:移除低方差的特征
VarianceThreshold
Threshold(设置水平线,阈值)
2.单变量特征选择:
SelectKBest移除最高之外的(参数k=n1)
SelectPercentile百分比之前
3.基于Tree的特征选取,基于树的estimators计算重要特征。
列出属性重要程度,()
4.pipeline
5.网格搜索
实例分析:
客户价值分析:
显示DataFrame的相信信息:info()方法
sample(5)抽样
R(最近一次消费时间8)F(频率)M(花了多少钱)
to_datatime(pandas就是银行职员开发)时间序列,时间戳,毫秒。
雷达图:展现出在哪个特征下占优势。