算法使用
·创建
·参数调节 cross_val_score:求单一参数最合适的值(KNN) GridSearchCV网格搜索:多参数组合最优的值。 标准:准确率,精确率,召回率,F1
数据清洗
操作数据库(数据清洗)
数据分析,可视化(Excel可视化)
算法原理
内在动力cpu i7-9700k (超频,打鸡血)
面试(最重要的)
表达出来,训练,学会。原理本质上简单,通俗的,生活
KNN原理,距离(调整,p=1, p =2设置p= 1, p =2调和)
决策树原理:嫡、gini系数、梯度下降、梯度上升
随机森林,极限森林:简单决策树+随机性
梯度提升树(回归):每棵树画出来,显示,推导
梯度提升分类树