机器学习笔记
猫兔的猪
有意思嗷 读书人
展开
-
Python-intro机器学习-笔记-20201109-HK
机器学习入门笔记整理 决策树回归器: 设置Max_leaf_nodes,防止过拟合; def get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y): model = DecisionTreeRegressor(max_leaf_nodes=max_leaf_nodes, random_state=0) 对比多个Max_leaf_nodes参数,找到MAE最优的那个: # compare MAE with differing val原创 2020-11-09 11:07:06 · 201 阅读 · 0 评论 -
Python-机器学习笔记-项目实战记录-20201130-HK
Interesting things in intro of ML 排序函数 参数_1是被排序的项,参数_2是作为顺序依据的变量; 此处是x[1],也就是d.items()的第二维变量的值作为排序依据; sorted(d.items(), key=lambda x: x[1])原创 2020-11-30 14:25:24 · 77 阅读 · 2 评论 -
机器学习 - 2 -SVM核函数 - 20201123 -HK
对支持向量机SVM的核函数和可分能力谈谈自己的想法 svm找超平面的本质其实就是找一个维度 核函数就是维度的体现 当核函数A达到了这个维度,一个训练样本X对于A可分,那就说明这个维度是X的一个可分维度,核函数A只是这个维度上的一个特定的分割工具,你还可以在这个平面上找到其他的分割工具; ex1.此时有一个核函数B,它是A的线性变换得到的,那么样本X对于B来说可分吗? 我的理解是: 可分。因为A和B在同一个维度上,而且利用核函数的性质,线性转换不会改变在高维度的非线性分割能力。 但是 我认原创 2020-11-23 16:30:55 · 115 阅读 · 0 评论 -
(持续更新)Python-Pandas-笔记-20201102-HK
Pandas库-笔记整理(1)-20201102 对多变量的索引重置 对象.reset_index() 生成对多变量的多统计表 对象表名.groupby(['tag_1', 'Tag_2']).description.agg([调用函数_1, 调用函数_2]) groupby()默认用index来排序;sort_values(by=[‘变量名1’], [‘变量名2’])可以设置使用表中数据进行排序,默认优先用变量名1排序。 使用groupby按照某列(A)进行分组后,需要对另外一列(B原创 2020-11-02 23:56:17 · 234 阅读 · 0 评论 -
机器学习 - 1 Boosting&SVM - 20201028 - HK
机器学习 - 1 - AdaBoost & SVM 解题过程整理原创 2020-10-28 17:59:48 · 469 阅读 · 0 评论