sklearn
文章平均质量分 78
Window_Bird
计科大三在读;高教杯数学建模三等奖,13届妈妈杯三等奖;濯足清流,抽足再入虽非前水,依然沁凉不减。
展开
-
sklearn_Lasso与多项式回归_菜菜视频学习笔记
lasso限制多重共线性,lasso进行特征选择;分箱处理非线性问题;多项式回归进行特征创造处理非线性问题原创 2022-10-11 22:00:38 · 1540 阅读 · 0 评论 -
sklearn_岭回归与多重共线性_菜菜视频学习笔记
探索sklearn中岭回归处理线性回归的多重共线性问题原创 2022-10-07 17:35:19 · 1011 阅读 · 0 评论 -
sklearn_SVM:SVC真实案例:天气预测_菜菜视频学习笔记
使用SVC对5000行21个特征的天气数据进行预测下雨天使用了特征工程进行数据预处理,调整松弛变量,更换模型,调整阈值来提升模型预测效果原创 2022-10-05 18:47:50 · 1348 阅读 · 0 评论 -
sklearn_SVM:处理样本不平衡问题__菜菜视频学习笔记
使用ROC与AUC对支持向量机软间隔不平衡数据的处理,ROC曲线使用假正率与召回率作为两轴通过寻找最佳阈值来使得软间隔分类效果最佳原创 2022-10-04 17:48:26 · 1684 阅读 · 1 评论 -
sklearn_SVM(上)_菜菜视频学习笔记
实现SVM数据的可视化,升维分离非线性数据;验证了不同核函数在不同数据集上的表现,以乳腺癌数据集为实例,发现了rbf,多项式核函数在数据量纲化下,表现的不足;验证了松弛系数惩罚参数c对算法预测精度的提升原创 2022-10-02 11:12:38 · 401 阅读 · 0 评论 -
sklearn_聚类算法与Kmeans_菜菜视频学习笔记
案例2. 27万个像素点,9万种特征组合的颜色,通过kmeans选择64种特征组合的颜色作为质心(获得64种特征组合的序列号),进行聚类,将27万个像素点找到对应的序列号(0-63),而后给备份的数据覆盖聚类质心对应的特征组合的颜色,进而实现数据降维。案例1. 通过返回每个样本的轮廓系数,设置不同的聚类数,以可视化的形式,与总体的均值轮廓系数做比较,找到最佳聚类数。原创 2022-09-18 23:58:44 · 959 阅读 · 0 评论 -
sklearn_逻辑回归制作评分卡_菜菜视频学习笔记
使用逻辑回归分类器制作银行信用评分卡,数据预处理(处理异常值,平衡样本),依据证据权重计算得分来选取最优分箱原创 2022-09-04 00:03:30 · 1265 阅读 · 5 评论 -
sklearn_784个特征的手写数据降维实例_菜菜视频笔记
【代码】sklearn_784个特征的手写数据降维实例。原创 2022-08-28 23:41:30 · 366 阅读 · 0 评论 -
sklearn_trim_PCA降维学习_菜菜视频笔记
【代码】sklearn_trim降维学习。原创 2022-08-28 23:38:46 · 318 阅读 · 0 评论 -
DecisionTree_tantic
【代码】DecisionTree_tantic。原创 2022-08-23 16:03:18 · 321 阅读 · 0 评论 -
data.preprocessing_基于菜菜sklearn部分代码修改_学习实例
【代码】data.preprocessing_个人操作代码。原创 2022-08-23 15:33:23 · 433 阅读 · 0 评论