sklearn
中小学生
这个作者很懒,什么都没留下…
展开
-
sklearn中为什么需要对数据进行缩放
为什么要做特征缩放大多数情况下,你的数据集将包含在大小、单位和范围上差别很大的特征。但是,由于大多数机器学习算法在计算中使用两个数据点之间的欧氏距离,这会是一个问题。如果不加考虑,这些算法只考虑特征的大小而忽略了单位。在5kg和5000gms不同的单元之间,结果会有很大的差异。在距离计算中,大尺度的特征比小尺度的特征要重要得多在运用一些机器学习算法的时候不可避免地要对数据进行特征缩...原创 2019-11-28 11:05:22 · 820 阅读 · 0 评论 -
决策树可视化(使用sklearn.tree 的export_graphviz方法)
GraphViz安装配置连接https://yunyaniu.blog.csdn.net/article/details/79008351使用GraphViz可视化dot文件时,使用命令行的方式报错:'dot' 不是内部或外部命令,也不是可运行的程序解决办法是直接调用gvedit.exe打开.dot文件就能生成决策树1.可以在GraphViz的bin目录下,找到gvedit.exe文件...原创 2019-07-07 12:15:00 · 31584 阅读 · 7 评论 -
sklearn中的正则化
关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化https://www.cnblogs.com/chaosimple/p/4153167.html正则化没搞懂,留存继续学习转载 2019-07-18 16:01:32 · 1483 阅读 · 0 评论 -
Python三种方法计算皮尔逊相关系数以及实现给定数据集,返回数据集中每个特征和标签的相关系数
特征预处理完之后,我们需要选择有意义的特征作为输入机器学习的算法和模型进行训练在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs)。用于衡量两个变量X和Y之间的线性相关相关关系,值域在-1与1之间。详细...原创 2019-07-18 20:20:47 · 4380 阅读 · 1 评论 -
sklearn中的random_state
很多人都把random_state解释为随机数种子。是不是很懵逼?什么是随机数种子?我也不知道什么是随机数种子。但是,随机数种子是为了保证每次随机的结果都是一样的Example:sklarn可以随机分割训练集和测试集(交叉验证),只需要在代码中引入model_selection.train_test_split就可以了https://blog.csdn.net/Tony_Stark_W...转载 2019-07-26 15:50:21 · 637 阅读 · 0 评论 -
随机森林中feature_importances_的理解
https://blog.csdn.net/zjuPeco/article/details/77371645转载 2019-07-26 17:54:20 · 22175 阅读 · 0 评论 -
sklearn中random_state 这个参数
random_state 控制每次的随机原博客https://blog.csdn.net/yangyiwxl/article/details/71641355转载 2019-08-09 15:27:50 · 1513 阅读 · 0 评论