机器学习
文章平均质量分 88
Terrible CooKie
一个奋力学习,渴望成为大牛的小菜鸡。
展开
-
【从零开始的ML-02】LinearRegression 类别型变量引入线性回归的几种方法
1. Replace 直接替换例如根据学生测验成绩(0-100分)划分为A(>90)B(80-90)C(70-80)D(<70)四个阶段.2.map()替换类似replace(),没有指定全部映射关系会出现NaN3.LabelEncoding标签编码作用是为变量的n个唯一取值分配一个[0,n-1]之间的编码,将该变量转化成连续的数值型变量。LabelEncoding根据原各唯一取值的先后顺序进行排序后为其转化为对应次序的数值,转化后的结果也在数值上体现了这一优势。• 相较于原创 2021-03-21 11:26:06 · 2898 阅读 · 0 评论 -
【从零开始的ML-01】-LinearRegression 自变量进行标准化会对模型带来的影响
数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权常见的标准化类型:标准差标准化:经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:其中μ为所有样本数据的均值,σ为所有样本数据的标准差。线性标准化(也叫离差标准化):对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:其中max(x)为样本数据的最大值,min(x)为样本.原创 2021-03-21 11:13:57 · 2832 阅读 · 0 评论