机器学习
把小兔打哭
这个作者很懒,什么都没留下…
展开
-
机器学习之特征工程
1、特征工程是什么特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。2、特征工程的意义直接影响预测结果3、数据的特征抽取1、将文本、字符串等数据转换为数字的形式(特征值化)2、对字典数据进行特征值化sklearn.feature_extraction.DictVectorizer1、DictVectorizer.fi...原创 2019-07-18 16:52:31 · 247 阅读 · 0 评论 -
机器学习之数据降维
数据降维:减少特征数量一、特征选择1、特征选择原因冗余:部分特征相关度高,容易消耗计算性能噪声:部分特征对预测结果由影响2、特征选择是什么特征选择就是单纯地从提取到地所有特征中选择部分特征作为训练集特征主要方法:Filter(过滤式):VarianceThreshold(方差)Embedded(嵌入式):正则化、决策树Wrapper(包裹式)sklearn.featur...原创 2019-07-18 19:49:06 · 713 阅读 · 0 评论 -
机器学习之03数据特征预处理
一、特征处理是什么通过特定的统计方法(数学方法),将数据转换成算法要求的数据1、数值型数据标准缩放:(1)归一化(2)标准化(3)缺失值2、类别型数据:one-hot编码3、时间类型:时间的切分4、预处理API:sklearn.preprocessing二、归一化特点:通过对原始数据进行变换把数据映射到[0,1]之间公式:x’ = (x - min) / (max - m...原创 2019-07-19 11:28:34 · 198 阅读 · 0 评论