![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 71
hankbbb
这个作者很懒,什么都没留下…
展开
-
从零开始学ai-机器学习篇 3.数据特征和预处理
数据特征和预处理1.特征处理的方法2.sklearn特征预处理API特征处理是什么?通过特定的统计方法(数学方法)将数据转换成算法要求的数据数值型数据:标准缩放1.归一化2.标准化3.缺失值类别型数据:one-hot编码时间类型:时间的切分one hot 热编码one-hot编码 - 热编码 为每个类别生成一个布尔列,这些列中只有一列可以为每个样本取值1,因此,术语一个热编码归一化使得某一个特征对最终结果不会造成更大的影响缺点:异常点对最大值最小值影响太大原创 2021-05-19 10:56:35 · 197 阅读 · 0 评论 -
从零开始学ai-机器学习篇 2.特征工程
特征工程本章需要使用到sklearn库,详细步骤就不说了,大家自行解决特征工程的目的目的是最大限度地从原始数据中提取特征以供算法和模型使用sklearn对特征工程API的简单解释sklearn对特征工程的封装很好,使用起来非常友善.以下是对其api的解释xx.fit_transform()将数据放入xx模型进行计算和转换xx.inverse_transform()返回转化之前的数据格式(可选array或者sparse的格式)xx.get_feature_names()返回原创 2021-05-17 10:10:34 · 158 阅读 · 0 评论 -
从零开始学ai-机器学习篇 1.机器学习概述
机器学习概述机器学习算法是核心,数据和计算是基础机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效一般训练集:测试集为0.75:0.25机器学习分类监督学习 输入数据有特征有标签,即有标准答案监督学习(Supervised learning)可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个原创 2021-05-17 09:36:23 · 177 阅读 · 0 评论