- 博客(4)
- 收藏
- 关注
转载 使用sklearn做特征工程
1 特征工程是什么? 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选
2017-05-16 11:36:00 214
原创 简单的机器学习路线
就自身而言接触机器学习和数据挖掘这个行业也就短短的不到一年的时间,在基础数学上还是略显吃力,在这里也不班门弄斧,只是就自己看到的博客和学习的内容做个简单总结下面内容引用至 机器学习与数据挖掘的学习路线图预备知识微积分(偏导数、梯度等等)、概率论与数理统计(例如极大似然估计、中央极限定理、大数法则等等)、最优化方法(比如梯度下降、牛顿-拉普什方法、变分法(欧拉-拉格朗日方程)、凸优化等等)第一条线路
2016-05-24 17:24:14 342
转载 国外程序员整理的机器学习资源大全
本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。通用机器学习MLPackDLibecog
2015-05-30 21:50:13 481
原创 数据降维的几种方法
随着数据集的增加,衍生出大数据平台和并行数据分析算法,同时数据的降维过程的使用重要性也随之凸显。数据的维度并不是越多越好,在数据分析的过程大量的数据也可能产生很差的表现效果。 现在就自己最近看的一篇文章总结降维的几种方法: Seven Techniques for Data Dimensionality Reduction(文章引用)缺失值的比例 数据列如果存在太多的缺失值是不
2015-05-15 16:37:01 3964
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人