机器学习
文章平均质量分 84
水果翻炒数据
厚积薄发,简约至上
展开
-
学习路径之机器学习(1)
1.大概学习路径图2.数学基础2.1 微积分:知识:微积分的计算及物理意义,凸优化和条件最优化运用:梯度下降法、牛顿法等。能理解“梯度下降是用平面来逼近局部,牛顿法是用曲面逼近局部”.2.2 线性代数知识:矩阵乘法,向量的内积运算运用:矩阵乘法与分解主要运用在主成分分析(PCA)和奇异值分解(SVD)2.3 概率与统计知识:极原创 2017-08-02 10:17:43 · 267 阅读 · 0 评论 -
06词特征表示实践
读取数据import pandas as pdcorpus=list(pd.read_table('words.txt').iloc[:,0])#提取语料中的十个句子进行演示corpus=corpus[10:20]词特征表示方法Common Vectorizer usagesklearnfrom sklearn.feature_extraction.text import Coun...原创 2019-01-22 16:56:21 · 359 阅读 · 0 评论 -
03数据清洗与自定义函数
前言1)本节课学习正则表达式的用法,为数据清洗打下基础2)学习函数相关知识,提高代码的重用性以及可读性python知识的补充1、字符替换与正则表达式简单的字符替换str.replace()print(help(str.replace))Help on method_descriptor:replace(...) S.replace(old, new[, coun...原创 2018-12-29 11:21:20 · 372 阅读 · 0 评论 -
GBDT原理
GBDT主要由三个概念组成:Regression Decistion Tree(即DT),Gradient Boosting(即GB),Shrinkage (算法的一个重要演进分枝,目前大部分源码都按该版本实现)。一、 DT:回归树 Regression Decision TreeGBDT的核心在于累加所有树的结果作为最终结果GBDT中的树都是回归树,不是分类树,这点对理解GBDT相当原创 2017-08-21 19:29:10 · 235 阅读 · 0 评论 -
特征选择之python实战(一)
前言:实际应用中特征作用远大于模型。声明:本文为读书笔记,原文地址:http://www.tuicool.com/articles/ieUvaq特征选择主要有两个功能:1.减少特征数量、降维,使模型泛化能力更强,减少过拟合2.增强对特征和特征值之间的理解特征选择方法总览1 去掉取值变化小的特征 Removing features with原创 2017-08-13 16:29:03 · 4927 阅读 · 0 评论 -
如何选择合适的机器算法解决问题
step 1:对问题进行分类 法一: 法二: step 2:寻找可用的算法根据分类结果,寻找对应合适的算法2.1 分类 2.1.1 SVM (1)可用于找到尽可能宽的分类的边界:当两个分类不能被清楚地分开时,该算法会找到其所能找到的最原创 2017-08-02 17:19:32 · 367 阅读 · 0 评论 -
07特征选择与降维
一、特征选择当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说,从两个方面考虑来选择特征:特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。 特征与目标的相关性:这点比较显见,与目标相关性高的特征,应当优选选择。除方差法外,本文介绍的其他方法均从相关性考虑。 根据特征选择...原创 2019-03-03 14:24:42 · 323 阅读 · 0 评论