数据挖掘
文章平均质量分 50
翁JJ
www.wengjj.ink
展开
-
数据矿工学习-数据挖掘基本流程思维导图1.0
新车上路,难免疏漏,欢迎指出凹脑图在线浏览地址:数据挖掘基本流程如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink原创 2018-03-19 11:09:54 · 714 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图6.2-最大熵模型与最优化算法
最大熵模型目前应用在NLP上比较多,本章的最大熵模型的内容与数学推导公式比较多(最优化算法部分本人水平有限(ˉ▽ˉ;)...,当时看的最优化算法时有点懵逼,可能会有疏漏,望各位海涵,欢迎提出修改意见)思维来自《统计学习方法》-李航凹脑图在线浏览地址:最大熵模型与最优化算法才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-06-06 17:04:50 · 518 阅读 · 0 评论 -
数据矿工学习-情感分析框架DeepEmo论文简析
来自台湾国立清华大学的Elvis Saravia等研究人员提出了一种基于图论(graph-based)的机制来提取丰富情感(rich-emotion)的相关模式(pattern),用来加强对语料库的线上情感表达进行深入分析。论文实验结果表明,所提出的情感分析框架DeepEmo比目前大多数的情感分析框架的F1-score都要高(仅次于Volvoka(2016)),而且其提出的富集模式(enriche...原创 2018-06-20 15:18:40 · 985 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图7.1-线性可分支持向量机
在机器学习的学习之路上,SVM是ML童鞋们在分类问题上一定会遇到的一个学习方法,SVM这一章将SVM按训练数据的线性可分性分为由简到繁分为三种模型:线性可分支持向量机(linner support vector machine in linearly separable case)、线性支持向量机(linear support vector machine)以及非线性支持向量机(non-linea...原创 2018-07-18 10:07:14 · 430 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图7.2-线性支持向量机
思维来自《统计学习方法》-李航上一章讲了线性可分支持向量机,但在实际工程中,样本数据往往是数据不可分的,此时就需要另一种学习器-线性支持向量机,又称线性不可分支持向量机,因为其适用范围更广,所以一般将其称为线性支持向量机,其学习策略为-软间隔最大化(区别于线性可分支持向量机的硬间隔最大化):凹脑图在线浏览地址:线性支持向量机才学疏浅,欢迎评论指导 如想更方便地阅览思维...原创 2018-07-24 14:19:40 · 503 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图7.3-非线性支持向量机与核函数
思维来自《统计学习方法》-李航前两篇我们看的是都是适应线性样本的支持向量机,那遇到非线性的分类问题呢?利用核技巧,就可以将线性分类的学习方法应用到非线性分类问题中去,将线性支持向量机拓展到非线性支持向量机,只需将线性支持向量机对偶形式中的内积换成核函数,接下来就来看下非线性支持向量机的思维导图:凹脑图在线浏览地址:非线性支持向量机才学疏浅,欢迎评论指导 如想更方便地阅...原创 2018-08-02 14:29:35 · 467 阅读 · 0 评论 -
100-Days-Of-ML-Code 100天机器学习挑战
100-Days-Of-ML-CodeML网红Siraj Raval发起了一个名为:100-Days-Of-ML-Code的挑战赛,意为鼓励同学们每天抽出点时间来学习机器学习,看看100天后你有了哪些进步目前Github上面最火爆的100-Days-Of-ML-Code就是Avik-Jain的机器学习项目,超赞的配图,清晰的知识点梳理,是入门机器学习非常好的项目Github:https...原创 2018-08-07 14:49:37 · 1789 阅读 · 0 评论 -
数据矿工学习-Python数据可视化神器pyecharts使用细则
前言我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工具-Echarts,可视化类型非常多,但是得通过导入js库在Java Web项目上运行,平时用Python比较多,于是就在想有没有Python与Echarts结合的轮子。Google后,找到一个国人开发的一个Echarts与Python结合的轮子:pyechar...原创 2018-08-16 13:37:45 · 1330 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图7.4-SMO序列最小最优化算法
思维来自《统计学习方法》-李航由Platt提出的SMO算法是支持向量机学习的一种快速算法,其特点为不断将原二次规划问题分解为只有两个变量的二次子规划问题,并对子问题进行解析求解,直到所有变量满足KKT条件为止。SVM是通过求得全局最优解来进行学习,SVM在面对大规模的训练样本时,效果往往不是很好·,SMO算法正是为了解决这个问题而提出的。至此SVM章节的相关内容就全部结束了(本节思维导图涉及较...原创 2018-08-23 14:34:05 · 424 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图6.1-逻辑斯蒂回归模型
逻辑斯蒂回归模型是经典的分类学习器,在二分类的监督问题上分类效果非常好,其经典之处就在于LR的分布函数-sigmoid函数。思维来自《统计学习方法》-李航凹脑图在线浏览地址:逻辑斯蒂回归模型才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-06-06 16:56:33 · 532 阅读 · 0 评论 -
数据矿工学习-Python数据分析之pandas
前言前面一篇文章我们介绍了numpy,但numpy的特长并不是在于数据处理,而是在它能非常方便地实现科学计算,所以我们日常对数据进行处理时用的numpy情况并不是很多,我们需要处理的数据一般都是带有列标签和index索引的,而numpy并不支持这些,这时我们就需要pandas上场啦!PandasWHAT?Pandas是基于Numpy构建的库,在数据处理方面可以把它理解为numpy加强版,同时Pan...原创 2018-05-20 20:53:56 · 443 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图5.0-决策树
本章主要讲了决策树学习算法的三个部分:特征选择、树的生成方式和树的剪枝以及三种决策树算法:ID3、C4.5、CARTTips:决策树的东西比较多(这章啃了一个星期才啃完 (lll¬ω¬)),我们平时使用的Sklearn里面的决策树用的就是CART算法,所以这章的重点就在于CART的两种树模型(回归树、分类树),ID3和C4.5可作为了解。思维来自《统计学习方法》-李航凹脑图在线浏览地址:决策树才学...原创 2018-05-06 02:10:22 · 504 阅读 · 0 评论 -
数据矿工学习-python基础思维导图1.0
新车上路,难免疏漏,欢迎指出凹脑图在线浏览地址:python基础如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink原创 2018-03-20 21:30:45 · 201 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图1.0-统计学习概论
改进了思维导图了,尽量简约为主,不过多延伸。思维来自《统计学习方法》-李航凹脑图在线浏览地址:统计学习方法概率才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-03-25 00:00:04 · 821 阅读 · 1 评论 -
数据矿工学习-《统计学习方法》思维导图1.1-监督学习与统计学习三要素
监督学习概论 与 统计学习三要素思维来自《统计学习方法》-李航凹脑图在线浏览地址:统计学习三要素才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-03-25 16:20:52 · 405 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图1.2-模型的评估与选择
《统计学习概论》第一章到这里就结束了,本思维导图主要讲的是模型的选择,模型的评估还有统计学习三大问题。思维来自《统计学习方法》-李航凹脑图在线浏览地址:模型评估与选择才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-03-25 22:53:52 · 329 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图2.0-感知机
本章主要讲了感知机的模型、策略以及算法的相关证明。思维来自《统计学习方法》-李航凹脑图在线浏览地址:感知机思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-04-01 02:13:01 · 536 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图3.0-K近邻法
本章主要讲了K近邻的算法、模型 以及kd树的构造与最近邻搜索。思维来自《统计学习方法》-李航凹脑图在线浏览地址:K近邻法思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-04-11 22:43:00 · 360 阅读 · 0 评论 -
数据矿工学习-《统计学习方法》思维导图4.0-朴素贝叶斯法
本章主要讲了生成学习方法-朴素贝叶斯法的详细生成方法 、 朴素贝叶斯的特点-条件独立性假设思维来自《统计学习方法》-李航凹脑图在线浏览地址:朴素贝叶斯思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...原创 2018-04-20 12:33:04 · 771 阅读 · 0 评论 -
数据矿工学习-Python数据分析之numpy
前言刚开始学习数据挖掘时,有时总是对numpy和pandas傻傻分不清楚,这个问题在训练模型阶段输入训练数据的时候最为明显,下面就来详细介绍下numpy和pandasNumpyWHAT?numpy是专门为科学计算设计的一个python扩展包,为python提供高效率的多维数组,也被称为面向阵列计算(array oriented computing),同时numpy也是github上的一个开源项目:...原创 2018-05-17 00:59:01 · 346 阅读 · 0 评论 -
数据矿工学习-先有鸡or先有蛋?浅谈数据拆分与特征缩放的顺序问题
前些天在100-Days-Of-ML-Code上回答了一个关于数据拆分与特征缩放的顺序先后的一个issue,感觉挺有争议性的,故单独拎出来做下笔记说明。我的观点是:机器学习工程中,应该先进行数据划分,再进行特征缩放。出于严谨性,本篇文章是从机器学习-数据挖掘方面进行数据拆分与特征缩放的顺序问题阐述,同时也欢迎大家一起讨论这个问题。问题阐述关于数据拆分与特征缩放的顺序先后问题,一般会在工...原创 2018-08-30 11:35:39 · 578 阅读 · 2 评论