- 博客(27)
- 资源 (1)
- 收藏
- 关注
原创 C++个人疑问集
C++个人疑问集十进制浮点数的二进制存储方式以及转换十进制浮点数的二进制存储方式以及转换V = (-1)s×M×2E(-1)s表示符号位,当s=0,V为正数;当s=1,V为负数M表示有效数字,大于等于1,小于22E表示指数例如:将十进制178.125表示成机器内的32个字节的二进制形式第一步:将178.125表示成二进制数:(178.125)(十进制数)=(10110010.001)(二进制形式);十进制整数转换为二进制整数:除2取余,逆序排列十进制小数转换为二进制小数:乘2取整,顺
2020-05-31 01:32:20
427
原创 数据矿工学习-先有鸡or先有蛋?浅谈数据拆分与特征缩放的顺序问题
前些天在100-Days-Of-ML-Code上回答了一个关于数据拆分与特征缩放的顺序先后的一个issue,感觉挺有争议性的,故单独拎出来做下笔记说明。我的观点是:机器学习工程中,应该先进行数据划分,再进行特征缩放。出于严谨性,本篇文章是从机器学习-数据挖掘方面进行数据拆分与特征缩放的顺序问题阐述,同时也欢迎大家一起讨论这个问题。问题阐述关于数据拆分与特征缩放的顺序先后问题,一般会在工...
2018-08-30 11:35:39
632
2
原创 数据矿工学习-《统计学习方法》思维导图7.4-SMO序列最小最优化算法
思维来自《统计学习方法》-李航由Platt提出的SMO算法是支持向量机学习的一种快速算法,其特点为不断将原二次规划问题分解为只有两个变量的二次子规划问题,并对子问题进行解析求解,直到所有变量满足KKT条件为止。SVM是通过求得全局最优解来进行学习,SVM在面对大规模的训练样本时,效果往往不是很好·,SMO算法正是为了解决这个问题而提出的。至此SVM章节的相关内容就全部结束了(本节思维导图涉及较...
2018-08-23 14:34:05
451
原创 数据矿工学习-Python数据可视化神器pyecharts使用细则
前言我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工具-Echarts,可视化类型非常多,但是得通过导入js库在Java Web项目上运行,平时用Python比较多,于是就在想有没有Python与Echarts结合的轮子。Google后,找到一个国人开发的一个Echarts与Python结合的轮子:pyechar...
2018-08-16 13:37:45
1376
翻译 数据矿工学习-这是一篇献给新手的深度学习综述
这篇综述论文列举出了近年来深度学习的重要研究成果,从方法、架构,以及正则化、优化技术方面进行概述。这篇综述对于刚入门的深度学习新手是一份不错的参考资料,在形成基本学术界图景、指导文献查找等方面都能提供帮助。论文:Recent Advances in Deep Learning: An Overview论文地址:https://arxiv.org/pdf/1807.08169v1.pdf...
2018-08-10 15:47:12
1023
原创 100-Days-Of-ML-Code 100天机器学习挑战
100-Days-Of-ML-CodeML网红Siraj Raval发起了一个名为:100-Days-Of-ML-Code的挑战赛,意为鼓励同学们每天抽出点时间来学习机器学习,看看100天后你有了哪些进步目前Github上面最火爆的100-Days-Of-ML-Code就是Avik-Jain的机器学习项目,超赞的配图,清晰的知识点梳理,是入门机器学习非常好的项目Github:https...
2018-08-07 14:49:37
1945
原创 数据矿工学习-《统计学习方法》思维导图7.3-非线性支持向量机与核函数
思维来自《统计学习方法》-李航前两篇我们看的是都是适应线性样本的支持向量机,那遇到非线性的分类问题呢?利用核技巧,就可以将线性分类的学习方法应用到非线性分类问题中去,将线性支持向量机拓展到非线性支持向量机,只需将线性支持向量机对偶形式中的内积换成核函数,接下来就来看下非线性支持向量机的思维导图:凹脑图在线浏览地址:非线性支持向量机才学疏浅,欢迎评论指导 如想更方便地阅...
2018-08-02 14:29:35
492
原创 数据矿工学习-《统计学习方法》思维导图7.2-线性支持向量机
思维来自《统计学习方法》-李航上一章讲了线性可分支持向量机,但在实际工程中,样本数据往往是数据不可分的,此时就需要另一种学习器-线性支持向量机,又称线性不可分支持向量机,因为其适用范围更广,所以一般将其称为线性支持向量机,其学习策略为-软间隔最大化(区别于线性可分支持向量机的硬间隔最大化):凹脑图在线浏览地址:线性支持向量机才学疏浅,欢迎评论指导 如想更方便地阅览思维...
2018-07-24 14:19:40
535
翻译 数据矿工学习-样本自适应的在线卷积稀疏编码论文-个人中文翻译
论文地址 : https://arxiv.org/abs/1804.10366文中的数学公式符号并不能很好的显示,采用普通字母代替,故带有一定的误差,建议数学公式的推导还是回归论文查看。简介卷积稀疏编码(CSC)已被广泛用于图像和信号处理中的平移不变字典的学习。然而,现有的方法的可扩展性是有限的。在本文中,我们使用的不是样本共享的字典来卷积,而是使用样本自适应字典,其中每个过滤器是...
2018-07-23 16:12:28
2094
3
原创 数据矿工学习-样本自适应的在线卷积稀疏编码论文简析
在瑞典斯德哥尔摩国际会展中心举行的国际机器学习大会(ICML)正在受到全世界科技界的关注。来自国内人工智能企业队代表第四范式的姚权铭与来自香港科技大学的研究者提出的“Online Convolutional Sparse Coding with Sample-Dependent Dictionary:样本自适应的在线卷积稀疏编码”,入选了ICML 2018中选论文榜单。首先我们先通过思维导图来...
2018-07-23 15:57:44
1064
2
原创 数据矿工学习-《统计学习方法》思维导图7.1-线性可分支持向量机
在机器学习的学习之路上,SVM是ML童鞋们在分类问题上一定会遇到的一个学习方法,SVM这一章将SVM按训练数据的线性可分性分为由简到繁分为三种模型:线性可分支持向量机(linner support vector machine in linearly separable case)、线性支持向量机(linear support vector machine)以及非线性支持向量机(non-linea...
2018-07-18 10:07:14
466
翻译 数据矿工学习-情感分析框架DeepEmo论文-个人中文翻译
DeepEmo: Learning and Enriching Pattern-Based Emotion Representations作者:Elvis Saravia /National Tsing Hua University Hsinchu, Taiwan /ellfae@gmail.comHsien-Chi Toby Liu /National Tsing Hua University ...
2018-06-24 23:25:27
1560
原创 数据矿工学习-情感分析框架DeepEmo论文简析
来自台湾国立清华大学的Elvis Saravia等研究人员提出了一种基于图论(graph-based)的机制来提取丰富情感(rich-emotion)的相关模式(pattern),用来加强对语料库的线上情感表达进行深入分析。论文实验结果表明,所提出的情感分析框架DeepEmo比目前大多数的情感分析框架的F1-score都要高(仅次于Volvoka(2016)),而且其提出的富集模式(enriche...
2018-06-20 15:18:40
1065
原创 数据矿工学习-《统计学习方法》思维导图6.2-最大熵模型与最优化算法
最大熵模型目前应用在NLP上比较多,本章的最大熵模型的内容与数学推导公式比较多(最优化算法部分本人水平有限(ˉ▽ˉ;)...,当时看的最优化算法时有点懵逼,可能会有疏漏,望各位海涵,欢迎提出修改意见)思维来自《统计学习方法》-李航凹脑图在线浏览地址:最大熵模型与最优化算法才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-06-06 17:04:50
547
原创 数据矿工学习-《统计学习方法》思维导图6.1-逻辑斯蒂回归模型
逻辑斯蒂回归模型是经典的分类学习器,在二分类的监督问题上分类效果非常好,其经典之处就在于LR的分布函数-sigmoid函数。思维来自《统计学习方法》-李航凹脑图在线浏览地址:逻辑斯蒂回归模型才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-06-06 16:56:33
568
原创 数据矿工学习-Python数据分析之pandas
前言前面一篇文章我们介绍了numpy,但numpy的特长并不是在于数据处理,而是在它能非常方便地实现科学计算,所以我们日常对数据进行处理时用的numpy情况并不是很多,我们需要处理的数据一般都是带有列标签和index索引的,而numpy并不支持这些,这时我们就需要pandas上场啦!PandasWHAT?Pandas是基于Numpy构建的库,在数据处理方面可以把它理解为numpy加强版,同时Pan...
2018-05-20 20:53:56
474
原创 数据矿工学习-Python数据分析之numpy
前言刚开始学习数据挖掘时,有时总是对numpy和pandas傻傻分不清楚,这个问题在训练模型阶段输入训练数据的时候最为明显,下面就来详细介绍下numpy和pandasNumpyWHAT?numpy是专门为科学计算设计的一个python扩展包,为python提供高效率的多维数组,也被称为面向阵列计算(array oriented computing),同时numpy也是github上的一个开源项目:...
2018-05-17 00:59:01
375
原创 数据矿工学习-Python特性之迭代器与生成器
迭代器要知道生成器是啥,首先得先了解下迭代器是什么,概念的部分还是用我最喜欢的老套路思维导图来表示:凹脑图在线浏览地址:迭代器仔细看完这份思维导图后,我们需要区分好两个概念可迭代对象(iterable)与迭代器(iterator)num = [0,1,2,3,4]for i in num: print(i)这里的列表num符合上面的条件之一:可以for循环,所以列表num可以称之为可迭代...
2018-05-09 21:08:58
263
原创 数据矿工学习-《统计学习方法》思维导图5.0-决策树
本章主要讲了决策树学习算法的三个部分:特征选择、树的生成方式和树的剪枝以及三种决策树算法:ID3、C4.5、CARTTips:决策树的东西比较多(这章啃了一个星期才啃完 (lll¬ω¬)),我们平时使用的Sklearn里面的决策树用的就是CART算法,所以这章的重点就在于CART的两种树模型(回归树、分类树),ID3和C4.5可作为了解。思维来自《统计学习方法》-李航凹脑图在线浏览地址:决策树才学...
2018-05-06 02:10:22
536
原创 数据矿工学习-《统计学习方法》思维导图4.0-朴素贝叶斯法
本章主要讲了生成学习方法-朴素贝叶斯法的详细生成方法 、 朴素贝叶斯的特点-条件独立性假设思维来自《统计学习方法》-李航凹脑图在线浏览地址:朴素贝叶斯思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-04-20 12:33:04
819
原创 数据矿工学习-《统计学习方法》思维导图3.0-K近邻法
本章主要讲了K近邻的算法、模型 以及kd树的构造与最近邻搜索。思维来自《统计学习方法》-李航凹脑图在线浏览地址:K近邻法思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-04-11 22:43:00
393
原创 数据矿工学习-《统计学习方法》思维导图2.0-感知机
本章主要讲了感知机的模型、策略以及算法的相关证明。思维来自《统计学习方法》-李航凹脑图在线浏览地址:感知机思维导图才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-04-01 02:13:01
564
原创 数据矿工学习-《统计学习方法》思维导图1.2-模型的评估与选择
《统计学习概论》第一章到这里就结束了,本思维导图主要讲的是模型的选择,模型的评估还有统计学习三大问题。思维来自《统计学习方法》-李航凹脑图在线浏览地址:模型评估与选择才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-03-25 22:53:52
364
原创 数据矿工学习-《统计学习方法》思维导图1.1-监督学习与统计学习三要素
监督学习概论 与 统计学习三要素思维来自《统计学习方法》-李航凹脑图在线浏览地址:统计学习三要素才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-03-25 16:20:52
441
原创 数据矿工学习-《统计学习方法》思维导图1.0-统计学习概论
改进了思维导图了,尽量简约为主,不过多延伸。思维来自《统计学习方法》-李航凹脑图在线浏览地址:统计学习方法概率才学疏浅,欢迎评论指导如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink...
2018-03-25 00:00:04
857
1
原创 数据矿工学习-python基础思维导图1.0
新车上路,难免疏漏,欢迎指出凹脑图在线浏览地址:python基础如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink
2018-03-20 21:30:45
225
原创 数据矿工学习-数据挖掘基本流程思维导图1.0
新车上路,难免疏漏,欢迎指出凹脑图在线浏览地址:数据挖掘基本流程如想更方便地阅览思维图欢迎前往我的个人小站:www.wengjj.ink
2018-03-19 11:09:54
747
c语言大作业 简易计算器
2016-03-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人