- 博客(11)
- 资源 (15)
- 收藏
- 关注
原创 NLP通常包括两个关键问题
NLP通常包括两个关键问题:1.选择什么样的语言模型?2.选择什么样的分类算法?第二个问题是机器学习领域的标准问题,各种针对不同数据类型、数据分布的算法和技巧,这里不再赘述。而在NLP当中,语言模型更加重要一些。不同语言模型的区别,也就是对文本提取特征的不同。常用的模型有:1.Bag-of-words:最原始的特征集,一个单词/分词就是一个特征。往往一个数据集就会有上万个特征;
2017-02-27 20:14:04 706
原创 贝叶斯分类器的简单理解
贝叶斯分类器贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。也就是说,贝叶斯分类器是最小错误率意义上的优化。目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN。训练和所有监督算法一样,贝叶斯分类
2017-02-27 16:58:11 4273 1
原创 朴素贝叶斯算法
设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i根据贝叶斯定理由于P(X)对于所有类为常数,最大化后验概率P(Ci|X)可转化为最大化先验概率P
2017-02-27 14:00:18 574
原创 支持向量机SVM推导及求解过程
支持向量机是属于原创性、非组合的具有明显直观几何意义的分类算法,具有较高的准确率。 使用SVM算法的思路:(1)简单情况,线性可分情况,把问题转化为一个凸优化问题,可以用拉格朗日乘子法简化,然后用既有的算法解决;(2)复杂情况,线性不可分,用核函数将样本投射到高维空间,使其变成线性可分的情形,利用核函数来减少高纬度计算量。 一、SVM相关基本概念
2017-02-23 15:21:52 759
原创 svm的简单理解
SVM是一种训练机器学习的算法,可以用于解决分类和回归问题,同时还使用了一种称之为kernel trick的技术进行数据的转换,然后再根据这些转换信息,在可能的输出之中找到一个最优的边界。简单来说,就是做一些非常复杂的数据转换工作,然后根据预定义的标签或者输出进而计算出如何分离用户的数据。
2017-02-22 16:25:25 2103
原创 使用apt-get和nvm安装node的区别
初识 apt-get 和 nvmapt-get是什么在各个平台都有相关的包管理工具,比如 ubuntu 下面有 apt-get,centos 下面有 yum,mac 下面有 brew 等,它们都是安装软件的非常方便的利器,主要用于自动从互联网的软件仓库中搜索、安装、升级、卸载软件或操作系统如何使用 apt-get 安装 node$ sudo apt-get
2017-02-05 16:01:31 979
转载 人工智能之机器学习路线图
1. 引言也许你和这个叫『机器学习』的家伙一点也不熟,但是你举起iphone手机拍照的时候,早已习惯它帮你框出人脸;也自然而然点开今日头条推给你的新闻;也习惯逛淘宝点了找相似之后货比三家;亦或喜闻乐见微软的年龄识别网站结果刷爆朋友圈。恩,这些功能的核心算法就是机器学习领域的内容。套用一下大神们对机器学习的定义,机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,
2017-02-04 11:13:59 323
原创 如何学习深度学习
Q1:深度学习看上去很复杂,对于新手应该怎么去学,能不能推荐一些深度学习方面的书籍和流行的框架?A1:深度学习的数学理论其实并不复杂,但是需要注意的细节太多了,我们需要大量的时间来消化理解各个概念,对于新手,我推荐先上手代码,再研究原理,目前的深度学习框架非常之多,包括TensorFlow, theano, lasagne, keras, sknn, no learn, caffe, mx
2017-02-03 16:17:37 918
转载 人工智能、机器学习和深度学习三者的关系与应用
有人说,人工智能(AI)是未来,人工智能是科幻,人工智能也是我们日常生活中的一部分。这些评价可以说都是正确的,就看你指的是哪一种人工智能。今年早些时候,Google DeepMind的AlphaGo打败了韩国的围棋大师李世九段。在媒体描述DeepMind胜利的时候,将人工智能(AI)、机器学习(machine learning)和深度学习(deep learning)都用上了。这三者在Al
2017-02-03 10:24:43 1781
原创 什么是机器学习
- 1+1等于几 ?- 50- 傻x,多了- 1+2等于几?- 20- 傻x,多了- 3+4等于几- 7- 傻x,对了- 6+9等于几- 13- 傻x,少了很多很多次以后……- 2+2等于几- 4- 4+5等于几- 9这就是机器学习,准确来说是最常见的一种,监督学习。最开始的几步是对于模型的训练
2017-02-02 16:55:22 262
cdlinux配置教程和配置软件下载
2016-02-29
C#贪吃蛇(非常强悍的C#贪吃蛇游戏,你一定不会后悔的)
2011-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人