- 博客(13)
- 收藏
- 关注
转载 来自知乎的范数理解
以下分别列举常用的向量范数和矩阵范数的定义。向量范数1-范数: ,即向量元素绝对值之和,matlab调用函数norm(x, 1) 。2-范数:,Euclid范数(欧几里得范数,常用计算向量长度),即向量元素绝对值的平方和再开方,matlab调用函数norm(x, 2)。-范数:,即所有向量元素绝对值中的最大值,matlab调用函数norm(x, inf)。-范数:,即所有向量元素绝对值中的最小值,...
2018-04-30 17:29:31 1981
原创 过拟合讨论
过拟合就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差。过拟合原因:1 使用过于复杂的模型,2 数据噪声过大3 训练数据少降低过拟合方法:1 简化模型假设,或者使用惩罚项限制模型复杂度,或者减少神经网络隐藏层节点数2 进行数据清洗,减少噪声 (删除稀疏的特征)3 收集更多训练数据高斯核的使用增加模...
2018-04-09 11:24:55 814
原创 维特比算法Viterbi Algorithm
1、简介 维特比算法是一个特殊但应用最广的动态规划算法,它是针对篱笆网络的有向图(Lattice)的最短路径问题而提出的。凡是使用隐含马尔可夫模型描述的问题都可以用维特比算法来解码,包括今天的数字通信、语音识别、机器翻译、拼音转汉字、分词等。2、维特比算法的基础(1)如果概率最大的路径P(或叫最短路径)经过某个点,比如下图中的X22,那么这条路径上从起始点S到X22的这一段子路径Q,一定是S...
2018-04-07 18:23:23 1141
原创 隐马尔可夫模型(Hidden Markov Model)
隐马尔可夫模型(Hidden Markov Model)1、简介隐含马尔可夫模型一直被认为是解决大多数自然语言处理问题最为快速、有效的方法。2、马尔可夫假设随机过程中各个状态St的概率分布,只与它的前一个状态St-1有关,即P(St|S1,S2,S3,…,St-1) = P(St|St-1)。3、马尔可夫链 符合马尔可夫假设的随机过程称为马尔可夫过程,也称为马尔可夫链。在这个马尔可夫链中,四...
2018-04-07 18:18:07 814 1
原创 隐马尔可夫模型,最大熵马尔可夫模型和条件随机场的区别与联系
隐马尔可夫模型(Hidden Markov Model,HMM),最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)以及条件随机场(Conditional Random Field,CRF)是序列标注中最常用也是最基本的三个模型。HMM首先出现,MEMM其次,CRF最后。三个算法主要思想如下:•HMM模型是对转移概率和表现概率直接建模,统计共现概率。•ME...
2018-04-07 17:13:42 2543
原创 中文分词基本方法
词典法词典法分为:最大匹配法,最大概率法,最短路径法。最大匹配法是按照一定顺序选取字符串中的若干个字当做一个词,去词典中查找。根据扫描方式分为:1)正向最大匹配法(由左到右的方向);2)逆向最大匹配法(由右到左的方向);3)最少切分(使每一句中切出的词数最小);4)双向最大匹配法(进行由左到右、由右到左两次扫描)最大概率法:一句话可能包含多种分词结果,将其中概率最大的那个作为句子的分词结果。最短路...
2018-04-07 15:45:57 1148
原创 最大概率分词
2、以P(w)表示词条w的概率,假设已知P(南京)=0.8,P(市长)=0.6,P(江大桥)=0.4:P(南京市)=0.3,P(长江大桥)=0.5:如果假设前后两个词的出现是独立的,那么分词结果就是( ) A 南京市*长江*大桥 B 南京*市长*江大桥 C 南京市长*江大桥 D 南京市*长江大桥最大概率分词基本思想:一句话有多种切割方法,我们选择联合概率最大的结果。A = 0B= ...
2018-04-07 11:33:51 1452
原创 联合概率,条件概率,边缘概率的通俗理解
条件概率分布对于二维随机变量(X,Y),可以考虑在其中一个随机变量取得(可能的)固定值的条件下,另一随机变量的概率分布,这样得到的X或Y的概率分布叫做条件概率分布,简称条件分布。大俗话就是,事件A发生的时候,事件B也同时发生的概率。联合概率分布就是几个事件同时发生的概率边缘概率分布就是某个事件单独发生的概率具体计算公式参考下图...
2018-04-07 11:12:28 7528
原创 判别式模型与生成式模型的区别
判别式模型与生成式模型的区别产生式模型(Generative Model)与判别式模型(Discrimitive Model)是分类器常遇到的概念,它们的区别在于:对于输入x,类别标签y: 产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P(y|x)产生式模型可以根据贝叶斯公式得到判别式模型,但反过来不行。判别式模型常见的主要有: Logistic Regress...
2018-04-07 10:41:41 403
转载 python数据挖掘课程】二十一.朴素贝叶斯分类器详解及中文文本舆情分析
#2018-04-06 13:52:30 April Friday the 14 week, the 096 day SZ SSMRpython数据挖掘课程】二十一.朴素贝叶斯分类器详解及中文文本舆情分析 1.朴素贝叶斯数学原理知识 2.naive_bayes用法及简单案例 3.中文文本数据集预处理 4.朴素贝叶斯中文文本舆情分析朴素贝叶斯(Naive Bayesia...
2018-04-06 15:59:28 1070
转载 python数据挖掘笔记】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取
#2018-04-06 07:57:00 April Friday the 14 week, the 096 day SZ SSMRpython数据挖掘笔记】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取 1.KNN算法基础原理知识 2.最近邻分类算法分析预测坐标类型 3.Pandas读取TXT数据集 4.KNN分析平衡秤数据集 5.算法优化一...
2018-04-06 13:52:03 831
原创 python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析
#2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMRpython数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析 1.鸢尾花数据集可视化分析2.线性回归分析鸢尾花花瓣长度和宽度的关系3.决策树分析鸢尾花数据集4.Kmeans聚类分析鸢尾花数据集一. 鸢尾花数据集介绍本章采用Pyt...
2018-04-05 18:14:53 9437 1
转载 python数据挖掘笔记】十八.线性回归及多项式回归分析四个案例分享
python数据挖掘课程】十八.线性回归及多项式回归分析四个案例分享 #2018-03-30 18:24:56 March Friday the 13 week, the 089 day SZ SSMR 1.线性回归预测Pizza价格案例 2.线性回归分析波士顿房价案例 3.随机数据集一元线性回归分析和三维回归分析案例 4.Pizza数据集一元线性回归和多元线性回归分析...
2018-04-05 16:54:40 2103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人