机器学习
文章平均质量分 86
炒方便面
nlp算法工程师
展开
-
机器学习-特征选择-VC维的理解
vc维含义的个人理解在看斯坦福机器学习公开课的第10课特征选择中,Andrew Ng老师引入了VC维的概念,可能是字幕翻译不准确的原因,不是很理解,自己在网上查了一些资料,下面说说自己的理解。必要定义:分散(shatter):对于一个给定集合S={x1, … ,xd},如果一个假设类H能够实现集合S中所有元素的任意一种标记方式,则称H能够分散S。VC维:H的VC维表示为VC(H) ,指能够...原创 2019-03-22 17:43:43 · 2946 阅读 · 4 评论 -
机器学习实战中的杂知识
numpy.tile(a,(b,c))把矩阵a复制成(b,c)维的矩阵。例:a = [[1,2,3], [4,5,6]] b = numpy.tile(a,(2,1))b = [[1,2,3], [4,5,6], [1,2,3], [4,5,6]]列表/矩阵.sum()>>> from numpy impo...原创 2019-04-01 10:35:15 · 125 阅读 · 0 评论 -
决策树后剪枝——悲观剪枝(PEP)
悲观剪枝(PEP)把一颗子树(具有多个叶子节点)的分类用一个叶子节点来替代的话,误判率肯定是上升的(这是很显然的,同样的样本子集,如果用子树分类可以分成多个类,而用单颗叶子节点来分的话只能分成一个类,多个类肯定要准确一些)。于是我们需要把子树的误判计算加上一个经验性的惩罚因子。对于一颗叶子节点,它覆盖了N个样本,其中有E个错误,那么该叶子节点的错误率为(E+0.5)/N。这个0.5就是惩罚因子...原创 2019-04-06 10:34:11 · 5064 阅读 · 9 评论 -
隐马尔科夫模型(HMM)
隐马尔可夫模型的权威定义隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态序列称为状态序列(state sequence);每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列(observation sequence),序列的每一个位置又可以看作是一个时刻。(定...原创 2019-07-03 12:34:30 · 262 阅读 · 0 评论