- 博客(7)
- 资源 (7)
- 收藏
- 关注
原创 由LDA引发的概念总结
由LDA引发的概念总结学习资料: 主题模型-LDA浅析 【转载】TF-IDF简介 Latent semantic analysis-wiki 概率语言模型及其变形系列(1)-PLSA及EM算法 LDA和PLSA的区别 http://www.newsmth.net/nForum/#!article/AI/19410用来解决什么问题判断两个文档相似性以前怎么解决这个问题首先为了解决检索领域中
2017-10-10 00:55:44
293
原创 聚类算法
聚类算法总结学习sklearn给出的几种聚类算法的原理和特点学习资料: sklearn官方文档 affinity propagation Meanshift,聚类算法 meanshift算法图解以及在图像聚类、目标跟踪中的应用 K-means原理 把样本根据簇内等方差的条件分隔成n组不相交的子集,每个子集 的中心以子集中的样本的均值表示。通过最小化组内方差选择中心。 ∑i=0nminμ
2017-10-09 21:13:03
527
原创 决策树学习笔记
参考: 《机器学习》–周志华 CART分类与回归树 学习笔记 经典算法详解–CART分类决策树、回归树和模型树 模型结构这是基于树的结构进行决策,跟人类面临决策问题的处理机制一致。在面对一个决策问题时,要进行一系列的自决策,最终决策的结论对应了我所希望的判定结果。决策过程提出的每个判定问题属于对属性的测试,每个测试的结果要么导出最终结论,要么导出进一步的判定问题,其考虑范围是上一次属性判定的
2017-09-26 13:38:11
299
原创 “Parameter estimation for text analysis ”翻译
《Parameter estimation for text analysis 》翻译(待完善)最近因为需要了解LDA文章,阅读了《LDA数学八卦》,里面提到了这篇文章,感觉翻译一遍会理解得更透彻,但是文字功底不好,只能作粗浅的表述,欢迎指正建议~摘要:这篇文章展示利用离散概率分布的参数估计方法,跟文本建模非常相关。从极大似然开始,还会有贝叶斯后验估计,中心概念,如共轭分布,贝叶斯网络的先导内容。通
2017-09-18 01:31:40
1570
3
转载 【转载】常用分词方法总结分析
最近对自然语言处理中常见任务的方法做了一下整理总结,并对不同方法做了一些对比分析,资料主要来源于网络以及相关的论文。1.中文分词中文句子是由字组成的连续字符串。为了理解中文语义,首先需要将句子划分为以词为基本单位的词串,这就是中文分词。词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明确的区分标记,因此中文分词是中文信息处理的
2017-09-06 21:40:00
932
原创 线性模型学习笔记
线性模型学习笔记参考: 《机器学习》–周志华 《正态分布的前世今生》–靳志辉 http://blog.csdn.net/zouxy09/article/details/24971995/ http://blog.csdn.net/google19890102/article/details/27228279 https://en.wikipedia.org/wiki/Condition_n
2017-09-01 15:44:16
709
正态分布前世今生高清无目录pdf
2017-09-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人