echorma-CSDN博客

原创由LDA引发的概念总结

由LDA引发的概念总结学习资料：主题模型-LDA浅析【转载】TF-IDF简介 Latent semantic analysis-wiki 概率语言模型及其变形系列(1)-PLSA及EM算法 LDA和PLSA的区别 http://www.newsmth.net/nForum/#!article/AI/19410用来解决什么问题判断两个文档相似性以前怎么解决这个问题首先为了解决检索领域中

2017-10-10 00:55:44 293

原创聚类算法

聚类算法总结学习sklearn给出的几种聚类算法的原理和特点学习资料： sklearn官方文档 affinity propagation Meanshift，聚类算法 meanshift算法图解以及在图像聚类、目标跟踪中的应用 K-means原理把样本根据簇内等方差的条件分隔成n组不相交的子集，每个子集的中心以子集中的样本的均值表示。通过最小化组内方差选择中心。 ∑i=0nminμ

2017-10-09 21:13:03 527

原创决策树学习笔记

参考：《机器学习》–周志华 CART分类与回归树学习笔记经典算法详解–CART分类决策树、回归树和模型树模型结构这是基于树的结构进行决策，跟人类面临决策问题的处理机制一致。在面对一个决策问题时，要进行一系列的自决策，最终决策的结论对应了我所希望的判定结果。决策过程提出的每个判定问题属于对属性的测试，每个测试的结果要么导出最终结论，要么导出进一步的判定问题，其考虑范围是上一次属性判定的

2017-09-26 13:38:11 299

原创 “Parameter estimation for text analysis ”翻译

《Parameter estimation for text analysis 》翻译（待完善）最近因为需要了解LDA文章，阅读了《LDA数学八卦》，里面提到了这篇文章，感觉翻译一遍会理解得更透彻，但是文字功底不好，只能作粗浅的表述，欢迎指正建议~摘要：这篇文章展示利用离散概率分布的参数估计方法，跟文本建模非常相关。从极大似然开始，还会有贝叶斯后验估计，中心概念，如共轭分布，贝叶斯网络的先导内容。通

2017-09-18 01:31:40 1570 3

转载【转载】常用分词方法总结分析

最近对自然语言处理中常见任务的方法做了一下整理总结，并对不同方法做了一些对比分析，资料主要来源于网络以及相关的论文。1.中文分词中文句子是由字组成的连续字符串。为了理解中文语义，首先需要将句子划分为以词为基本单位的词串，这就是中文分词。词是最小的能够独立活动的有意义的语言成分，英文单词之间是以空格作为自然分界符的，而汉语是以字为基本的书写单位，词语之间没有明确的区分标记，因此中文分词是中文信息处理的

2017-09-06 21:40:00 932

原创线性模型学习笔记

线性模型学习笔记参考：《机器学习》–周志华《正态分布的前世今生》–靳志辉 http://blog.csdn.net/zouxy09/article/details/24971995/ http://blog.csdn.net/google19890102/article/details/27228279 https://en.wikipedia.org/wiki/Condition_n

2017-09-01 15:44:16 709

林轩田-机器学习基石--推荐阅读

林轩田的机器学习基石深入浅出地讲解机器学习理论与应用，这本书是其中的推荐课后阅读，是林轩田的导师写的

2017-09-03

正态分布前世今生高清无目录pdf

关于正态分布的出现过程，看完会对整个统计学体系多一些全局观，也了解了一些这个领域的领军人物的故事。作者根据时间线的发展和当时社会、科学背景，通俗易懂讲解了其发展史

2017-09-01

数学之美.pdf

《数学之美》是一本非常值得读的书，展示了吴军博士在他多年的科研经历中对科学问题的深入思考，而且通俗易懂，引人入胜。

2017-08-01

数据结构课程设计报告

哈夫曼编译器的数据结构课程设计，用java实现，比较简单

2014-12-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

u013032116的博客