自然语言处理
追梦不止,静心致远
谦谦君子,虚怀若谷
展开
-
欢迎使用CSDN-markdown编辑器
http://blog.csdn.net/pipisorry/article/details/51373090吉布斯采样算法详解为什么要用吉布斯采样通俗解释一下什么是sampling。sampling就是以一定的概率分布,看发生什么事件。举一个例子。甲只能E:吃饭、学习、打球,时间T:上午、下午、晚上,天气W:晴朗、刮风、下雨。现在要一个sample,这个sample可以是:打球+下午+晴朗。。。问转载 2017-02-17 13:18:18 · 604 阅读 · 0 评论 -
NLP︱LDA主题模型的应用难题
NLP︱LDA主题模型的应用难题 将LDA跟多元统计分析结合起来看,那么LDA中的主题就像词主成分,其把主成分-样本之间的关系说清楚了。多元学的时候聚类分为Q型聚类、R型聚类以及主成分分析。R型聚类、主成分分析针对变量,Q型聚类针对样本。 PCA主要将的是主成分-变量之间的关系,在文本中LDA也有同样的效果,将一撮词(变量)变成话题(主成分),同时通过画像主成分,可以知道人群喜欢什么样子转载 2017-03-23 21:13:15 · 4615 阅读 · 2 评论