自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 主题模型的应用场景和可视化

1、微博数据蕴含着很多实况信息,通过爬虫等技术手段采集后,对内容的主题进行数据分析,从而得到大众的关注热点。如图1为基于主题模型得到的台风“莫兰蒂”相关微博数据进行主题分类后的统计图。在图1中,我们可以看到通过LDA模型得到的不同类别的微博数据的走势,作者将微博数据分为了“预警信息”、“无关信息”、“灾情和实况信息”和“救援信息”四类。通过不同信息数据的时间序列,可以快速把握事件发生的趋势。配合...

2019-10-19 18:05:03 1691 1

原创 主题模型 LDA 困惑度计算 的一些应用

主题模型被广泛的应用于文本挖掘当中,很多人用该模型结合对应的领域做文本数据分析,在新闻传播、灾害信息科学、地理信息科学、社会媒体热点监测、推荐系统等方面均有所应用。主题模型本身的数据原理十分繁杂,需要拥有一定的数学知识储备才能将其进行较好的梳理,关于数学原理的介绍有一大堆,我写这篇博客的目的,不是为了介绍背后的数据原理,而是想带着大家把这个模型的应用起来。以上是我的初衷,所以下面我将介绍LDA...

2019-09-26 23:15:28 1296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除