舆情系统
张某人ER
学习IT的学生
展开
-
网络舆情分析技术 读书笔记1
针对网络舆情的研究主要集中在以下几个方面:网络舆情的基础理论研究,主要包括网络舆情的概念解析、网络舆情的主体特征、网络舆情的表现特征等;网络舆情的传播规律以及外部性研究,主要针对网络舆情的演化过程,及网络舆情的产生、发展、传播和消亡等阶段进行研究,以此对网络传播模型、网络重要节点及其链接关系做出分析和预测,如网络舆情的传播形态分析、网络舆情的传播路径分析、网络舆情的产生规律研究、网络舆情的原创 2015-11-23 16:53:14 · 4092 阅读 · 0 评论 -
网络舆情分析技术 读书笔记2
网络舆情的信息采集 网络舆情分析,广义上包括从网络舆情的信息采集开始到最后舆情信息服务这一系列流程,首先是从互联网上采集舆情信息,对采集得到的web页面进行信息预处理,在预处理的基础上进行关键信息的抽取,然后利用关键信息对舆情信息进行内容上的分析,最后将分析结果提供给用户。 网络信息自动采集一般分为数据抓取与数据存储两部分。 网络信息的分类及其抽取 网页内容的自动分原创 2015-11-26 11:02:28 · 2377 阅读 · 0 评论 -
TF-IDF及其算法
原文地址:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其转载 2015-12-15 08:50:30 · 1098 阅读 · 0 评论 -
Single-Pass聚类算法 及其在新事件探测中的应用
Single-pass算法的思想是:按一定顺序依次读取数据,每次读取的新数据都和已经读取并聚类的数据进行比较,如果按照一定规则找到相应的近似组别,则将这个新数据归入这个类中,如果没有,则将这个新数据视为一个新类。就这样反复执行,直到所有的数据都读完。整个过程只对数据进行一次读取(single)。 Single-Pass聚类算法在新事件探测中的应用将要检测的文档,原创 2015-12-18 14:52:04 · 14485 阅读 · 2 评论