事件检测
程勇uestc
电子科大
展开
-
事件检测进展(一)
一、改进方案 \quad因为之前存在聚类簇中信息不够干净,有噪声的情况,为解决这个问题,尝试采取将推文中实体词,“LOC”,“PER”,"ORG"和其他单词分别提取出来单独与已有的簇进行相似度的比较。具体方案为检测每条推文各类实体词有无的情况来赋予权值,如下: def tweet_cluster_similarity_with_four_vector(self, tweet_data, cl...原创 2019-07-18 13:09:54 · 3490 阅读 · 0 评论 -
事件检测进展(二)
\quad采用最大化相似度方差的方法来设置参数权重 实体权重 其他权重 相似度方差 原始方法 0.00513 0.1 0.9 0.00477 0.2 0.8 0.00412 0.3 0.7 0.00344 0.4 0.6 0.00289 0.5 0.5 0.00237 0.6 0.4 0.00195 0.7 0.3 0.00170 0.8 0.2 ..原创 2019-07-23 14:33:37 · 1263 阅读 · 0 评论