<p>带着一帮兄弟搭建一个舆情系统。在这里建立这个博客,主要是为了记录项目中的技术选型和具体实现。我们选用主流和成熟的技术,但是具体的实现和处理上可能会考虑欠周到,暴露出智商不足、经验不够、体力不支等问题。还望前辈、同辈如果有缘看到,能够多多指点。</p> <p>今天先记录一下项目的主要任务,下期再给出项目的架构规划和实现周期。</p> <p>我们期望能够从微博、微信,等sns站点,视频站点,网易、新浪等主流和非主流媒体站点抓取到热点趋势,搜集整理热门的文字、图片、音视频素材,挖掘文章涉及到了客户用户所关心的实体,并进一步识别这些资讯的类别、话题、倾向性等标签。</p> <p>后续,对舆情数据,按照标签维度,按照素材维度等多种不同维度进行统计和可视化展现。</p> <p>项目第一期的工期三个月,时间紧,人手紧:除了皮带越来越松,其他都越来越紧……</p>
转载于:https://my.oschina.net/u/2283449/blog/351648