山东大学舆情分析系统项目结题总结

最新推荐文章于 2023-07-06 16:37:50 发布

山东大学與情分析系统项目博客

最新推荐文章于 2023-07-06 16:37:50 发布

阅读量1.2k

点赞数 5

文章标签： python django vue mysql 自然语言处理

本文链接：https://blog.csdn.net/m0_55760388/article/details/117743843

版权

项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端（1）启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

摘要由CSDN通过智能技术生成

一、项目背景

对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

二、技术要点

在本项目中，我们主要选用python语言。

在爬虫方面，我们采用Scrapy爬虫框架，首先对上述若干带有搜索引擎的入口网站进行一级爬取，该层主要爬取网页中以“山东大学”为关键字的搜索结果
在这里插入图片描述
其次将对一级爬取中获得的网页链接进行二级爬取，该层主要爬取相关页面中的“相关推荐”、评论等内容。

对于大部分网站中常见的反爬虫技术，我们采用了请求头随机UA、资源延时下载、cookie保存状态等来掩盖我们的爬虫，防止其被反爬虫技术识别。

在分词方面，我们采用的是python的pkuseg库，并加入了我们自己生成的停用词词库、保留词词典等，以进一步优化分词结果。在情感分析方面，我们使用词的情感倾向表，通过各个词的权值对热词、评论进行情感分析。

在网页展示方面，我们采用了Vue的前端和Django的后端，以便能与爬虫和分词模块更好的兼容。

三、功能介绍

1、服务器端

（1）启动服务器

我们的项目是在python的虚拟环境中运行，目前运行过程已经可以脱离编译器。因此我们首先进入python虚拟环境，进入django项目目录下，输入：

python manage.py runserver 0.0.0.0:8080

最低0.47元/天解锁文章

山东大学與情分析系统项目博客

关注

5
点赞
踩
36

收藏

觉得还不错? 一键收藏
4
评论
山东大学舆情分析系统项目结题总结

项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端（1）启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。
复制链接

扫一扫