python新闻数据分析系统情感分析舆情分析可视化 Django框架 vue框架机器学习（源码+论文）✅

最新推荐文章于 2024-07-27 17:39:19 发布

q_3375686806

最新推荐文章于 2024-07-27 17:39:19 发布

阅读量1k

点赞数 23

分类专栏：毕业设计 biyesheji0002 biyesheji0001 文章标签： python django 机器学习大数据毕业设计新闻情感分析

本文链接：https://blog.csdn.net/q_3375686806/article/details/135515186

版权

biyesheji0002 同时被 3 个专栏收录

189 篇文章 80 订阅

订阅专栏

毕业设计

184 篇文章 45 订阅

订阅专栏

biyesheji0001

178 篇文章 9 订阅

订阅专栏

大数据毕业设计：Python招聘数据采集分析可视化系统✅

毕业设计：2023-2024年计算机专业毕业设计选题汇总（建议收藏）

毕业设计：2023-2024年最新最全计算机专业毕设选题推荐汇总

🍅感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。🍅

1、项目介绍

技术栈：
Python语言、django框架、 vue框架、 scrapy爬虫框架、 jieba分词、 nlp算法、爬虫抓取
机器学习、朴素贝叶斯算法、TextRank算法、情感分类、情感分析

2、项目界面

（1）新闻数据分析

在这里插入图片描述

（2）新闻详情页

在这里插入图片描述

（3）新闻数据浏览

在这里插入图片描述

（4）新闻词性分析

在这里插入图片描述

（5）后台管理

在这里插入图片描述

3、项目说明

功能：
新闻列表新闻详情新闻分类新闻搜索
新闻摘要抽取关键词分析情感分析朴素贝叶斯算法词性分析
新闻数据爬虫、爬虫新闻数据直接存储到数据库
后台新闻数据管理、用户管理

新闻数据爬取情感分析系统是一个基于Python语言和相关技术栈开发的系统。它主要包括以下功能：

新闻列表：展示新闻的标题、摘要和发布日期等信息。
新闻详情：点击新闻标题可以查看新闻的详细内容。
新闻分类：对新闻进行分类，使用户能够按照不同主题浏览新闻。
新闻搜索：用户可以通过关键词搜索新闻，快速找到感兴趣的内容。
新闻摘要抽取：通过TextRank算法对新闻内容进行摘要抽取，提供用户快速了解新闻的概要。
关键词分析：使用jieba分词工具对新闻内容进行分词，并提取关键词，帮助用户了解新闻的重点内容。
情感分析：使用nlp算法对新闻内容进行情感分析，判断新闻的情感倾向。
朴素贝叶斯算法：利用朴素贝叶斯算法进行新闻分类和情感分析。
词性分析：对新闻内容进行词性标注，帮助用户了解词语的语法属性。
新闻数据爬虫：使用scrapy爬虫框架对新闻网站进行数据抓取，获取最新的新闻数据。
爬虫抓取：将爬虫抓取到的新闻数据直接存储到数据库中，方便后续分析和展示。
后台新闻数据管理：提供后台管理界面，方便管理员对新闻数据进行管理和维护。
用户管理：提供用户管理功能，包括用户注册、登录、权限管理等。

通过以上功能，新闻数据爬取情感分析系统可以帮助用户快速浏览和搜索新闻，并提供关键词分析、情感分析等功能，帮助用户更好地理解和分析新闻内容。

4、核心代码


# -*- coding: utf-8 -*-
from __future__ import unicode_literals

from ..sim.bm25 import BM25


class TextRank(object):

    def __init__(self, docs):
        self.docs = docs
        self.bm25 = BM25(docs)
        self.D = len(docs)
        self.d = 0.85
        self.weight = []
        self.weight_sum = []
        self.vertex = []
        self.max_iter = 200
        self.min_diff = 0.001
        self.top = []

    def solve(self):
        for cnt, doc in enumerate(self.docs):
            scores = self.bm25.simall(doc)
            self.weight.append(scores)
            self.weight_sum.append(sum(scores)-scores[cnt])
            self.vertex.append(1.0)
        for _ in range(self.max_iter):
            m = []
            max_diff = 0
            for i in range(self.D):
                m.append(1-self.d)
                for j in range(self.D):
                    if j == i or self.weight_sum[j] == 0:
                        continue
                    m[-1] += (self.d*self.weight[j][i]
                              / self.weight_sum[j]*self.vertex[j])
                if abs(m[-1] - self.vertex[i]) > max_diff:
                    max_diff = abs(m[-1] - self.vertex[i])
            self.vertex = m
            if max_diff <= self.min_diff:
                break
        self.top = list(enumerate(self.vertex))
        self.top = sorted(self.top, key=lambda x: x[1], reverse=True)

    def top_index(self, limit):
        return list(map(lambda x: x[0], self.top))[:limit]

    def top(self, limit):
        return list(map(lambda x: self.docs[x[0]], self.top))


class KeywordTextRank(object):

    def __init__(self, docs):
        self.docs = docs
        self.words = {}
        self.vertex = {}
        self.d = 0.85
        self.max_iter = 200
        self.min_diff = 0.001
        self.top = []

    def solve(self):
        for doc in self.docs:
            que = []
            for word in doc:
                if word not in self.words:
                    self.words[word] = set()
                    self.vertex[word] = 1.0
                que.append(word)
                if len(que) > 5:
                    que.pop(0)
                for w1 in que:
                    for w2 in que:
                        if w1 == w2:
                            continue
                        self.words[w1].add(w2)
                        self.words[w2].add(w1)
        for _ in range(self.max_iter):
            m = {}
            max_diff = 0
            tmp = filter(lambda x: len(self.words[x[0]]) > 0,
                         self.vertex.items())
            tmp = sorted(tmp, key=lambda x: x[1] / len(self.words[x[0]]))
            for k, v in tmp:
                for j in self.words[k]:
                    if k == j:
                        continue
                    if j not in m:
                        m[j] = 1 - self.d
                    m[j] += (self.d / len(self.words[k]) * self.vertex[k])
            for k in self.vertex:
                if k in m and k in self.vertex:
                    if abs(m[k] - self.vertex[k]) > max_diff:
                        max_diff = abs(m[k] - self.vertex[k])
            self.vertex = m
            if max_diff <= self.min_diff:
                break
        self.top = list(self.vertex.items())
        self.top = sorted(self.top, key=lambda x: x[1], reverse=True)

    def top_index(self, limit):
        return list(map(lambda x: x[0], self.top))[:limit]

    def top(self, limit):
        return list(map(lambda x: self.docs[x[0]], self.top))