基于深度学习的疫情期间网民情绪识别项目详解

 目录

任务描述

数据集特点:

运行环境:

导包

 新建保存模型文集的路径

 设定学习率和预训练模型路径

 设定超参数

建立token 

清洗数据函数

计算F1值函数

数据生成器

模型定义

模型评价函数

bert 对抗训练 

模型训练调用

模型训练

数据集 

任务描述

根据微博中文内容进行情绪识别,主要包括有1(积极),0(中性)和-1(消极)

数据集特点:

1、个人微博,相比新闻,微博口语化比较重

2、文本中存在一些表情符(部分会导致乱码)

3、个人微博配图随意性很强(相关性弱)

4、仅针对和疫情相关的数据(疫情、生病等

运行环境:

                CUDA Toolkit: V10.0.130 
                Cudnn:7.6.2
                1 python 3.7.4 
                2 scikit-learn 0.21.3 
                3 pandas 0.23.4 
                4 numpy 1.16.5 
                5 keras 2.2.5 
                6 tensorflow-gpu 1.14.0 
                7 zhconv 1.4.0 
                8 tqdm 4.32.1 
                9 scipy 1.3.1 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 可以使用Excel中的筛选、排序、分列等功能对疫情期间微博情绪分类数据进行预处理。 首先,将数据导入Excel表格中,然后进行数据清洗,包括去除重复数据、清除无效数据等。接下来,根据需要对数据进行筛选、排序等操作,例如筛选出某个时间段内的数据、按照情绪进行排序等。同时,也可以使用Excel中的分列功能对数据进行分隔,例如将微博内容和情绪分类分开存储。 最后,将处理后的数据保存到Excel或者其他数据存储格式中,例如CSV、JSON等。可以使用Excel提供的导出功能将数据保存为CSV格式,方便后续的数据分析和处理。 ### 回答2: 在疫情期间情绪分类数据预处理是通过操作Excel表格实现的。首先,可以利用微博接口或者其他方式收集与疫情相关的微博数据,并将其导入Excel表格中进行存储和管理。 在数据预处理过程中,需要进行一系列的操作来清洗和整理数据。首先,可以去除重复的微博以及非相关的噪声数据,确保数据的准确性和完整性。接下来,可以进行分词处理,将微博内容进行拆分,以便后续的情绪分类分析。同时,还可以剔除停用词和标点符号,以减少对情绪分类的干扰。 在进行情绪分类前,需要对微博进行情感分析,识别出微博的情感倾向。可以使用一些自然语言处理的技术和算法,如情感词典、机器学习等方法来进行情感分析。通过对微博内容进行情感打分,可以将微博划分为积极、消极或中性等不同的情绪类别。 情绪分类完成后,可以将分类结果存储在Excel表格中。可以创建不同的工作表来分别存储积极、消极和中性情绪类别的微博数据,或者添加一个情绪分类的标签列来标记每条微博的情绪类别。同时,还可以添加其他相关的信息,如微博作者、发布时间等,以便后续的分析和利用。 总之,通过操作Excel表格来进行疫情期间微博情绪分类数据预处理,可以有效地收集、清洗和整理数据,并将分类结果进行存储和管理,为后续的情绪分析和研究提供基础数据。 ### 回答3: 疫情期间微博情绪分类数据预处理是一项重要的任务,通过操作Excel表格,可以实现相关数据的采集和存储。在进行数据预处理之前,首先需要收集微博情绪分类的相关数据。可以通过微博API接口或者爬虫等方式获取微博数据,将其保存为Excel表格的形式。 在导入Excel表格之后,需要对数据进行处理和清洗。首先,可以去掉重复的记录,排除掉可能的重复数据。其次,对于可能存在的缺失值,可以进行填充或删除,保证数据的完整性。针对文本数据,可以进行分词处理并去除停用词,以减少数据的噪声。还可以进行拼写纠错、关键词提取等处理,以获取更准确的情绪分类数据。 在数据预处理完成后,可以进行情绪分类的操作。可以使用机器学习算法,如朴素贝叶斯、支持向量机等进行情绪分类任务。通过将文本数据转化成数值型特征向量,训练分类模型,并利用该模型对未知数据进行情绪分类预测。分类结果可以通过Excel表格进行保存,记录分类标签和对应的微博内容。 最后,通过对经过预处理和分类的数据进行分析和挖掘,可以获取有关疫情期间微博情绪分类的一系列数据分析结果。这些分析结果可以帮助了解疫情期间情绪变化趋势、舆论倾向等信息,为舆情监控、社会心理研究等提供参考依据。 总之,通过操作Excel表格,我们可以实现疫情期间微博情绪分类数据预处理,采集和存储相关数据,为后续的分析和研究提供基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机毕设论文

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值