付费专栏:关于疫情期间微博网民情绪识别Python分析报告
数据集来源: DataFountain 举办的 疫情期间网民情绪识别
数据集下载:https://www.datafountain.cn/competitions/423
一、简单统计性描述
1.1 数据描述
2019新型冠状病毒(2019-nCoV)感染的肺炎疫情发生对人们生活生产的方方面面产生了重要影响,并引发国内舆论的广泛关注,众多网民参与疫情相关话题的讨论。
数据给定了用户微博ID和用户微博留言内容,标签数据为将微博留言内容归类为积极的、消极的还是中性的。此外,数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。微博内容包括了文本、图片、视频等内容。
本数据具体分为训练集(训练集部分有标签,部分无标签)和测试集: