新闻资讯数据集:多维情感,热点分析判断和关联词汇

数据集介绍:

本数据集包含约8000条新闻资讯,旨在为自然语言处理(NLP)和文本分析提供多维度的信息支持。每条记录包括标题、中文分词、拼音、英文翻译与分词、以及新闻的情感属性(积极、消极或中性)。

字段包括:

  • 标题:新闻的标题内容。
  • 类型:新闻的分类类型(例如:政治、经济、科技等)。
  • 中文分词:标题中的中文词汇分词结果,便于文本处理。
  • 拼音:标题中文字符的拼音表示。
  • 英文翻译:标题的英文翻译,便于跨语言处理。
  • 英文分词:英文翻译的分词结果。
  • 是否为热点:标明新闻是否为当前热点事件(如:是/否)。
  • 属性:情感属性标注(消极、积极或中性),指示新闻的情感倾向。
  • 关联词汇:与新闻标题相关的关键词汇,有助于识别新闻的主题或内容。

此外,数据集还标注了新闻是否为热点事件,并提供了相关联的关键词汇,适用于情感分析、热点新闻检测、跨语言翻译等研究和应用。

数据集读取:

数据集为.xlsx格式,方便使用pandas等库进行调用读取

新闻资讯数据集:多维情感,热点分析判断和关联词汇-数据集详情|下载-集智数据集 - 集智数据集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值