中文垃圾短信数据集

一、数据集说明

rubbish_message_1: 招聘信息 (零时工、长工、兼职、家教等)
rubbish_message_2: 二手车推销信息 (包含汽车销售所推荐车辆信息、车险、车辆维修、车辆保养等)
rubbish_message_3: 服务业广告推送信息 (理发店、美容院、健身房、整容所、洗浴中心、保健中心等)
rubbish_message_4: 房地产推销信息
rubbish_message_5: 贷款诈骗
rubbish_message_6: 冒充银行扣款类、提供姓名及卡号转账诈骗
rubbish_message_7: 不安全的网址链接
rubbish_message_8: 冒充亲友诈骗
rubbish_message_9: 中奖诈骗

二、数据集类别统计

rubbish_message_1: 701条
rubbish_message_2: 420条
rubbish_message_3: 1368条
rubbish_message_4: 719条
rubbish_message_5: 2440条
rubbish_message_6: 1348条
rubbish_message_7: 78条
rubbish_message_8: 34条
rubbish_message_9: 225条

三、数据集样例展示

  • 7
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 39
    评论
### 回答1: 垃圾短信是指那些以推销商品、服务等为目的而不具有接收者意愿的非法短信,通常会给人们带来很大的打扰。为了对抗垃圾短信,一些机构开始收集垃圾短信数据集,以进行进一步的研究。 在这些垃圾短信数据集中,一些机构收集了大量的中文短信,这些短信通常存在于txt文件之中。通过对这些数据进行分析和处理,可以有效提高垃圾短信的过滤效果,从而减少人们受到垃圾短信带来的骚扰和损失。 同时,这些中文短信数据集的收集也为计算机语音合成、机器翻译等相关研究提供了数据支持,可以有效提高这些研究的实用性和有效性。 总之,垃圾短信中文短信数据集txt文件的收集和研究对于提高垃圾短信的过滤效果,以及为相关研究提供数据支持都起到了重要的作用,这些工作需要不断进行深入和完善。 ### 回答2: 垃圾短信中文短信数据集txt文件是一个包含大量垃圾短信文本的文本文件,其中的短信文本均为中文的。这个数据集可以用于训练和评估垃圾短信筛选的算法和模型。 该数据集的使用可以帮助开发人员更好地理解短信文本的特征和垃圾短信的类型,从而提高算法和模型的准确性和鲁棒性。此外,该数据集也可以用于研究垃圾短信的传播和产生方式,从而为垃圾短信的预防和打击提供有力支持。 需要注意的是,这种短信数据集的使用需要遵循相关的法律法规和伦理规范,不得用于非法用途。同时,对于数据集中可能包含的个人隐私信息,需严格保护和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 39
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值