垃圾评论分类

该博客介绍了如何对垃圾评论进行分类,包括数据特征准备,如使用词典将评论转换为one hot向量,接着利用Spark的朴素贝叶斯进行训练,再在测试集上预测并评估模型的精准率、召回率和AUC值,最后讨论了模型参数调优的方法。
摘要由CSDN通过智能技术生成

一、数据特征准备

1选取汉语词典(包含常用词,姓名等) -> one hot 向量
2选取停用词词典 ->去除停用词的影响
3选取同义词词典 ->增加表达多词同意的能力
4选取比较长的固定搭配词典,比如成语,乐队名字等,增加分词正确率

通过以上词典将每一句评论转换成one hot 向量,作为训练数据与测试验证数据集

二、spark 训练
使用spark的朴素贝叶斯训练数据

import sparl.mllib.classification.NaiveBayes
NBmodel = NaiveBayes.train(train_data)

三、在测试集上预测

result = NBmodel.predict(test_data)

四、评估模型

非垃圾评论 被识别为非垃圾 被识别为垃圾
35000 34800 200
垃圾评论 被识别为垃圾 被识别为非垃圾
10000 8300 1700

非垃圾识别精准率:

P=3480035000
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
很高兴为您介绍垃圾分类网页的设计及实现,以下是我个人的建议: 1. 界面设计 垃圾分类网页的界面应该简洁、明了、清晰,并使用清新的配色。可以使用大量的图标、图片和简单的文字来传达信息。可以使用不同的颜色或图标来区分不同的垃圾类型。 2. 垃圾分类信息 网页上应该提供丰富的垃圾分类信息,包括垃圾分类的定义、分类标准、分类方法、垃圾处理方法等等。另外,网页上也可以提供一些有用的垃圾分类小贴士,如如何正确地分类垃圾、如何减少垃圾污染等等。 3. 搜索功能 网页上应该设有搜索功能,方便用户快速查找垃圾分类信息。搜索框应该设在页面的显眼位置,便于用户操作。 4. 交互功能 网页上也应该提供一些交互功能,如用户可以上传照片或描述,让系统帮助判断垃圾类型。用户也可以评论或分享自己的垃圾分类经验。 5. 响应式设计 垃圾分类网页应该具有响应式设计,可以适应不同终端设备的屏幕大小、分辨率和操作方式。这样,用户可以在任何设备上访问和使用网页,享受垃圾分类的便利。 实现方案: 1. 开发语言 可以使用HTML、CSS和JavaScript等前端开发语言进行开发,后端可以使用PHP、Python或Java等语言实现。 2. 数据库 可以使用MySQL或MongoDB等数据库技术存储用户上传的照片和描述信息等。 3. 垃圾分类算法 可以使用深度学习等算法来实现垃圾分类功能,例如使用卷积神经网络分类图像数据。 4. 服务器 可以使用云服务器或自己的服务器来部署网页应用程序,提供用户访问服务。 5. 安全性 要保证用户上传的信息安全可靠,可以使用HTTPS协议进行数据传输,使用验证码等技术防止恶意攻击。 总之,垃圾分类网页的设计及实现需要考虑多个方面,包括界面设计、功能实现、安全性等等,希望我的建议能够对您有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值