利用NLTK+sklearn进行垃圾邮件分类
利用NLTK来进行数据处理和提取特征,再交由sklearn进行机器学习训练分类器,尝试了多个机器学习算法并评价分类性能。训练用数据集是:https://archive.ics.uci.edu/ml/datasets/sms+spam+collection ,可下载使用。也可以用自己的数据集,但一定要做成一个样本一行,每个样本先是标签spam/ham,空一格然后是邮件内容 的形式。上代码:...
TA关注的专栏 0
TA关注的收藏夹 0
TA关注的社区 3
TA参与的活动 0

『技术文档』写作方法征文挑战赛
在技术的浩瀚海洋中,一份优秀的技术文档宛如精准的航海图。它是知识传承的载体,是团队协作的桥梁,更是产品成功的幕后英雄。然而,打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼?是否纠结于文档结构与内容的完美融合?无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!


最近
文章
专栏
代码仓
资源
收藏
关注/订阅/互动
社区
帖子
问答
课程
视频
