python机器学习--文本分类三级项目总结

最新推荐文章于 2024-07-23 20:33:03 发布

欧阳渣儿

最新推荐文章于 2024-07-23 20:33:03 发布

阅读量536

点赞数

分类专栏：数据分析和机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45021488/article/details/116028526

版权

数据分析和机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

我们组的题目是中文新闻文本标题分类。我用的模型有多项式朴素贝叶斯、逻辑回归、SVM、岭回归、决策树、神经网络。就是一般的机器学习模型，都试了一试。最高分81.4。隔壁组用深度学习最高分88.8。但是冯老师说word分词的话能达到95，俺也不知道，俺还没试。
文本分类的一般步骤都是：数据预处理-分词-词向量特征提取-模型训练-预测
冯老师是干自然语言处理的，在他面前答辩，就跟小鸡仔一样···如果说用一般的机器学习模型，就要根据具体的题目寻找能够处理这个问题的模型，把模型的算法步骤用流程图展示，再自己改动一些算法，能够贴切的处理这个问题，调参只是其中的一小部分；如果用深度学习，可以进行调参工作。
机器学习模型，首先要仔细研究训练数据，写处理这个问题的算法，最后适当调参。如果套用模型或者模型不适用，效果会很不好。深度学习调参无可厚非。
模型：jieba分词、TF-IDF词向量特征提取、机器学习模型
套用模型的代码就两行，整个项目也没几行，我就不写了，等我研究一下模型原理和算法流程；还有深度学习的95···

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python机器学习--文本分类三级项目总结

我们组的题目是中文新闻文本标题分类。我用的模型有多项式朴素贝叶斯、逻辑回归、SVM、岭回归、决策树、神经网络。就是一般的机器学习模型，都试了一试。最高分81.4。隔壁组用深度学习最高分88.8。但是冯老师说word分词的话能达到95，俺也不知道，俺还没试。文本分类的一般步骤都是：数据预处理-分词-词向量特征提取-模型训练-预测冯老师是干自然语言处理的，在他面前答辩，就跟小鸡仔一样···如果说用一般的机器学习模型，就要根据具体的题目寻找能够处理这个问题的模型，把模型的算法步骤用流程图展示，再自己改动一些算
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。