文本分类的应用现状:
- 垃圾邮件分类
- 情感分析
- 个性化推荐
- 舆情分析
- 影视评价
- 新闻主题
文本分类中的常见误区:
1. 深度模型一定由于传统的机器学习模型吗?
模型效果取决于训练数据集大小,算法,和样本的多样性:
- 数据集越大,越适合深度学习模型;
- 算法的设计会对结果产生直接影响;
- 模型的泛化
2. 在验证集上准确率高在线上准确率就高吗?
3. 准确率是文本分类中最重要的指标吗?
一般看准确率,召回率和预测效率,在实际应用中,预测效率往往是最重要的指标。
4. 越复杂的模型效果越好?
模型过于复杂可能会有过拟合。