讲师:黄鸿波
讲师简介:
珠海金山办公软件有限公司(WPS)人工智能领域专家,高级算法工程师,拥有多年年软件开发经验,著有《TensorFlow进阶指南 基础、算法与应用》一书。曾在格力电器股份有限公司大数据中心担任人工智能领域专家,且在多家公司担任过高级工程师,技术经理,技术总监等职务。曾带领团队开发过基于人脸识别技术的智能支付系统、推荐系统、智能问答系统等。擅长数据挖掘、机器学习、移动开发等专业领域,并拥有丰富的实战经验。
分享大纲:
1. 文本分类实践中常见的误区:
1.1 深度模型一定优于传统的机器学习模型
1.2 在验证集上准确率高在线上准确率就高
1.3 准确率是文本分类中最重要的指标
1.4 越复杂的模型效果越好
2. 文本分类策略
2.1 选择合适的训练集和测试集
2.2 巧用词袋模型
3. 常用文本分类模型对比
3.1 机器学习算法对比
4.1.1 LR+词频
4.1.2