智能文本分类——三、特征工程与fasttext模型训练
学习目标:
掌握如何进行fasttext模型的特征工程以及训练过程, 并实现它们.标准化模型训练流程
进行fasttext模型的特征工程以及训练过程的七步诗
3.1 获取训练语料
获取训练语料过程的三步曲:
第一步: 明确原始数据来源.(1.网络爬虫;2.外部获取;3.内部提供,例如公司内容生产小组提供的各种类型的文章.)
第二步: 定义正负样本.(该类别文章句子作为正样本;其他类别文章句子作为负样本)
第三步: 提取正负样本语料.(先提取正样本语料,再在正样本基础上,提取正负样本语料..
原创
2020-06-27 02:41:36 ·
679 阅读 ·
0 评论