NLP
kkongyu
这个作者很懒,什么都没留下…
展开
-
FastText快速文本分类
FastTest架构 fastText 架构原理 fastText 方法包含三部分:模型架构、层次 Softmax 和 N-gram 特征 fastText 模型输入一个词的序列(一段文本或者一句话),输出这个词序列属于不同类别的概率。 序列中的词和词组组成特征向量,特征向量通过线性变换映射到中间层,中间层再映射到标签。 fastText 在预测标签时使用了非线性激活函数,但在中间层不...转载 2018-07-12 16:48:25 · 4163 阅读 · 0 评论 -
FastText实现新闻分类
对停用词进行分词 def makeStopWords(): with open('../../dataset/stopWords.txt', 'r', encoding='utf-8') as f: lines = f.readlines() stopWords = [] for line in lines: # 使用jieba分词: ...转载 2018-07-12 17:04:01 · 1692 阅读 · 5 评论