- 博客(6)
- 收藏
- 关注
原创 NLP-learning-5
Task 5 传统机器学习–朴素贝叶斯朴素贝叶斯的原理朴素贝叶斯应用场景朴素贝叶斯优缺点朴素贝叶斯 sklearn 参数学习利用朴素贝叶斯模型结合 Tf-idf 算法进行文本分类参考资料朴素贝叶斯1:sklearn:朴素贝叶斯(naïve beyes) - 专注计算机体系结构 - CSDN博客 (https://blog.csdn.net/u013710265/article/d...
2019-04-15 20:30:44 201
原创 NLP-learning-4
Task 4 文本表示TF-IDF原理。文本矩阵化,使用词袋模型,以TF-IDF特征值为权重。(可以使用Python中TfidfTransformer库)互信息的原理。使用第二步生成的特征矩阵,利用互信息进行特征筛选。参考资料文本挖掘预处理之TF-IDF:文本挖掘预处理之TF-IDF - 刘建平Pinard - 博客园 (https://www.cnblogs.com/pinard...
2019-04-13 20:09:28 116
原创 NLP-learning-3
Task 3 特征提取1. 基本文本处理技能1.1 分词的概念(分词的正向最大、逆向最大、双向最大匹配法);正向最大 如果叫成最长正向分词要更形象一些,是一种分治+贪婪的思想,并不一时处理全部串,而是分别处理预先设立长度的每一段,在每一段中求取最长的并且出现在字典里面的词。例如:abcdefabcdef,预先设立的最大长度为3。所以,先从串的开始截取长度为三的子串,即abcabc,如...
2019-04-11 21:08:55 154
原创 NLP-learning-1
之前安装好了anacondapycharm util.py用了很久的Jupyter NotebookTensorflow安装时无法下载cuDNN,安装不了GPU版的
2019-04-07 16:44:54 73
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人