NLP-learning
Kaiqi615
这个作者很懒,什么都没留下…
展开
-
NLP-learning-1
之前安装好了anaconda pycharm util.py 用了很久的Jupyter Notebook Tensorflow安装时无法下载cuDNN,安装不了GPU版的原创 2019-04-07 16:44:54 · 80 阅读 · 0 评论 -
NLP-learning-3
Task 3 特征提取 1. 基本文本处理技能 1.1 分词的概念(分词的正向最大、逆向最大、双向最大匹配法); 正向最大 如果叫成最长正向分词要更形象一些,是一种分治+贪婪的思想,并不一时处理全部串,而是分别处理预先设立长度的每一段,在每一段中求取最长的并且出现在字典里面的词。例如:abcdefabcdef,预先设立的最大长度为3。所以,先从串的开始截取长度为三的子串,即abcabc,如...原创 2019-04-11 21:08:55 · 164 阅读 · 0 评论 -
NLP-learning-5
Task 5 传统机器学习–朴素贝叶斯 朴素贝叶斯的原理 朴素贝叶斯应用场景 朴素贝叶斯优缺点 朴素贝叶斯 sklearn 参数学习 利用朴素贝叶斯模型结合 Tf-idf 算法进行文本分类 参考资料 朴素贝叶斯1:sklearn:朴素贝叶斯(naïve beyes) - 专注计算机体系结构 - CSDN博客 (https://blog.csdn.net/u013710265/article/d...原创 2019-04-15 20:30:44 · 208 阅读 · 0 评论 -
NLP-learning-2
** Task2 ** 数据集下载探索模块:IMDB数据集(英文)和THUCNews数据集(中文)原创 2019-04-09 20:12:43 · 198 阅读 · 0 评论 -
NLP-learning-4
Task 4 文本表示 TF-IDF原理。 文本矩阵化,使用词袋模型,以TF-IDF特征值为权重。(可以使用Python中TfidfTransformer库) 互信息的原理。 使用第二步生成的特征矩阵,利用互信息进行特征筛选。 参考资料 文本挖掘预处理之TF-IDF:文本挖掘预处理之TF-IDF - 刘建平Pinard - 博客园 (https://www.cnblogs.com/pinard...原创 2019-04-13 20:09:28 · 126 阅读 · 0 评论