自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 图片hdback

2020-01-31 18:28:40 142

原创 NLP-learning-5

Task 5 传统机器学习–朴素贝叶斯朴素贝叶斯的原理朴素贝叶斯应用场景朴素贝叶斯优缺点朴素贝叶斯 sklearn 参数学习利用朴素贝叶斯模型结合 Tf-idf 算法进行文本分类参考资料朴素贝叶斯1:sklearn:朴素贝叶斯(naïve beyes) - 专注计算机体系结构 - CSDN博客 (https://blog.csdn.net/u013710265/article/d...

2019-04-15 20:30:44 201

原创 NLP-learning-4

Task 4 文本表示TF-IDF原理。文本矩阵化,使用词袋模型,以TF-IDF特征值为权重。(可以使用Python中TfidfTransformer库)互信息的原理。使用第二步生成的特征矩阵,利用互信息进行特征筛选。参考资料文本挖掘预处理之TF-IDF:文本挖掘预处理之TF-IDF - 刘建平Pinard - 博客园 (https://www.cnblogs.com/pinard...

2019-04-13 20:09:28 116

原创 NLP-learning-3

Task 3 特征提取1. 基本文本处理技能1.1 分词的概念(分词的正向最大、逆向最大、双向最大匹配法);正向最大  如果叫成最长正向分词要更形象一些,是一种分治+贪婪的思想,并不一时处理全部串,而是分别处理预先设立长度的每一段,在每一段中求取最长的并且出现在字典里面的词。例如:abcdefabcdef,预先设立的最大长度为3。所以,先从串的开始截取长度为三的子串,即abcabc,如...

2019-04-11 21:08:55 154

原创 NLP-learning-2

**Task2**数据集下载探索模块:IMDB数据集(英文)和THUCNews数据集(中文)

2019-04-09 20:12:43 189

原创 NLP-learning-1

之前安装好了anacondapycharm util.py用了很久的Jupyter NotebookTensorflow安装时无法下载cuDNN,安装不了GPU版的

2019-04-07 16:44:54 73

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除