NLP
噜噜的小苹果
这个作者很懒,什么都没留下…
展开
-
达观杯文本竞赛项目--文本智能处理(date1)
达观杯文本竞赛竞赛描述任务规划Date1:读取数据、做数据预处理、划分训练数据读取数据 竞赛描述 competition link:link 任务简述:建立模型通过长文本数据正文,预测文本类型 任务规划 Date1:读取数据、做数据预处理、划分训练数据 读取数据 ...原创 2019-04-05 21:23:44 · 190 阅读 · 0 评论 -
达观杯数据竞赛项目--提取TF-IDF特征(Date2)
文章目录初识TF-IDF概念原理优缺点TF-IDF实现TF-IDF的python实现sklearn提取TF-IDF特征pickle 存储数据参考资料 任务要求:学习TF-IDF理论并实践,使用TF-IDF表示文本 初识TF-IDF 概念 TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Te...原创 2019-04-07 18:13:09 · 883 阅读 · 0 评论 -
达观杯数据竞赛 -- LR+SVM处理词向量特征
文章目录LR模型详解LR简介关于sigmoid 函数sigmoid函数LR为什么用sigmoid函数?关于损失函数处理非线性问题特征离散化LR处理TF-IDFLogisticRegression 参数详解LR实战SVM模型详解SVM简介SVM标准问题的推导线性可分数据近似线性可分数据非线性可分数据SVM处理TF-IDFSVM的几个重要概念sklearn.svm 函数SVM实战参考资料 LR模型详解...原创 2019-04-11 21:41:50 · 620 阅读 · 1 评论 -
达观杯数据竞赛项目--初识word2vec
初识词向量表示:word2vec CS224n 斯坦福NLP视频课程内容==》link 课程计划 词义(word meaning) 词义通常是通单词、短语等表示的想法;在语言学中,单词像是一种语言学符号,用于指代某些具体的物品。 在计算机中常用分类资源来处理词义,例如用WordNet来处理英语词语的分类,包括查询上义词和同义词等。wordnet作为一个资源词典固然很好,但仍存在一些问题,例如:...原创 2019-04-09 16:39:26 · 418 阅读 · 0 评论 -
吴恩达序列模型课程笔记(Week2)
上一周的课程主要讲解了一些经典的序列模型,例如RNN,GRU,LSTM等,这周的内容将包括NLP的一些概念讲解以及word embedding的内容,将NLP运用在序列模型中。 词汇表述 例如有一个词汇列表:V=[a,arron,…,zulu,],假设当前词汇列表长度为10000,可用1-hot 表述词汇,若Man这个单词在词汇表中排第5391个,那么Man可用[0,0,0,…,1,…,0,0] ...原创 2019-04-28 19:20:50 · 340 阅读 · 0 评论