- 博客(8)
- 收藏
- 关注
原创 自然语言处理 学习笔记(五)
个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(五)1.矢量语义(Vector Semantics)2. 信息抽取和命名实体抽取1.矢量语义(Vector Semantics)如果我们想让机器回答问题,或者让其了解并得到知识数据,也就是QA系统,是比检索更聪明的方法。语义学semant...
2019-01-01 16:29:30
471
翻译 自然语言处理 学习笔记(四)
个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(四)1. 信息检索2. 词汇-文本关联矩阵3.倒排索引(Inverted Index)2.1 倒排索引的结构1. 信息检索从文档中提取需要的信息info need步骤里,把我们想要的信息翻译为搜索框能够理解的形式query里翻译为搜索...
2018-12-25 17:05:15
764
翻译 自然语言处理 学习笔记(三)
个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(三)1.朴素贝叶斯和情感分类问题1.1 朴素贝叶斯1.朴素贝叶斯和情感分类问题本质上就是机器学习中的监督学习的分类方法,情感是否正向(0或1)就是我们所预测y^\hat{y}y^等等等等1.1 朴素贝叶斯本文提到的是multinomi...
2018-12-19 15:36:38
343
原创 自然语言处理作业A2
自然语言处理 作业A2Unigram model1. Creating the word_to_index dictionary2. Building an MLE unigram modelBigram models3. Building an MLE bigram model4. Add-α smoothing the bigram modelUsing n-gram models5. Exp...
2018-12-15 19:54:21
528
翻译 自然语言处理 学习笔记(二)
个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(二)2.语言模型(language modeling)2.1.概率语言模型2.语言模型(language modeling)语言模型的任务是赋予句子一个概率,比如在机器翻译任务中,我们借由概率,选择一个"较好&quo
2018-12-15 19:48:09
581
原创 初探nlp 词频统计,去停顿词
一些简单且实用的python操作rainbow = open(r'C:\Users\Linsinan\Desktop\彩虹.txt')text = rainbow.read().split()text.count('the') # 词频计算words = set(text) # 不重复的元组数据len(words) # 有19657个不重复的单词'draw'[::-1] # 对一个单...
2018-12-04 01:02:17
715
原创 自然语言处理作业A1
作业地址任务1:把HTML格式转为JSON数据,再用python的JSON包,把JSON数据转为python能使用的数据结构(dicts, lists…)(chaos2json.py)Your implementation should have at least one regular expression (to extract the textual content of each...
2018-11-28 19:52:10
393
原创 自然语言处理 学习笔记(一)
个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(一)1.正则表达式和文本标准化1.1正则表达式1.2文本标准化(text normalization)1.2.1词语切分(word tokenization)插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左...
2018-11-28 19:25:13
778
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人