自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Mui的博客

攀爬NLP之峰

  • 博客(8)
  • 收藏
  • 关注

原创 自然语言处理 学习笔记(五)

个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(五)1.矢量语义(Vector Semantics)2. 信息抽取和命名实体抽取1.矢量语义(Vector Semantics)如果我们想让机器回答问题,或者让其了解并得到知识数据,也就是QA系统,是比检索更聪明的方法。语义学semant...

2019-01-01 16:29:30 471

翻译 自然语言处理 学习笔记(四)

个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(四)1. 信息检索2. 词汇-文本关联矩阵3.倒排索引(Inverted Index)2.1 倒排索引的结构1. 信息检索从文档中提取需要的信息info need步骤里,把我们想要的信息翻译为搜索框能够理解的形式query里翻译为搜索...

2018-12-25 17:05:15 764

翻译 自然语言处理 学习笔记(三)

个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(三)1.朴素贝叶斯和情感分类问题1.1 朴素贝叶斯1.朴素贝叶斯和情感分类问题本质上就是机器学习中的监督学习的分类方法,情感是否正向(0或1)就是我们所预测y^\hat{y}y^​等等等等1.1 朴素贝叶斯本文提到的是multinomi...

2018-12-19 15:36:38 343

原创 自然语言处理作业A2

自然语言处理 作业A2Unigram model1. Creating the word_to_index dictionary2. Building an MLE unigram modelBigram models3. Building an MLE bigram model4. Add-α smoothing the bigram modelUsing n-gram models5. Exp...

2018-12-15 19:54:21 528

翻译 自然语言处理 学习笔记(二)

个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(二)2.语言模型(language modeling)2.1.概率语言模型2.语言模型(language modeling)语言模型的任务是赋予句子一个概率,比如在机器翻译任务中,我们借由概率,选择一个"较好&quo

2018-12-15 19:48:09 581

原创 初探nlp 词频统计,去停顿词

一些简单且实用的python操作rainbow = open(r'C:\Users\Linsinan\Desktop\彩虹.txt')text = rainbow.read().split()text.count('the') # 词频计算words = set(text) # 不重复的元组数据len(words) # 有19657个不重复的单词'draw'[::-1] # 对一个单...

2018-12-04 01:02:17 715

原创 自然语言处理作业A1

作业地址任务1:把HTML格式转为JSON数据,再用python的JSON包,把JSON数据转为python能使用的数据结构(dicts, lists…)(chaos2json.py)Your implementation should have at least one regular expression (to extract the textual content of each...

2018-11-28 19:52:10 393

原创 自然语言处理 学习笔记(一)

个人学习nlp笔记:学习材料CS124、COSC572和《Speech and Language Processing》第三版自然语言处理 学习笔记(一)1.正则表达式和文本标准化1.1正则表达式1.2文本标准化(text normalization)1.2.1词语切分(word tokenization)插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左...

2018-11-28 19:25:13 778

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除