自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 基于神经网络的机器阅读理解综述学习笔记

基于神经网络的机器阅读理解综述学习笔记 一、机器阅读理解的任务定义 1、问题描述 机器阅读理解任务可以形式化成一个有监督的学习问题:给出三元组形式的训练数据(C,Q,A),其中,C 表示段落,Q 表示与之相关的问题,A 表示对应的答案。我们的目标是学习一个预测器 f,能够将相关段落 C 与问题 Q作为输入,返回一个对应的答案 A 作为输出: f:(C,Q)→A f:(C,Q)\rightarrow A f:(C,Q)→A 一般地,我们将段落表示为 C={w1C,w2C,w3C,…,wmC} ,将问题表示为

2020-11-13 16:21:30 893

原创 自然语言处理学习笔记(2)——二元语法与中文分词

自然语言处理学习笔记(2)——二元语法与中文分词 一、 语言模型 1. 语言模型 模型指的是对事物的数学抽象;语言模型(Language Model,LM)则指的是对语言模型的数学抽象。 定义语言模型:把句子表示为单词列表 w = w1w2…wk,每个wt,t∈[1,k] 都是一个单词,则: p(w)=p(w1w2⋯wk) p(w)=p(w_1w_2\cdots w_k) p(w)=p(w1​w2​⋯wk​) =p(w1∣w0)×p(w2∣w0w1)×⋯×p(wk+1∣w0w1w2⋯wk) =p(w

2020-11-10 19:22:49 1869

原创 自然语言处理学习笔记(1)——词典分词

自然语言处理学习笔记(1)——词典分词 一、相关定义(P32) 中文分词:将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于源文本。 词典分词:一个确定的查词与输出的规则系统,仅需要一部词典和一套查词典的规则,是最简单、最常见的分词算法(语言是时刻在发展变化的,任何词典都只是某个时间节点拍摄的一张快照)。 词的定义:在语言学上,词语是具备独立意义的最小单位。 二、切分算法 1. 完全切分(P36) 完全切分指的是:找出一段文本中的所有单词(并不是标准意义上的分词),不考虑效率的话,朴素的完全

2020-11-10 19:21:30 1812

原创 Python 3.8 安装HanLP最新教程(For Windows 用户)

Python 3.8 安装HanLP最新教程(For Windows 用户) 第一步:先安装JDK HanLP主项目采用Java开发,所以需要JDK或者JRE。 下载地址 注意:需要保证JDK位数、操作系统位数和Python位数一致,由于Python版本是3.8,所以安装的是jdk–8u271-windows-x64版本。 第二步:设置JAVA_HOME环境变量 鼠标右击***我的电脑->属性->高级系统设置->环境变量*** 在系统变量里新建JAVA_HOME变量,变量值为:C

2020-11-10 19:15:43 2585

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除