- 博客(13)
- 收藏
- 关注
原创 Python一些易错的点
1.int()、float()这些不是真正意义上的函数,而是创建对象的构造方法,也不是C++语言中的强制类型转换。2.Python函数中的可变参数有两种,一种是加*,一种是加上两个*,前者是解包元祖,后者是解包字典。传入的时候要注意使用*和**。def a(*arg): print(arg)if __name__ == "__main__": arg = ('a','b')...
2019-07-18 21:03:30
428
原创 文本摘要技术调研
文本摘要主要有两种实现方式:抽取式(extractive)和生成式(abstractive)。抽取式摘要从原文中选取关键词、关键句组成摘要。这种方法天然的在语法、句法上错误率低,保证了一定的效果。传统的抽取式摘要主要采用基于统计、基于图、聚类等方式完成无监督摘要。基于机器学习的方法主要将摘要作为一个二分类问题,通过对特征进行建模,判断一个句子是否属于摘要。基于神经网络的抽取式摘要往往将问题建模...
2019-07-11 15:05:07
403
原创 nlp中常见任务
1.POS(Part-Of-Speech tagging):即词性标注,为橘子中的没歌词都标上一个合适的词性,也就是我们要确定每个词是名词、动词、形容词或其他词性。例如:The representative put chairs on the table.(代表把椅子放在桌子上)AT(冠词)NN(单数或者物质名词)VBD(动词过去式)NNS(复数名词)IN(介词)AT(冠词)NN(单数或者...
2019-07-11 09:32:29
946
原创 标准化、归一化、中心化
标准化目标:均值为0,标准差为0z-score标准化:归一化目标:使得值集中到某个区间中,如[0,1]或者[-1,1]中心化目标:使得均值为0
2019-07-09 18:57:36
372
原创 geo试题标注及管理系统
1.安装Python2.72.安装django1.9、pymongo2.7.23.安装pylpt0.1.9.1,VCforPython27,下载lpt_datapython4.安装mongodb3.6.3,设置为服务5.启动项目6.目前缺失几个nlp的jar包...
2019-06-25 22:18:02
139
原创 git使用
git工作区、暂存区、本地仓库、远程仓库https://www.cnblogs.com/qdhxhz/p/9757390.htmlhttps://blog.csdn.net/u013374164/article/details/78644576git上传大文件失败https://blog.csdn.net/sinat_26227857/article/details/44037399...
2019-06-23 15:01:32
86
原创 Michael collins nlp课程笔记(四)MEMMS(Log-Linear Tagging Models)
目录 一、条件标注模型的定义 二、Trigram MEMMs2.1 模型定义 2.2 参数估计 2.3 解码pdf链接:http://www.cs.columbia.edu/~mcollins/fall2014-loglineartaggers.pdf一、条件标注模型的定义 二、Trigram MEMMs2.1 模型定义对我们所要建模的条件概率进行分...
2018-12-11 11:52:27
444
原创 Michael collins nlp课程笔记(三)Log-Linear Models
目录 一、Log-Linear提出的动机二、Log-Linear模型2.1 定义 2.2 特征的构造2.3 参数估计讲义链接:http://www.cs.columbia.edu/~mcollins/loglinear.pdf一、Log-Linear提出的动机在语言模型和标注问题中,马尔科夫模型和隐马尔科夫模型都做出了很强的条件独立性假设。例如,语言模型中假设了...
2018-12-10 22:08:18
798
原创 Michael collins nlp课程笔记(二)Tagging Problems, and Hidden Markov Models
目录 一、标注问题二、标注问题的生成模型2.1 问题的定义及转换2.2 隐马尔科夫模型2.3 三元隐马尔科夫模型的参数估计 2.4 模型的解码——维特比算法讲义链接:http://www.cs.columbia.edu/~mcollins/hmms-spring2013.pdf一、标注问题标注问题的任务是对于一个序列,给出其标记序列,也称为序列标记问题。nl...
2018-12-10 14:34:02
459
原创 Michael collins nlp课程笔记(一)语言模型Language Modeling
目录一、语言模型的定义和意义二、语言模型的马尔可夫模型2.1 定长句子下的马尔可夫模型2.2 变长句子下的马尔可夫模型 三、三元语言模型(Trigram Language Model)3.1 极大似然估计3.2 平滑估计3.2.1 线性插值(Linear Interpolation) 3.2.2 Discounting Methods讲义...
2018-12-09 22:13:47
1133
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人