自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 MacOS升级Catalina后32位锐捷客户端排坑历程

天哪!升级一时爽…搞了一晚上,因为10.15.2全面摒弃32位应用,所以校园网锐捷首当其冲,连打开都没得机会…唉,都怪没有好好看升级警示,参考-—>https://support.apple.com/zh-cn/HT208436那看看网上都有神马解决方法吧。不删数据回退Mojave,GG,必须重装锐捷路由器,没钱且麻烦下一个替代客户端,如mentohust,年代久远...

2020-01-12 02:09:15 3210 12

原创 上下文无关文法到乔姆斯基范式的转换-CFG2CNF

在计算机科学中,一个形式文法是 Chomsky 范式的,当且仅当所有产生规则都有如下形式:A → BC 或A → α 或S → ε这里的 A, B 和 C 是非终结符,α 是终结符(表示常量值的符号),S 是开始符号,而 ε 是空串。还有,B 和 C 都不可以是开始符号。所有的 Chomsky 范式的文法都是上下文无关,反过来,所有上下文无关文法都可以有效的变换成等价的 Chomsky...

2018-11-26 19:23:45 9737

原创 基于CYK+PCFG的短语结构句法分析

1 概述句法分析是自然语言处理中的关键技术之一。其基本任务是确定句子的句法结构(syntatic structure)或句子中词汇之间的依存关系。形式语法理论的目的是试图用精确的数学模型(形式语言)来刻划自然语言。句法分析根据形式语法的不同可以分为基于短语结构语法的句法分析和基于依存关系语法的依存句法分析。本篇文章将介绍使用CKY(一种自底向上的动态规划算法)+PCFG(概率上下文无关文法)的基...

2018-11-25 23:08:05 9401 6

原创 基于特定语料库生成HMM转移概率分布和发射概率分布用于词性标注 Python

上篇文章我们以Brown语料库中的一个特例讲解了HMM和Viterbi算法。如何使用特定语料库通过HMM算法进行词性标注,我们可以从HMM的五元组入手。大致步骤:得到语料库中词性标注种类和个数==>得到隐序列;对输入的句子进行分词==>得到观测序列;对每个词性标注,计算该词性出现时的前一个词性的次数/该词性出现的总次数==>得到转移概率矩阵;对每个观测状态,计算该状态...

2018-11-17 19:51:59 6061 6

原创 基于HMM+Viterbi算法的词性标注 Python

1 概述隐含马尔可夫模型(HMM)被认为是解决大多数自然语言处理问题最快速、有效的方法; 20世纪70年代被应用在语音处理上,后被广泛应用在汉 语自动分词、词性标注、统计机器翻译等方面。 本次文章将介绍基于HMM和Viterbi算法进行词性标注。2 理论描述2.1 HMM五元组HMM是一个五元组(O,Q,O0O_0O0​,A,B):O:{o1o_1o1​…oto_tot​}是状态集合,...

2018-11-16 20:41:07 7262 5

原创 基于概率最大化的中文分词算法 Python

1 概述汉语自动分词是把没有明显分界标志的字串切分为词串。包括:标点符号、数字、数学符号、各种 标记、人名、地名、机构名等未登录词的识别。本篇博客使用Python编程语言实现基于概率最大化的中文分词算法。2 理论描述基于概率的自动分词算法(1)基本思想:选择概率最大的分词路径作为最优结果(2)利用字与字间、词与词间的同现频率作为分词的依据, 可以没有建立好的词典。需要大规模的训练文本, ...

2018-10-21 23:56:53 5054 5

原创 基于规则的双向最大匹配中文分词 Java

1 概述汉语自动分词是把没有明显分界标志的字串切分为词串。包括:标点符号、数字、数学符号、各种 标记、人名、地名、机构名等未登录词的识别。本篇博客使用Java编程语言实现基于规则的双向最大匹配算法,算是NLP里的一个hello world了。2 理论描述基于规则的自动分词算法(1) 事先人工建立好分词词典和分词规则库。(2) 原理为基于字符串匹配进行分词,这样就要 求有足够大的词表为依据...

2018-10-21 23:26:17 681

原创 斐波那契数列引发的思考 Kotlin

描述:编写程序并输出斐波那契数列前100项。斐波那契数列(Fibonacci sequence),又称黄金分割数列、因数学家列昂纳多·斐波那契(Leonardoda Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波纳契数列以如下被以递推的方法定义:F(1)=1,F(2)=1, F(n)=F(n-1...

2018-09-20 17:06:44 657

原创 Java环境配置-知其所以然

配置环境变量PATH是为了告诉系统[Java]命令在哪里,相当于在桌面快捷方式,如果不配置环境变量的话就要告诉它要执行命令的绝对路径,相当于打开我的电脑打开文件夹找到要的应用程序,显然是方式一比较方便。 解释一下你会产生疑问的地方: 分号; :windows下面环境变量的配置(各个目录之间用;隔开),环境变量不止Java一个,所以要有分割符,你可以理解为顿号java、python、XXX 英...

2018-09-17 21:28:41 214

原创 Kotlin学习笔记(二)流程控制语句

流程控制语句是编程语言中的核心之一。Kotlin的流程控制语句可分为: 分支语句(if 、 when) 循环语句(for、while )和 跳转语句 (return 、 break 、continue、throw)等。注意,Kotlin没有switch语句,但是可以用更强大的when语句替代。1 if表达式对于给定的if,else语句是可选的,else i...

2018-07-26 08:22:06 336

原创 Kotlin学习笔记(一) 基础语法简易笔记

最近开始重新梳理Android知识,作为Android世界的头等公民,Kotlin现在也越来越受开发者们的重视,很多大厂都将掌握Kotlin作为面试的加分项,因此,本人也开始了自己的Kotlin学习之旅。 Kotlin和Java两者的关系不一般,在学习过程中应该慢慢体会两者的差异,将其优缺点进行对比,接下来几篇博客将会对网上的学习教程进行简单的梳理,加深印象。包声明代码文件的开头一般...

2018-07-22 22:31:08 373

分区助手6.2—无损分区,无需格式化

分区助手6.2—无损分区,无需格式化,无需备份C盘或重装系统即可调整分区大小

2018-12-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除