笔记:语言模型(Language Model)(一)

笔记,总结纪录自《统计自然语言处理(第二版)(宗成庆)》语言模型(language model, LM)在自然语言处中,尤其是基于统计模型的语音识别、机器翻译、汉语自动分词、句法分析等相关研究中都有广泛的应用。其中最主要采用的是n元语法模型(n-gram),这种模型构建简单、直接,但因为数据缺乏需...

2017-11-25 16:26:17

阅读数 3616

评论数 1

[转]Ubuntu上安装CRF++

下载CRF++-0.58.tar.gz 解压缩:tar -zxvf CRF++-0.58.tar.gz2.cd到压缩包目录,安装执行:./configure

2017-11-17 14:51:39

阅读数 391

评论数 0

python爬虫(urllib简介)

urllib模块通过url打开任意资源,官方链接urllib模块提供一个高级接口,可以在通过url在网上获取数据。其中,urlopen()函数类似于内置函数open(),但接受的是url不是文件名。只能打开用于读取的url,不能任何查找操作。urllib.urlopen(url[, data[, ...

2017-11-14 17:31:02

阅读数 157

评论数 0

linux命令小记(grep、awk、sed)

grep grep 标准 egrep 扩展grep,支持基本和正则,执行效果与grep -E相似 fgrep 快速grep,允许查找字符串而不是一个模式 常用参数-c 只输出匹配的行的总数(count) -C 加参数num表示,显示匹配的行,及其前后num行 -d 当参数不是普通文件而是目录时...

2017-11-14 10:11:56

阅读数 1254

评论数 0

提示
确定要删除当前文章?
取消 删除