自然语言处理
huang_yx005
这个作者很懒,什么都没留下…
展开
-
汉字编码
转载https://www.cnblogs.com/straybirds/p/6392306.htmlGB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。GBK编码:1995转载 2017-11-30 16:19:54 · 310 阅读 · 0 评论 -
成分句法分析与依存句法分析
转载http://blog.csdn.net/flybirp07/article/details/44834853转载http://blog.csdn.net/u014422406/article/details/53954530句法分析 parse成分句法分析 constituency parse 把句子组织成短语的形式依存句法分析 dependency parse转载 2017-11-22 08:51:48 · 6410 阅读 · 0 评论 -
各国语言名称缩写
Codes for the Representation of Names of LanguagesCodes arranged alphabetically by alpha-3/ISO 639-2 CodeNote: ISO 639-2 is the alpha-3 code in Codes for the representation of names of languag转载 2018-02-01 21:14:43 · 579 阅读 · 0 评论 -
平行语料库
平行语料库:1.TED官网 Transcript栏目下有多种语言;https://www.ted.com/talks/jeanne_gang_buildings_that_blend_nature_and_city/transcript2.MultiUN联合国语料http://opus.nlpl.eu/MultiUN.php3.字幕 http://opus.nlpl.eu/OpenSubtitle...原创 2017-11-30 16:49:05 · 4894 阅读 · 2 评论 -
日本语NLP
各种日本语分词器综述:Mecab下载地址http://taku910.github.io/mecab/http://mecab.sourceforge.net/Mecab is open source tokenizer system for various language(if you have dictionary for it)See english docume...转载 2018-08-14 09:03:58 · 2703 阅读 · 0 评论 -
日本语语料库
来自《日语语料库建设的现状综述》上海外国语大学 毛文伟 2009年(1)EDR语料库(EDRコーパス)该语料库由日本电子化辞书研究所开发,并于1995年推出。素材选自新闻报道和杂志, 规模为 20 万句, 另有 10 万句左右的英语语料。在原始语料的基础上, 添加了句法信息, 是一个已赋码语料库。(http://www.iijnet.or.jp/edr/J_index.html)(2...转载 2018-08-14 09:40:24 · 15503 阅读 · 0 评论 -
pytorch
我们都知道Pytorch采用python语言接口来实现编程,而torch是采用lua语言,Lua是一个什么样的语言,可以这样说,Lua相当于一个小型加强版的C,支持类和面向对象,运行效率极高,与C语言结合“特别默契”,也就是说在Lua中使用C语言非常容易也很舒服。因此,torch是采用C语言作为底层,然后lua语言为接口的深度学习库。而Pytorch呢,Pytorch其实也是主要采用C语言为接...原创 2018-09-11 10:22:10 · 213 阅读 · 0 评论 -
syntactic与semantic
syntax 语法syntactic 句法,指的是语言的结构,简单说就是名词动词形容词等等不同词性的词应该按什么顺序在某一个语言里出现semantic 语义,指的是语言表达的意义结构正确的句子不一定有意义。The dog is a man.从syntax上来说,这句话没有错,主谓宾齐全而且各个成分的性和格也没错,但是语义上来说是错的。Colorless green idea...原创 2018-12-18 11:32:25 · 2321 阅读 · 0 评论