NLP
文章平均质量分 68
taolusi
联系方式:taolusi@163.com,一般不太看评论,欢迎来信交流。
展开
-
ACE 2005 文件格式
由于做关系抽取要用到ACE 2005的语料,所以在此记录一下相关的信息,包括各个文件的内容和格式等,也方便初入门者可以更快地了解这个语料。ACE 2005数据集标注了基本任务:the recognition of entities, values, temporal expressions, relation and events。如果想了解更详细的关于ACE05评测的内容,可以看这里The AC...原创 2018-06-26 15:49:55 · 9733 阅读 · 39 评论 -
Constituent Parsing & Dependency Parsing 句法分析简介
转自:trayfour 由于博主前面在学习句法分析的时候发现,相关的学习资料少之又少,费了不少功夫收集和整理。所以写几个笔记记录一下。关于Parsing的一些基础知识:主要包括Parsing任务是干什么的,有什么作用,怎么做。 可以参考Christopher Manning的视频。以前在course上面有视频,现在得翻墙看 这是视频链接https://www.youtube....转载 2019-03-18 14:28:30 · 702 阅读 · 0 评论 -
概率检索模型之BIM和BM25F模型与TF-IDF模型
1. 概率排序原理以往的向量空间模型是将query和文档使用向量表示然后计算其内容相似性来进行相关性估计的,而概率检索模型是一种直接对用户需求进行相关性的建模方法,一个query进来,将所有的文档分为两类 – 相关文档、不相关文档,这样就转为了一个相关性的分类问题。对某个文档DDD来说,P(R|D)P(R|D)P(R|D)表示该文档属于相关文档的概率, 则P(NR|D)P(NR|...原创 2018-08-24 15:46:37 · 1947 阅读 · 0 评论 -
CMakeLists(LSTM-ER-master)
1 project(cnn) 2 cmake_minimum_required(VERSION 2.8 FATAL_ERROR) 3 4 set(CMAKE_MODULE_PATH ${PROJECT_SOURCE_DIR}/cmake) 5 set(CMAKE_CXX_FLAGS "-Wall -O2 -std=c++11 -g") 6 7 enable_testing()...原创 2018-06-29 17:32:00 · 155 阅读 · 0 评论 -
从README.md开始
Requirements*Fedora Core 22(基于Red Hat Linux)*clang++ 3.4(Linux 下常用的 C/C++ 编译器,了解一下,clang++的安装看这里)*boost 1.57(拓展的C++程序库,了解一下,boost的安装看这里)*yaml-cpp 0.5.1(C++下yaml的解析包,yaml了解一下,yaml-cpp了解一下,yaml-...原创 2018-06-29 17:33:00 · 200 阅读 · 0 评论 -
各种预训练的词向量(Pretrained Word Embeddings)
转自:SevenBlueEnglish Corpusword2vecPre-trained vectors trained on part of Google News dataset (about 100 billion words). The model contains 300-dimensional vectors for 3 million words and phrases...转载 2018-07-01 10:43:00 · 5782 阅读 · 0 评论 -
CMakeLists(LSTM-ER-master/cnn/cnn)
1 # ########## cnn library ########## 2 # Sources: 3 set(cnn_library_SRCS 4 cnn.cc 5 conv.cc 6 deep-lstm.cc 7 dict.cc 8 dim.cc 9 exec.cc 10 expr.cc 11 ...原创 2018-07-01 15:26:00 · 300 阅读 · 0 评论 -
CMakeLists(LSTM-ER-master/relation)
1 PROJECT(cnn:relation)2 CMAKE_MINIMUM_REQUIRED(VERSION 2.8)3 4 ADD_EXECUTABLE(RelationExtraction RelationExtraction.cpp Document.cpp Parameter.cpp RelLstmModel.cpp Table.cpp cnn/deptreelstm.cc cn...原创 2018-07-01 15:36:00 · 114 阅读 · 0 评论 -
Greedy search与beam search
最近在看End-to-end Relation Extraction using LSTMs on Sequences and Tree Structures这篇文章时,看到此文在Entity detection中用到了greedy search与beam search。内容转自:https://github.com/fengdu78/deeplearning_ai_books (黄海广为Andr...转载 2018-07-17 09:47:28 · 3953 阅读 · 0 评论 -
NLP Framework开源方案梳理
转自:EddyLiu2017 写在最前面在这个日新月异的信息时代,海量数据的积累,计算能力的不断提升,机器学习尤其是深度学习的蓬勃发展,使得人工智能技术在不同领域焕发出蓬勃的活力。自己经历了嵌入式开发,移动互联网开发,目前从事自然语言处理算法开发工作。从工程软件开发到自然语言处理算法开发,希望通过这个系列的文章,能够由浅入深,通俗易懂的介绍自然语言处理的领域知识,分享自...转载 2019-03-13 15:05:19 · 972 阅读 · 0 评论