来自麻省理工的信息抽取

最新推荐文章于 2024-03-15 11:40:26 发布

超人汪小建(seaboat)

最新推荐文章于 2024-03-15 11:40:26 发布

阅读量7.8k

点赞数 1

文章标签： MITIE 信息抽取命名实体识别 nlp dlib

本文链接：https://blog.csdn.net/wangyangzhizhou/article/details/78420817

版权

自然语言处理同时被 2 个专栏收录

37 篇文章 46 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

杂

340 篇文章 0 订阅

订阅专栏

MITIE

MITIE 即 MIT 的 NLP 团队发布的一个信息抽取库和工具。它是一款免费且先进的信息抽取工具，目前包含了命名实体抽取、二元关系检测功能，另外也提供了训练自定义抽取器和关系检测器的工具。

MITIE 是核心代码是使用 C++ 写的，建立在高性能的机器学习库 dlib 上。MIT 团队给我们提供了一些已训练好了的模型，这其中包含了英语、西班牙语和德语，这些模型都使用了大量的语料进行训练。我们发现并没有我们要的中文的模型，所以这个还得我们自己训练。

尽管 MITIE 是 C++ 写的，但它也提供了其他语言的调用 API 。在我自己的项目中常常会跟 Java 、 Python 混合用，所以只要编译成动态库再分别用 Java 和 Python 调用就行了，很方便。

为什么出现MITIE

看看 MIT 实验室的人怎么说就知道了。

I work at a lab and there are a lot of cool things about my job. In fact, I could go on all day about it, but in this post I want to talk about one thing in particular, which is that we recently got funded by the program to make an open source natural language processing library focused on information extraction.

Why make such a thing when there are already open source libraries out there for this (e.g. OpenNLP, NLTK, Stanford IE, etc.)? Well, if you lo

了解本专栏

超级会员免费看

超人汪小建(seaboat)

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
3
评论
来自麻省理工的信息抽取

MITIEMITIE 即 MIT 的 NLP 团队发布的一个信息抽取库和工具。它是一款免费且先进的信息抽取工具，目前包含了命名实体抽取、二元关系检测功能，另外也提供了训练自定义抽取器和关系检测器的工具。MITIE 是核心代码是使用 C++ 写的，建立在高性能的机器学习库 dlib 上。MIT 团队给我们提供了一些已训练好了的模型，这其中包含了英语、西班牙语和德语，这些模型都使用了大量的语料进行训练。
复制链接

扫一扫