利用Stanford Parser进行中文行为抽取

最新推荐文章于 2024-04-24 22:50:14 发布

VIP文章 tzw_cs

最新推荐文章于 2024-04-24 22:50:14 发布

阅读量4.6k

点赞数

分类专栏： NLP 文章标签： NLP 信息抽取 java Stanford Parser

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tanzhangwen/article/details/8262047

版权

注：转载请注明出处twenz。欢迎大家交流探讨，指出错误，有什么好的建议方法也请给我留言。

利用Stanford Parser进行中文行为抽取(Action mining)

问题

所谓的行为抽取就是从开源文本中获取关于给定的某个人/组织的行为，主要包括主语、谓语和宾语。其中主语是给定的一些词表示了需要抽取的信息对象（人、组织或团体）。谓语和宾语则表示了行为。

例如，我们要抽取关于“塔利班”的行为，则给定句子“塔利班制造了这起爆炸。”的抽取结果为“塔利班：制造爆炸”。如果塔利班还有其他的别称（比如基地组织）或者我们有关于塔利班里面重要成员的可以代表塔利班行为的人等，则应把它们作为主语的行为也一并抽取出。

方法

这种关于行为抽取的显然是在句子层面上的工作，用统计机器学习方法可能效果不会很好（个人感觉）。

1.选择数据（数据源，如新闻等）

2.划分句子

3.筛选相关句子（找出含有识别对象的句子，直接匹配）

4.分词（把那些目标对象的词语加入到词典中，采用ICTCLAS）

5.语法分析（Stanford Parser)

6.抽取行为 (查找规律，利用规则匹配等方法，

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
利用Stanford Parser进行中文行为抽取

注：转载请注明出处twenz。欢迎大家交流探讨，指出错误，有什么好的建议方法也请给我留言。利用Stanford Parser进行中文行为抽取(Action mining)问题所谓的行为抽取就是从开源文本中获取关于给定的某个人/组织的行为，主要包括主语、谓语和宾语。其中主语是给定的一些词表示了需要抽取的信息对象（人、组织或团体）。谓语和宾语则表示了行为。例如，我们要抽取关于“塔利班”的行为，则给定句
复制链接

扫一扫

专栏目录

tzw_cs CSDN认证博客专家 CSDN认证企业博客

码龄15年

136: 原创

8万+: 周排名

62万+: 总排名

36万+: 访问

: 等级

4901: 积分

48: 粉丝

42: 获赞

37: 评论

221: 收藏

私信

关注

热门文章

分类专栏

acm/icpc 46篇
linux 7篇
c++/mfc 6篇
Software 9篇
DM 3篇
Java 12篇
c# 12篇
Python 9篇
NLP 7篇
Database 9篇
testing 15篇
Revision Control 1篇
selenium 12篇
Hadoop 10篇
Jenkins 1篇
Design Pattern 1篇

最新评论

Agent建模之Repast建模编程介绍
tzw_cs: 这个你可以去参考repast的官网 https://repast.github.io/index.html 使用文档： https://www2.econ.iastate.edu/tesfatsi/repastsg.htm
Agent建模之Repast建模编程介绍
weixin_46539086: 那您有没有相关代码内容的教程或者网址推荐，我最近参考的论文里只是讲背景、发展，不是很全面
Agent建模之Repast建模编程介绍
tzw_cs: 这是09年的文章了
Agent建模之Repast建模编程介绍
weixin_46539086: 您好，您文章中的链接我都打不开
C#爬取动态网页
tzw_cs: 这个多年没有维护所以不看了不好意思，估计你也不再需要了。回复给类似遇到这个问题的同学一个参考。像这种动态的比较麻烦一般都需要用js执行才能获取到。另外一种方便的办法是浏览器打开Inspect element 然后看Network，再在页面上点击然后看network的url。比如你这个就会有下面request,然后就用httprequest去发送来得到数据的response。还有一种办法是用webdriver之类的模拟人工的工具去点击然后再获取页面元素去解析。 URL: https://s8hwxkltn6.jiandaoyun.com/_/data/dash/list JSON: {appId: "5de0b3e85600ec0006f420f2", entryId: "5f48d400a25baa0006034c28",…} appId: "5de0b3e85600ec0006f420f2" entryId: "5f48d400a25baa0006034c28" filter: {cond: [], rel: "and"} fx_access_token: "5f48d400a25baa0006034c29" fx_access_type: "dash_public" hasCount: false isCountOnly: false limit: 20 skip: 80 sort: [] widgetId: "_widget_1598608578314"

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。