![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
信息抽取
风吹草地现牛羊的马
这个作者很懒,什么都没留下…
展开
-
实体抽取-将bio标签转为json文件的代码
【代码】实体抽取-将bio标签转为json文件的代码。原创 2023-02-12 19:14:47 · 2044 阅读 · 0 评论 -
BertTokenizer在处理中英文混合序列中遇到的问题
直接上代码:from transformers import BertTokenizerpath = '../PTM/bert-base-zh'tokenizer = BertTokenizer.from_pretrained(path)text_1 = '①Goodpasture综合征'text_2 = '1Goodpasture综合征'text_3 = '@Goodpasture综合征'text_4 = 'Goodpasture综合征'print(tokenizer.tokeni原创 2021-11-18 15:32:48 · 2485 阅读 · 0 评论 -
关系抽取(relation extraction)综述
关系抽取的定义关系抽取就是从一段文本中抽取出**(主体,关系,客体)**这样的三元组,用英文表示就是(subject, relation, object)这样的三元组。所以关系抽取,有的论文也叫作三元组抽取。从关系抽取的定义也可以看出,关系抽取主要做两件事:识别文本中的subject和object(实体识别任务)判断这两个实体属于哪种关系(关系分类)。例如,给出如下的句子:刘翔,1983年7月13日出生于上海,中国男子田径队110米栏运行员。我们可以抽取出实体关系三元组实例 (刘翔,出生地,上原创 2021-05-23 21:26:46 · 20780 阅读 · 2 评论