- 博客(12)
- 资源 (3)
- 收藏
- 关注
原创 NLP(二十七)开放领域的三元组抽取的一次尝试
当我写下这篇文章的时候,我的内心是激动的,这是因为,自从去年6月份写了文章利用关系抽取构建知识图谱的一次尝试 后,我就一直在试图寻找一种在开放领域能够进行三元组抽取的办法,也有很多读者问过我这方面的问题,今天,笔者将给出答复,虽然不是正确答案(现在也没有正确答案),但至少,我写下了自己的答案。 离我想出这个抽取系统虽然才过去不久,但我的心情,已经由开始的激动狂喜,转化为后来的平淡,直到现在...
2020-03-21 20:08:57 4532 9
原创 NLP(二十六)限定领域的三元组抽取的一次尝试
本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。由于该比赛早已结束,笔者当时也没有参加这个比赛,因此没有测评成绩,我们也只能拿到训练集和验证集。但是,这并不耽误我们在这方面做实验。比赛介绍 该比赛的网址为:http://lic2019.ccf.org.cn/kg ,该比赛主要是从给定的句子中提取三元组,给定schema约束集合及句子sent,其中schema定...
2020-03-15 18:39:14 8438 39
原创 NLP(二十五)实现ALBERT+Bi-LSTM+CRF模型
在文章NLP(二十四)利用ALBERT实现命名实体识别中,笔者介绍了ALBERT+Bi-LSTM模型在命名实体识别方面的应用。 在本文中,笔者将介绍如何实现ALBERT+Bi-LSTM+CRF模型,以及在人民日报NER数据集和CLUENER数据集上的表现。 功能项目方面的介绍里面不再多介绍,笔者只介绍模型训练和模型预测部分的代码。项目方面的代码可以参考文章NLP(二十四)利用ALBER...
2020-03-12 21:49:02 11400 18
原创 NLP(二十三)序列标注算法评估模块seqeval的使用
在NLP中,序列标注算法是常见的深度学习模型,但是,对于序列标注算法的评估,我们真的熟悉吗? 在本文中,笔者将会序列标注算法的模型效果评估方法和seqeval的使用。序列标注算法的模型效果评估 在序列标注算法中,一般我们会形成如下的序列列表,如下:['O', 'O', 'B-MISC', 'I-MISC', 'B-MISC', 'I-MISC', 'O', 'B-PER', 'I-...
2020-03-10 23:32:41 6338 1
原创 知识图谱构建举例
笔者在去年的时候,给出了利用深度学习来构建知识图谱的一次尝试,文章为:利用关系抽取构建知识图谱的一次尝试 ,本文将会更出更多的例子,也是笔者近一个星期的忙碌结果。 下面为知识图谱构建的例子,由笔者原创,是从新闻或者小说中直接抽取而来,加上大量时间的人工整理而得到,下面的图片是从Neo4J导出并截图。 例子1:《平凡的世界》实体关系图(局部): 例子2:《白鹿原》实体关系图(局部)...
2020-03-05 22:20:04 14685 2
原创 NLP(二十二)利用ALBERT实现文本二分类
在文章NLP(二十)利用BERT实现文本二分类中,笔者介绍了如何使用BERT来实现文本二分类功能,以判别是否属于出访类事件为例子。但是呢,利用BERT在做模型预测的时候存在预测时间较长的问题。因此,我们考虑用新出来的预训练模型来加快模型预测速度。 本文将介绍如何利用ALBERT来实现文本二分类。关于ALBERT ALBERT的提出时间大约是在2019年10月,其第一作者为谷歌科学家蓝...
2020-03-05 16:01:31 9114
原创 一些有用的小工具
本文将介绍一些有用的小工具,它们能够帮助我们提高工作效率。本文将介绍笔者在近一周发现的三个小工具,写文章以做记录,希望能对大家有所帮助。 本文将介绍的三个小工具如下:在Sublime Text中支持Python运行;在Mac电脑的iTerm2中支持查看图片;Python的typing模块介绍。 详细内容介绍如下。在Sublime Text中支持Python运行 在平时工...
2020-03-30 20:27:57 399
原创 Numpy之数据保存与读取
在pandas使用的25个技巧中介绍了几个常用的Pandas的使用技巧,不少技巧在机器学习和深度学习方面很有用处。本文将会介绍Numpy在数据保存和读取方面的内容,这些在机器学习和深度学习方向也大有用处,因为通常我们会采用Numpy和Pandas处理数据,尤其是Pytorch,它和Numpy的结合更为紧密。 我们先介绍Numpy的几个函数:numpy.savez(file, *args,...
2020-03-14 16:07:20 1165
原创 TortoiseGit的首次使用
TortoiseGit 简称 tgit, 中文名海龟Git。TortoiseGit是一个开放的Git版本控制系统的源客户端,具有Git操作的图形用户界面(GUI)。TortoiseGit 支持Winxp/vista/win7/Win10,提供多言语支持。 本文将介绍如何使用TortoiseGit来管理Gitlab上的项目。 这里不再介绍如何安装Git和TortoiseGit。在笔者的W...
2020-03-14 14:46:14 1167
原创 Python之生成项目依赖包文件requirements.txt
我们在平时写Python工程项目的时候,常常需要生成第三方模块依赖包文件requirements.txt,用于声明该项目所需要的Python的第三方模块,同时也方便别人阅读。 为了能够方便快速地生成requirements.txt文件,我们可以借助Python的第三方模块:pipreqs,其官方网址为:https://github.com/bndr/pipreqs 。有了这个模块,我们就不...
2020-03-06 22:15:49 2093
pytorch入门+神经网络模型+实战项目
2023-03-18
Advanced model deployments with TensorFlow Serving Presentation.pdf
2021-02-25
Python爬虫系列之PhantomJS+Selenium+AutoIt.pptx
2018-03-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人