自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

山阴少年

微信公众号: NLP奇幻之旅(微信号为:easy_web_scrape)

  • 博客(12)
  • 资源 (3)
  • 收藏
  • 关注

原创 NLP(二十七)开放领域的三元组抽取的一次尝试

  当我写下这篇文章的时候,我的内心是激动的,这是因为,自从去年6月份写了文章利用关系抽取构建知识图谱的一次尝试 后,我就一直在试图寻找一种在开放领域能够进行三元组抽取的办法,也有很多读者问过我这方面的问题,今天,笔者将给出答复,虽然不是正确答案(现在也没有正确答案),但至少,我写下了自己的答案。  离我想出这个抽取系统虽然才过去不久,但我的心情,已经由开始的激动狂喜,转化为后来的平淡,直到现在...

2020-03-21 20:08:57 4532 9

原创 NLP(二十六)限定领域的三元组抽取的一次尝试

  本文将会介绍笔者在2019语言与智能技术竞赛的三元组抽取比赛方面的一次尝试。由于该比赛早已结束,笔者当时也没有参加这个比赛,因此没有测评成绩,我们也只能拿到训练集和验证集。但是,这并不耽误我们在这方面做实验。比赛介绍  该比赛的网址为:http://lic2019.ccf.org.cn/kg ,该比赛主要是从给定的句子中提取三元组,给定schema约束集合及句子sent,其中schema定...

2020-03-15 18:39:14 8438 39

原创 NLP(二十五)实现ALBERT+Bi-LSTM+CRF模型

  在文章NLP(二十四)利用ALBERT实现命名实体识别中,笔者介绍了ALBERT+Bi-LSTM模型在命名实体识别方面的应用。  在本文中,笔者将介绍如何实现ALBERT+Bi-LSTM+CRF模型,以及在人民日报NER数据集和CLUENER数据集上的表现。  功能项目方面的介绍里面不再多介绍,笔者只介绍模型训练和模型预测部分的代码。项目方面的代码可以参考文章NLP(二十四)利用ALBER...

2020-03-12 21:49:02 11400 18

原创 NLP(二十四)利用ALBERT实现命名实体识别

  本文将会介绍如何利用ALBERT来实现命名实体识别。

2020-03-11 22:56:44 8832 32

原创 NLP(二十三)序列标注算法评估模块seqeval的使用

  在NLP中,序列标注算法是常见的深度学习模型,但是,对于序列标注算法的评估,我们真的熟悉吗?  在本文中,笔者将会序列标注算法的模型效果评估方法和seqeval的使用。序列标注算法的模型效果评估  在序列标注算法中,一般我们会形成如下的序列列表,如下:['O', 'O', 'B-MISC', 'I-MISC', 'B-MISC', 'I-MISC', 'O', 'B-PER', 'I-...

2020-03-10 23:32:41 6338 1

原创 知识图谱构建举例

  笔者在去年的时候,给出了利用深度学习来构建知识图谱的一次尝试,文章为:利用关系抽取构建知识图谱的一次尝试 ,本文将会更出更多的例子,也是笔者近一个星期的忙碌结果。  下面为知识图谱构建的例子,由笔者原创,是从新闻或者小说中直接抽取而来,加上大量时间的人工整理而得到,下面的图片是从Neo4J导出并截图。  例子1:《平凡的世界》实体关系图(局部):  例子2:《白鹿原》实体关系图(局部)...

2020-03-05 22:20:04 14685 2

原创 NLP(二十二)利用ALBERT实现文本二分类

  在文章NLP(二十)利用BERT实现文本二分类中,笔者介绍了如何使用BERT来实现文本二分类功能,以判别是否属于出访类事件为例子。但是呢,利用BERT在做模型预测的时候存在预测时间较长的问题。因此,我们考虑用新出来的预训练模型来加快模型预测速度。  本文将介绍如何利用ALBERT来实现文本二分类。关于ALBERT  ALBERT的提出时间大约是在2019年10月,其第一作者为谷歌科学家蓝...

2020-03-05 16:01:31 9114

原创 一些有用的小工具

  本文将介绍一些有用的小工具,它们能够帮助我们提高工作效率。本文将介绍笔者在近一周发现的三个小工具,写文章以做记录,希望能对大家有所帮助。  本文将介绍的三个小工具如下:在Sublime Text中支持Python运行;在Mac电脑的iTerm2中支持查看图片;Python的typing模块介绍。  详细内容介绍如下。在Sublime Text中支持Python运行  在平时工...

2020-03-30 20:27:57 399

原创 Numpy之数据保存与读取

  在pandas使用的25个技巧中介绍了几个常用的Pandas的使用技巧,不少技巧在机器学习和深度学习方面很有用处。本文将会介绍Numpy在数据保存和读取方面的内容,这些在机器学习和深度学习方向也大有用处,因为通常我们会采用Numpy和Pandas处理数据,尤其是Pytorch,它和Numpy的结合更为紧密。  我们先介绍Numpy的几个函数:numpy.savez(file, *args,...

2020-03-14 16:07:20 1165

原创 TortoiseGit的首次使用

  TortoiseGit 简称 tgit, 中文名海龟Git。TortoiseGit是一个开放的Git版本控制系统的源客户端,具有Git操作的图形用户界面(GUI)。TortoiseGit 支持Winxp/vista/win7/Win10,提供多言语支持。  本文将介绍如何使用TortoiseGit来管理Gitlab上的项目。  这里不再介绍如何安装Git和TortoiseGit。在笔者的W...

2020-03-14 14:46:14 1167

原创 Python之生成项目依赖包文件requirements.txt

  我们在平时写Python工程项目的时候,常常需要生成第三方模块依赖包文件requirements.txt,用于声明该项目所需要的Python的第三方模块,同时也方便别人阅读。  为了能够方便快速地生成requirements.txt文件,我们可以借助Python的第三方模块:pipreqs,其官方网址为:https://github.com/bndr/pipreqs 。有了这个模块,我们就不...

2020-03-06 22:15:49 2093

原创 tqdm, pyyaml, traceback的使用

tqdmpyyamltraceback

2020-03-04 23:48:42 330

pytorch入门+神经网络模型+实战项目

本文档适用于PyTorch初学者。本文档介绍了PyTorch中的一些基本概念,介绍了线性归回模型、神经网络模型(MLP模型和CNN模型)及其在CV和NLP领域中的应用。 本文档结合笔者多年工作经验和博客文章,给出了丰富的实战项目例子,并附上Python实现代码,深入浅出,希望能给读者有所启发。

2023-03-18

Advanced model deployments with TensorFlow Serving Presentation.pdf

tensorflow/serving模型部署PDF

2021-02-25

Python爬虫系列之PhantomJS+Selenium+AutoIt.pptx

该PPT介绍了Python爬虫在爬取动态网页方面会用到的软件PhantomJS, Selenium, 以及AutoIt. 欢迎对爬虫有兴趣的童鞋进行下载哈,本人亲自制作的PPT~~

2018-03-04

Python 数据结构

Python 数据结构

2017-08-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除