自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

夏栀的博客

个人网站已上线,欢迎访问关注:http://www.wjn1996.cn

  • 博客(7)
  • 资源 (11)
  • 问答 (1)
  • 收藏
  • 关注

原创 强化学习(一):概述

强化学习(一):概述前言:  最近,强化学习非常的火爆,不论在科研界还是工业界,强化学习一直作为一个新兴的领域,在计算机学科范畴内发挥重要的作用。强化学习(Reinforcement Learning),属于一种机器学习架构(范式)。我们知道机器学习一般分为监督和无监督,所谓监督即是否有外在的标准来约束样本,也就是所谓的标签;无监督则是没有标签的样本。强化学习之所以认为是机器学习的一种架构,是...

2020-02-29 14:59:13 6366

原创 Webdriver & PhantomJS使用cookie免重复登录

Webdriver & PhantomJS使用cookie免重复登录  最近在接手一个网络爬虫的任务,任务要求登录到某管理系统后台,并抓取数据。该后天相比传统系统不同之处在于其后台全部是由js实现响应,因此传统的爬虫技术束手就擒了,本文先介绍基于webdriver的模拟浏览器操作,以及借助phantomjs完成js触发。直接上代码:#第一次登录时,需要进行账号密码登录def log...

2020-02-23 11:24:16 1031

原创 论文解读:DTMT: A Novel Deep Transition Architecture for Neural Machine Translation

论文解读:DTMT: A Novel Deep Transition Architecture for Neural Machine Translation  本文为一篇神经机器翻译的文章,发表在2019AAAI会议上,主要提出一种深度转移网络(Deep Transition),结合多头注意力解决循环神经网络中同一层不同时刻之间shallow的问题。一、简要信息序号属性值...

2020-02-18 11:59:50 1106

原创 MyBatis基于注解数据库插入记录后返回自增编号

MyBatis基于注解数据库插入记录后返回自增编号  在使用SSM框架完成数据库新增记录任务时,经常遇到新增记录的主键是自增int类型,因此需要插入后立即获得其id再执行接下来的操作,下面给出一个亲测有效的方案:传统办法  如果是小型应用或单用户的程序,可以重新根据插入的记录执行一次查询操作,或直接执行"Select MAX(id)"。但这些办法十分不稳定,不适用。注解方式获得自增编号 ...

2020-02-17 16:10:10 984

原创 “夏栀的博客”网站一期建站通知贴

“夏栀的博客”网站一期建站通知贴  考虑到博主已在CSDN有满3年,期间已有原创文章超过70篇,粉丝数超过340位,访问量也逼近7万,已经具备建立个人博客网站的条件,经过思考决定将发起“夏栀的博客”网站一期建设项目。感谢各位博友对本博主的关注,简要说明如下:“夏栀的博客”网站属于个人博客网站,目前一期正在开发中,预计将于2020年3月1日正式上线,届时将会在CSDN以博文形式发布;“夏栀的...

2020-02-17 10:38:46 243

原创 论文解读:Semantic Neural Machine Translation using AMR

论文解读:Semantic Neural Machine Translation using AMR  机器翻译主要得益于语义表征能力,为了缓解数据的稀疏性,作者提出一种神经机器翻译方法,利用AMR(Abstract Meaning Representation)作为语义增强,结合LSTM进行端到端的学习。此模型较为简单,因此做简单介绍。一、相关背景  绝大多数的机器翻译工作中,通常使用RN...

2020-02-05 12:04:12 869

原创 论文解读:Selective Attention for Context-aware Neural Machine Translation

论文解读:Selective Attention for Context-aware Neural Machine Translation  当前诸多的神经机器翻译工作着力于句子级别(sentence-level)的sequence2sequence,很少考虑到整个文档级别(document-level)的上下文信息,本文作者Sameen Maruf、Andre F. T. Martins和Gh...

2020-02-02 14:48:42 1178 2

Movie Review.rar

免费提供NLP情感分析数据集Movie Review。Pytorch实现版本代码可详情:https://blog.csdn.net/qq_36426650/article/details/105172198

2020-04-25

NYT(New York Times)Dataset for Distant Supervision Relation Extraction

我们提供NYT数据集,该数据集一共包含233081实体对,由FreeBase对齐,关系数量为57(如果使用53关系的可自行过滤多余的关系及句子)。

2020-03-20

SemEval2010_task8_all_data.rar

关系抽取数据集,公开数据集,主要为监督学习方法。一共包含8000个训练句子、2717个测试句子,目前在测试集上最好结果f1值为89.5.

2019-11-24

数据结构图谱构建与关系抽取数据集.rar

本数据集主要提供对数据结构学科知识图谱的构建,主要包含500+数据结构方面的知识实体,9种关系,176000+示例,16000+实体对,已标注好3676个实体对关系。通过模型学习已标注的实体对来对未知实体对进行关系抽取,实现最终的图谱构建。 对应博客:https://blog.csdn.net/qq_36426650/article/details/87719204

2019-11-11

GWE中文词向量

使用GWE(中文字形特征提取)预训练词向量(1.6GB维基百科语料),维度为300,词汇量约13000,文件大小为41.2MB

2019-09-28

glove中文词向量

使用glove预训练词向量(1.6GB维基百科语料),维度为300,词汇量约13000,文件大小为41.2MB

2019-09-28

word2vec中文词向量

使用gensim对维基百科作为预训练语料(约1.6G语料),生成词汇量约13000个词汇,维度为300,文件大小为45.6MB。使用方法,参考博客:https://blog.csdn.net/qq_36426650/article/details/87738919

2019-09-28

自然语言处理数据集——初中数学学科

提供高中数学学科的知识数据集,包含6661个样本和706个实体,提供了基于该数据集的实体关系数据库(一共12种关系,11250个实体关系对)。该数据集可用于基于高中数学学科的知识图谱的构建,包含命名实体识别、实体关系抽取、文本分类等任务。

2019-02-19

自然语言处理数据集——高中数学学科

提供高中数学学科的知识数据集,包含2232个样本和2399个实体,提供了基于该数据集的实体关系数据库(一共12种关系,11250个实体关系对)。该数据集可用于基于高中数学学科的知识图谱的构建,包含命名实体识别、实体关系抽取、文本分类等任务。

2019-02-19

SSM框架整合jar包,还包括上传文件、JSTL、mysql、linux远程访问和ftp文件传输jar包

本人经常开发SSM框架的中小型系统,涉及到的jar包整合在一起,仅需导入这些jar包到lib目录下即可,无需东找西找。jar包包括Spring,SpringMVC,MyBatis,以及上传文件、mysql数据库,远程上传ftp等工具包

2018-11-20

《计算机操作系统》学习资料及实验

《计算机操作系统》课程学习资料,包括PPT,相应实验内容及源码,适合课程自学,期末复习,实验报告完成及考研或面试等

2018-11-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除