自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Hudson的博客

NLP相关方向论文分享、题解、代码笔记等

  • 博客(29)
  • 收藏
  • 关注

原创 py2 & py3兼容性代码

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionfrom __future__ import unicode_literalsimport sysif sys.version_info[0] < 3: reload(sys) sys.setdefaultencoding('utf-8')编码问题from _

2020-05-19 09:52:46 288

原创 NLP算法-面试知识点总结

前言推荐参考书籍如下:推荐使用Typora打开,阅读效果更好《统计学习方法(第2版)》- 李航《Deep Learning》- Ian Goodfellow等《机器学习》- 周志华《百面机器学习》- 诸葛越等项目地址:https://github.com/laddie132/NLP-Interview博客:https://laddie132.github.io/2020/0...

2020-04-26 17:48:38 348

原创 ADB控制安卓WIFI连接(斐讯R1联网指南)

许多情况下,我们所调试的安卓设备并没有屏幕显示,或者阉割掉了系统设置模块,比如斐讯R1智能音箱。这时候,使用adb的wifi控制就显得尤为重要,基于在Github的adb-join-wifi项目,我们增加了802.1x的PEAP加密协议支持,并且引入了静态ip地址,以及删除网络配置等功能,修改后的项目地址为https://github.com/laddie132/adb-join-wifi使用...

2019-04-16 10:59:04 48235 14

原创 谷歌云平台免费搭建个人博客

目录谷歌云平台免费搭建个人博客方法一:虚拟机服务方法二:App EngineStep1:创建Cloud SQLStep2:创建WordPress项目Step3:部署至App Engine注意事项参考谷歌云平台免费搭建个人博客谷歌云平台(Google Cloud Platform,GCP)的$300体验政策对开发者真的是十分友好,网上有各种各样的无限试用教程,大家可以参考。基于此,本文介绍下如何...

2019-04-04 12:34:15 7437 3

原创 论文分享 - Reinforced Mnemonic Reader for Machine Comprehension

简介这篇论文发表时间比较近,比较全面地总结了match-LSTM、R-Net等众多前人模型的优缺点,并做了很好的改进,如:增加编码层能力,解决长距离上下文信息,提炼预测答案片段,直接优化评价函数等,在SQuAD数据库上取得了State-Of-Art的效果。前人的很多模型都具有一个共同的网络框架,即“encoder-interaction-pointer”。首先是将问题和段落的单词序列利用R

2018-01-25 12:01:46 1984 1

原创 论文分享 - R-Net: Machine Reading Comprehension with Self-Matching

介绍该文由MSRA发表,在SQuAD数据库上目前成绩最好。模型借鉴了Wang&Jiang最早的match-LSTM方法,做了一些改进,网络结构分为以下四部分:RNN网络分别对question和passage单独编码基于门限的注意力循环神经网络(gated-attention based recurrent network)匹配question和passage,获取问题的相关段落表示(q

2018-01-25 11:43:43 3200

原创 论文分享 - Machine Comprehension Using Match-LSTM and Answer Pointer

介绍在Machine Comprehension(MC)任务中,早期数据库规模小,主要使用pipeline的方法;后来随着深度学习的发展,2016年,一个比较大规模的数据库出现了,即SQuAD。该文是第一个在SQuAD数据库上测试的端到端神经网络模型。主要结构包括两部分:Match-LSTM和Pointer-Net,并针对Pointer-Net设计了两种使用方法,序列模型(Sequence M

2018-01-25 11:38:13 4441

原创 python中logging模块使用

在java中,我们常常使用log4j模块来集中处理日志,同样,在python中,有logging模块担任这一功能。级别在logging中,日志分为以下几个等级(从低到高):debuginfowarningerrorcritical最高等级是严重错误,最低等级就是调试信息了。在代码中可以直接进行不同level的调用,只不过需要在初始化程序的时候,控制logging模块需要

2018-01-25 11:31:09 234

原创 pytorch使用笔记

使用pytorch时,有一些值得注意的地方,记录如下:tensor和variabletensor表示张量:一般情况下,一维tensor叫向量,二维tensor叫矩阵,多维tensor叫张量variable表示变量:实际上,是一个tensor的高级封装,同时包含了梯度值,且同一个变量的梯度值是累计更新的,需要手动清零。默认设置requires_grad=Falseparameter表示...

2018-01-25 11:28:12 1457

翻译 论文分享 - Show and Tell: A Neural Image Caption Generator

介绍Image Caption是计算机视觉和自然语言处理相结合的一个任务,作者提出了一种基于神经网络的方法,将用于物体识别的cnn网络和用于机器翻译的lstm网络拼接起来,通过极大化正确描述的似然函数来训练这个网络。发表论文时,pascal数据集上bleu-1得分最高是25分,作者的模型可以到59分,人类水平大约是69分。该文主要是由于当时机器翻译模型的一些突破性进展,使用rnn模型的

2018-01-25 11:09:33 1172

原创 Spark程序主函数extends App与main

Spark程序主函数注意在scala程序中,主函数有两种启动方式:object Test extends App { //ToDo}object Test{ def main(args: Array[String]): Unit = { //ToDo }}其中第一种方法在Spark中不被兼容,可能会出现空指针异常,如下代码:object Test extends App{

2017-12-04 13:40:46 3908

原创 uva 12657 移动盒子

这道题目采用双向链表数据结构,用left[i]和right[i]分别表示编号为i的盒子左边和右边的盒子编号,对于不同指令变换为对left和right数组的操作。最后遍历一个数组即可。题目中细节操作较多,需要细心检查。。。#include#include#includeusing namespace std;#define MAXL 100010int right[MAXL],

2015-09-08 11:59:32 482

原创 UVA - 11988 Broken Keyboard (a.k.a. Beiju Text)

这道题目在算法竞赛入门经典中是作为链表题目来做的,其实解法还有很多,这里列出我的思路:把一串字符分成一个一个的单词,再把单词压入双端队列中,最后按顺序输出即可。#include#include#include#include#include#includeusing namespace std;deque d;void Insert(int sta,string& s)

2015-09-07 12:39:21 263

原创 UVA-230 图书管理系统

这道题目是考察stl模板库中map的使用,使用map类型保存每本图书的状态,根据不同输入指令实现状态变换即可。另外需要注意的就是对于各种字符串的处理,需要灵活使用各种string类函数。#include#include#include#include#include#includeusing namespace std;#define LEN 90#define MAXL

2015-09-06 11:07:50 493

原创 uva 11572 Unique Snowflakes

题目要求找到一个尽量长的连续序列,使得该序列中没有相同的元素。采用滚动窗口的方法解决非常方便。从左到右首先尽量延长right,right无法延长时再继续把left向右移动一个,然后重复以上过程,每次再取ans最大值即可。另外再判断重复时可采用数据结构,利用set集合十分方便。#include#include#include#include#include#includeusin

2015-08-20 16:55:24 360

原创 UVA 11054 Gergovia的酒交易

题目要求计算满足所有村庄供需所需要的最少劳动力。利用等价交换的算法设计方法将问题范围依次缩小,从而达到目的。(注意采用long long类型)#include#include#include#include#include#includeusing namespace std;#define maxn 100005int a[maxn];int main(){//

2015-08-20 16:21:06 359

原创 UVA -156 Ananagrams(反片语)

题目写的是找出,不能通过字母重排得到输入文本中其他单词的单词,并按字典序输出。 解决方法还是比较巧妙的,利用了c++中STL库的map数据结构来简化代码。具体如下:首先标准化每个输入的单词(即全部化为小写且字母按字典序排列),然后无重复存入map#include#include#include#include#include#include#includeusing names

2015-08-05 16:43:38 568

原创 uva 673 平衡的括号

这道题目要求判断括号是否平衡。由于是判断就很简单了,利用stl里面的stack栈,遇到‘(’或者‘[’就入栈,遇到']'或')'就比较出栈。(注意下可能输入空字符)  #include #include #include #include #include #include #define maxn 200using namespace std;int main(){

2015-06-07 19:24:52 393

原创 uva 10305 给任务排序

这是刘汝佳算法入门上的一道拓扑排序题目。拿来练练手,题目采用dfs对有向无环图进行排序。每找到一个数,人如果有比它大的就继续dfs递归,直到最大的数,然后开始逆序存储到topo数组里面。(特别注意题目有坑,m可以为0 呀!)   #include #include #include #include #define maxn 10000using namespace std;

2015-06-07 17:14:19 413

原创 uva 1626 括号序列

这道题目是刘汝佳算法入门中的一道动态规划题目。要求添加最少括号得到一个规则序列。先来看看它的状态转移,稍有复杂。  如果S是形如(S`)或[S`]的,就转移到d(S`)。  如果至少有两个字符,那么S可以分为A和B,转移到d(A)+d(B)。边界条件就是S为空是d(S)为0,S位单字符时d(S)=1。另外需要注意的就是不管S是否进行第一种转移,都要尝试第二种转移。 #inc

2015-06-07 15:55:06 429

原创 uva 12100 Printer Queue

这道题目也是一道简单的模拟题目,如果队列中存在比队首优先级高的元素,就把队首放到队尾,很简单。不过由于操作比较多,这里用数组来模拟实现队列,分别用fir和rear表示队首和队尾编号即可。#include #include #include #include using namespace std;int main(){// freopen("input.txt","r",

2015-06-06 16:30:55 453

原创 hdu 1003

做了一道hdu的水题,还是有点收获的,题目要求求出最大连续序列和。首先想到动态规划,可以这样来想,如果a[i]之前的sum大于零,就加上a[i],数据递增,更新暂时的终点为i;否则的话,sum=a[i],更新起点和终点为i。每计算一次sum就和ans比较,更新最终结果和最终起点终点。#include #include #include #include #define maxn 1

2015-06-06 14:23:23 368

原创 uva 1593 代码对齐

这道题目要求按照格式化输出文本,可能用stack数据结构会简单些,用max_h[2000]数组保存下每列最长单词长度就行,其他都很简单。(终于明白了ends原来与” “不一样呀,结果一直WA....)#include #include #include #include #include #include #define maxn 2000using namespace s

2015-06-04 23:26:46 607

原创 poj 3494 Largest Submatrix of All 1’s

这道题目大意是求一个0-1矩阵的最大全1子矩阵的元素个数,开始想着动态规划什么的,结果一筹莫展,看来某大神题解,终于明白原来是用单调栈的,思路大概这样:可以先计算出每个元素向上的最大伸展值,在利用单调栈分别计算该元素向左和向右最大伸展到的位置,最后遍历每个元素,计算得最大面积,也就是最大元素个数。下面贴上代码:#include #include #include #include

2015-05-31 23:36:21 402

原创 uva 116 Unidirectional TSP

中午闲来无事编一道水题,唉,还是好久不编了,好多变量名写混,结果一直调试不对。这道题目属于多阶段决策问题,题目是求多段图的最短路,还是动态规划,比较简单,用dp [i][j]表示从第i行j列这个点到最后一列的最短距离,然后从最后一列向前递推,每次找到相对优的策略时应保存当前决策便于打印路径,最后递推到第一列时,注意保存下开始位置和最短距离。(还是要细心再细心呀!)#include #in

2015-05-29 14:52:00 309

原创 uva 11400 Lighting System Design

这道题目也是一道经典的动态规划问题,可以先把灯泡按照电压从小到达排序,用d(i) 表示1~i中灯泡最低花费,状态转移就是d[i]=min(d[j]+(s[i]-s[j])*a[i].c+a[i].k),其中j>=0&&j一点点差错都不行呀。唉,开始估计手抖犯了傻逼错误。。。#include#include#include#includeusing namespace std;#d

2015-05-24 23:27:30 259

原创 UVA 1347 Tour(双调欧几里得旅行商问题)

这道题目要求遍历所有点,并且总长度最短,由于是双向的看起来貌似不好解决,不过可以换一种思维方式,既然是双向的,那么就可以看做是两个不同的人从起点沿不同路线走到终点,到这里很明显就是DP了,选择d(i,j)表示从1到i全部走过,且两人分别位于i,j(i>j),还需要到终点的最短距离,边界就是d(n-1,j)=dist(n-1,n)+dist(j,n);其中dist(i,j)表示i和j之间的距离。最后

2015-05-24 21:45:33 745

原创 uva 136 丑数

这道题目要求求第1500个丑数,方法可能很多,这里用stl库中的优先队列和set集合会很方便解决,对于优先队列使用是个很好的练习,大体思路是如果x是丑数,那么2x,3x,5x一定也是丑数,这样就可以从1 开始向下计算,判重的话就用set集合来判断。然后每次从队列中取出最小的数,当取到第1500次时跳出循环即可。#include#include#include#include#inc

2015-05-24 21:30:21 448

原创 uva12563 劲歌金曲

题目看起来是一道简单的0-1背包问题,不过还是挂了很多次。题目要求优先歌曲数目,其次是歌曲时间,采用双层动态规划结构就行,先判断歌曲数目最优,歌曲数目相同时就判断歌曲时间最优。 开始时用了二维数组,结果一直超时,两个全用了滚动数组就行了。另外有一点注意的就是索然题目说明t>=10^9,实际上t不会超过180n+678。 下面贴上代码#include#include#in

2015-05-24 21:09:04 716

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除