- 博客(62)
- 资源 (1)
- 收藏
- 关注
原创 命名实体识别系列(三)NER实体词典的获取与使用
一些网站会直接提供实体词典,如搜狗词典; 可以从结构化/半结构化数据中挖掘实体词典,例如百度百科、医学网站的Link等等; 从文本中挖掘。用户可能提供一些非标准化表达,这时候就需要用到新词挖掘技术,可以参考美团搜索的新词挖掘技术:...
2021-03-03 20:48:08 2872 3
原创 命名实体识别系列(二)NER技术选型
实际工作中往往不是直接训练某个NER模型,而是要先根据当前NER任务的特点进行技术选型,通常NER的识别技术为:规则抽取、实体词典匹配和模型预测基于规则的实体抽取:有些实体具有很强的模板(规则)性质,所以可以通过人工简单的配置一些模板规则就可以获得高准确率的实体抽取结果。例如结构化/半结构化数据中的实体抽取、利用某些特殊符号如书名号等等。 基于实体词典匹配的实体识别:实体词典是一种常用的资源,可以通过离线挖掘不断拓展。不断增加的新实体对实现高准确率、高覆盖率的NER带来了很大挑战,通过实体词典匹配的方
2021-03-01 19:47:31 689
原创 命名实体识别系列(一)NER任务介绍
命名实体识别系列(一)NER任务介绍前言博主为某校研究生,目前研二,经历过两段NER工作的实习,也投了一篇NER相关的论文。准备在今年(2021)开一个关于NER的系列博客,分专题由浅入深地从实践需求和学术论文等方面对NER做一个体系梳理。因个人能力和水平有限,并非该领域的资深专家,难免有不少疏漏和不妥甚至错误之处,恳请同行批评指正。注:以边学边做,边学边写的方法,对某些问题的理解会出现变化,因此所有文章都可能会随时更新调整。命名实体识别任务Q1:什么是命名实体识别?首先需要对任务的相关
2021-02-26 19:46:25 4490 1
原创 【关系抽取】Tensorflow实现基于Attention的PCNN以及ResCNN等(1)
本科毕业设计就是做关系抽取,准备采用远程监督数据集NYT数据集,使用Tensorflow实现几篇经典的论文,以及做一些改进和创新,本系列博客记录毕设全过程。经典PCNN论文:http://www.aclweb.org/anthology/D15-1203ResCNN论文:https://arxiv.org/pdf/1707.08866.pdf注意本ResCNN模型没有结合Attenti...
2019-03-19 16:42:07 3623 3
原创 Stanford CoreNLP结合Pyhton使用
详细参考https://blog.csdn.net/qq_35203425/article/details/80451243主要说一下Stanford CoreNLP工具可以处理分词、词性标注、句法分析等等功能,不需要下载那一堆分开的jar包,比如https://blog.csdn.net/zkq_1986/article/details/81583725里面提到的那一堆至于是否需要添...
2019-03-15 20:43:47 955 3
原创 HMM在手写字符分割中的应用
论文《非限制手写字符分割中相关技术与算法的研究》利用HMM对分割问题建模,寻找分割路径的问题转换成寻找最大概率状态序列的问题。模型如图,以字符宽度H长的方格作为单元,一行作为一层,从第一层到最后一层作为一个时序序列T(第一层t1,第二层t2...),一行中n个方格单元为n个状态,于是,寻找路径路径的问题转换为寻找最大可能的状态序列问题。隐状态就是n个不同的状态,观测状态也是这n...
2018-11-21 11:10:29 593 1
原创 【物体检测】物体检测相关与RCNN系列
现在开始讨论物体检测。还是从博客及论文开始大量学习。1.https://www.cnblogs.com/love6tao/p/7351952.html《一篇文章看懂物体检测的发展脉络》计算机视觉:第一个层次是图像分类、物体检测、语义分割第二个层次是3D重建第三个层次是视觉问答物体检测典型思路:确定目标位置+置信度分类确定目标位置方法:滑动窗口穷举遍历;启发式方法,region proposal m...
2018-06-23 12:55:42 474
原创 【日期类】Day of week
题目描述:We now use the Gregorian style of dating in Russia. The leap years are years with number divisible by 4 but not divisible by 100, or divisible by 400.For example, years 2004, 2180 and 2400 are le...
2018-06-22 16:16:41 526
原创 【栈】简易计算器
题目描述: 读入一个只包含 +, -, *, / 的非负整数计算表达式,计算该表达式的值。输入: 测试输入包含若干测试用例,每个测试用例占一行,每行不超过200个字符,整数和运算符之间用一个空格分隔。没有非法表达式。当一行中只有0时输入结束,相应的结果不要输出。输出: 对每个测试用例输出1行,即该表达式的值,精确到小数点后2位。样例输入:1 + 24 + 2 * 5 - 7 /...
2018-06-22 12:01:41 1437
原创 【日期类】日期差值
题目描述: 有两个日期,求两个日期之间的天数,如果 两个日期是连续的我们规定他们之间的天数为两天。 输入: 有多组数据,每组数据有两行,分别表示两个日期,形式为YYYYMMDD。 输出: 每组数据输出一行,即日期差值。 样例输入: 20110412 20110422 样例输出: 11日期类问题是常考的基本题型之一,需要好好关注练习。本题和代码参考《机试指南》求两个日期差,或者计算某个特定的日期是那...
2018-06-22 10:25:40 406
原创 【并查集】HDOJ 1856 More is better
DescriptionMr Wang wants some boys to help him with a project. Because the project is rather complex, the more boys come, the better it will be. Of course there are certain requirements. Mr Wang selec...
2018-06-14 14:46:08 182
原创 【最短路】HDOJ3790 最短路径问题
最短路径问题Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 33546 Accepted Submission(s): 9840Problem Description给你n个点,m条无向边,每条边都有长度d和花费p,给你起点s终点t,...
2018-06-14 14:30:50 251
转载 【进制转换】HDOJ[1877]又一版 A+B
题目网址:http://acm.hdu.edu.cn/showproblem.php?pid=1877又一版 A+BTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 18348 Accepted Submission(s): 7205P...
2018-06-14 14:07:29 235
原创 【哈夫曼树】4080:Huffman编码树
4080:Huffman编码树总时间限制: 1000ms内存限制: 65536kB描述构造一个具有n个外部节点的扩充二叉树,每个外部节点Ki有一个Wi对应,作为该外部节点的权。使得这个扩充二叉树的叶节点带权外部路径长度总和最小: Min( W1 * L1 + W2 * L2 + W3 * L3 + … + Wn * Ln)Wi...
2018-06-14 14:03:01 6077
原创 【BFS】HDOJ 1253 胜利大逃亡
胜利大逃亡Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 42581 Accepted Submission(s): 14796Problem DescriptionIgnatius被魔王抓走了,有一天魔王出差去了,这可是Ignati...
2018-06-13 14:25:47 260
原创 【并查集】HDOJ 1856 More is better
DescriptionMr Wang wants some boys to help him with a project. Because the project is rather complex, the more boys come, the better it will be. Of course there are certain requirements. Mr Wang selec...
2018-06-13 13:52:15 140
原创 【二分枚举】04:网线主管
还是二分搜索枚举解空间的题目。代码思路基本上就是,找到解空间的上下限【base,top】,然后main函数里面进行二分枚举,另外需要写一个判断某个值是否合法的函数。04:网线主管总时间限制: 1000ms内存限制: 65536kB描述仙境的居民们决定举办一场程序设计区域赛。裁判委员会完全由自愿组成,他们承诺要组织一次史上最公正的比赛。他们决定将选手的电脑用星形拓扑结构连接在一起,即将它们全部连到一...
2018-06-13 13:09:17 301
原创 【创新实训】风格迁移功能探索与实现(六)完成代码并训练 保存训练结果 测试效果
DescriptionMr Wang wants some boys to help him with a project. Because the project is rather complex, the more boys come, the better it will be. Of course there are certain requirements. Mr Wang selec...
2018-06-11 21:57:05 588 1
原创 【创新实训】风格迁移功能探索与实现(五)eval_model.py 验证模型的编写
14:求10000以内n的阶乘查看提交统计提问总时间限制: 5000ms内存限制: 655360kB描述求10000以内n的阶乘。输入只有一行输入,整数n(0<=n<=10000)。输出一行,即n!的值。样例输入100样例输出933262154439441526816992388562667004907159682643816214685929638952175999932299156...
2018-06-05 18:56:12 493
原创 【大数/高精度整数】OJ NOI 11:大整数减法
11:大整数减法总时间限制: 1000ms内存限制: 65536kB描述求两个大的正整数相减的差。输入共2行,第1行是被减数a,第2行是减数b(a > b)。每个大整数不超过200位,不会有多余的前导零。输出一行,即所求的差。样例输入99999999999999999999999999999999999999999999999999样例输出9999999999999999999999990...
2018-06-05 16:29:50 1439
原创 【大数/高精度整数】HDOJ 1002 A+B
A + B Problem IITime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 419063 Accepted Submission(s): 81324Problem DescriptionI have a very simple p...
2018-06-05 15:41:49 269
原创 【哈希】1551:Sumsets
1551:Sumsets查看提交统计提问总时间限制: 1000ms内存限制: 65536kB描述Given S, a set of integers, find the largest d such that a + b + c = d where a, b, c, and d are distinct elements of S.输入Several S, each consisting of a...
2018-06-03 22:11:25 689
原创 【CNN基础】卷积神经网络笔记—Padding
理解CNN中的Padding操作:6*6矩阵与3*3矩阵卷积,得到4*4矩阵。普遍规律是 n*n 卷积 f*f 得到 n-f+1 * n-f+1。但是存在两个缺点:1.卷积后的矩阵越变越小(如果卷积层100层,每一层都缩小最终得到的将是很小的图片)2.输入矩阵(左)边缘像素(绿阴影)只被计算过一次,而中间像素(红阴影)被卷积计算多次,意味着丢失图像角落信息。为了解决这两个问题,就对输入图像进行p...
2018-06-02 23:53:26 1033
原创 【大数/高精度整数】14:求10000以内n的阶乘
胜利大逃亡Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 42581 Accepted Submission(s): 14796Problem DescriptionIgnatius被魔王抓走了,有一天魔王出差去了,这可是Ignati...
2018-06-01 11:03:58 1264
原创 【拓扑排序】HDOJ 1285确定比赛名次
Problem Description有N个比赛队(1<=N<=500),编号依次为1,2,3,。。。。,N进行比赛,比赛结束后,裁判委员会要将所有参赛队伍从前往后依次排名,但现在裁判委员会不能直接获得每个队的比赛成绩,只知道每场比赛的结果,即P1赢P2,用P1,P2表示,排名时P1在P2之前。现在请你编程序确定排名。 Input输入有若干组,每组中的第一行为二个数N(1<=N&...
2018-05-31 21:04:12 169
原创 【拓扑排序】HDOJ 3342 Legal or Not
Legal or NotTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 10349 Accepted Submission(s): 4844Problem DescriptionACM-DIY is a large QQ group ...
2018-05-31 20:41:54 204
原创 【创新实训】风格迁移功能探索与实现(四) train_model.py 训练代码的编写
最短路径问题Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 33546 Accepted Submission(s): 9840Problem Description给你n个点,m条无向边,每条边都有长度d和花费p,给你起点s终点t,...
2018-05-30 17:16:20 1006
原创 【最短路之dijkstra】最短路
最短路Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 83358 Accepted Submission(s): 36065Problem Description在每年的校赛里,所有进入决赛的同学都会获得一件很漂亮的t-shirt。...
2018-05-30 15:07:46 175
原创 【最短路之FLOYD】最短路
最短路Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 83358 Accepted Submission(s): 36065Problem Description在每年的校赛里,所有进入决赛的同学都会获得一件很漂亮的t-shirt。但...
2018-05-30 14:20:08 377
原创 【MST最小生成树】Freckles
FrecklesTime Limit: 1000MS Memory Limit: 65536KTotal Submissions: 8979 Accepted: 4262DescriptionIn an episode of the Dick Van Dyke show, little Richie connects the freckles on his Dad's back to form a...
2018-05-30 00:33:18 185
原创 【MST最小生成树】
还是畅通工程Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 55870 Accepted Submission(s): 25344Problem Description某省调查乡村交通状况,得到的统计表中列出了任意两村庄间的距离。省政...
2018-05-29 23:23:22 279
原创 【创新实训】风格迁移功能探索与实现(三) tensorflow系统设计与模型定义
DescriptionMr Wang wants some boys to help him with a project. Because the project is rather complex, the more boys come, the better it will be. Of course there are certain requirements. Mr Wang selec...
2018-05-20 14:25:47 475
原创 【并查集】HDOJ 1232 通畅工程
畅通工程Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 64893 Accepted Submission(s): 34692Problem Description某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连...
2018-05-20 13:38:26 148
原创 【最大公约数】3195:最大公约数
3195:最大公约数总时间限制: 1000ms内存限制: 65536kB描述输入2个正整数,求出他们的最大公约数。输入输入两个正整数,只有一行,整数之间用一个空格分开输出输出最大公约数,只有一行,包括三个数据,分别为采用十进制,十六进制和八进制表示的最大公约数,输出数据之间用空格隔开样例输入3 9样例输出3 0x3 03提示注意十六进制,八进制的表示格式求最大公约数,使用欧几里得算法,也就是辗转相...
2018-05-19 10:15:00 974
原创 【进制转换】35:输出二进制补码
35:输出二进制补码总时间限制: 1000ms内存限制: 65536kB描述输入一个整型(int)的整数,输出它的32位二进制补码。输入一个整型整数。输出输出一行,即该整数的补码表示。样例输入7样例输出00000000000000000000000000000111首先明确几个概念:原码:如果机器字长为n,那么一个数的原码就是用一个n位的二进制数,其中最高位为符号位:正数为0,负数为1。剩下的n-...
2018-05-18 22:40:52 5182
原创 【进制转换】36:二进制分类
36:二进制分类查看提交统计提问总时间限制: 1000ms内存限制: 65536kB描述若将一个正整数化为二进制数,在此二进制数中,我们将数字1的个数多于数字0的个数的这类二进制数称为A类数,否则就称其为B类数。例如:(13)10 = (1101)2,其中1的个数为3,0的个数为1,则称此数为A类数;(10)10 = (1010)2,其中1的个数为2,0的个数也为2,称此数为B类数;(24)10 ...
2018-05-18 11:51:51 1423
原创 【进制转换】34:确定进制
34:确定进制总时间限制: 1000ms内存限制: 65536kB描述6 * 9 = 42 对于十进制来说是错误的,但是对于13进制来说是正确的。即, 6(13)* 9(13)= 42(13), 而 42(13)= 4 * 131+ 2 * 130= 54(10)。你的任务是写一段程序,读入三个整数p、q和 r,然后确定一个进制 B(2<=B<=16) 使得 p * q = r。 如果...
2018-05-18 11:37:45 3098
原创 【进制转换】01:数制转换
01:数制转换总时间限制: 1000ms内存限制: 65536kB描述求任意两个不同进制非负整数的转换(2进制~16进制),所给整数在long所能表达的范围之内。不同进制的表示符号为(0,1,...,9,a,b,...,f)或者(0,1,...,9,A,B,...,F)。输入输入只有一行,包含三个整数a,n,b。a表示其后的n 是a进制整数,b表示欲将a进制整数n转换成b进制整数。a,b是十进制整...
2018-05-18 10:58:58 2316
原创 【二叉树】2392:Clear Cold Water
2392:Clear Cold Water总时间限制: 10000ms单个测试点时间限制: 1000ms内存限制: 65536kB描述The steamy, sweltering summers of Wisconsin's dairy district stimulate the cows to slake their thirst. Farmer John pipes clear cold w...
2018-05-16 17:29:10 2498
原创 【二叉树】1758:二叉树
1758:二叉树总时间限制: 1000ms内存限制: 65536kB描述如上图所示,由正整数1, 2, 3, ...组成了一棵无限大的二叉树。从某一个结点到根结点(编号是1的结点)都有一条唯一的路径,比如从10到根结点的路径是(10, 5, 2, 1),从4到根结点的路径是(4, 2, 1),从根结点1到根结点的路径上只包含一个结点1,因此路径就是(1)。对于两个结点x和y,假设他们到根结点的路径...
2018-05-16 16:24:51 902
软件工程(第4版)答案-Shari Lawrence Pfleeger
2017-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人