自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Windows修改Mendeley字体及大小

Windows修改Mendeley字体及大小(升级Win11后发现注册表重置了,所以得重新改注册表的设置)适用于Windows10/Windows11键入win+R 打开运行窗口,输入regedit 命令打开注册表。在注册表上侧路径框输入HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\GRE_Initialize,定位到对应目录。修改GUIFont.Facename = Microsoft YaHei UI(或其他

2021-12-28 21:36:03 1932

原创 2021秋招 NLP算法岗面经

春招面了阿里和微信积攒了一些面试经验,春招只要拿到offer也不用面太多。秋招就面得比较多,包括:字节、微信、百度、华为、美团、拼多多、快手、虾皮(shopee),也都拿到了offer。一、春招实习阿里 4+1一面:自我介绍 + 三道算法题(两有序链表合并+汉诺塔+最大公共子串)+ 基础考察 + HMM维特比算法二面:聊天 + 压力面三面:leader面,自我介绍 + 项目介绍提问 + SVM的SMO算法四面:交叉面,主要是考察逻辑能力和智力题,其中有道是 “两枚不均匀的硬币,每次随机选取其

2021-11-16 01:59:30 1213

原创 A Frustratingly Easy Approach for Joint Entity and Relation Extraction(陈丹琦2020)

概述本文是陈丹琦博士关于实体识别与关系抽取的一篇论文,文本使用了一种pipeline的方式而非joint learning的方式超越了之前的一众模型,在数据集ACE04/05、SciERC达到SOTA。其中:NER使用span-based的模型而非传统序列标注模型(即将句子中所有长度小于等于N的span聚集成一个候选集,再对候选集作分类,每个候选span根据模型生成一个对应的embedding表示)。RE使用“实体边界+实体类型”方法修改输入句子。要点利用Cross-sentence con

2021-03-15 01:07:12 2627

原创 Named Entity Recognition with Partially Annotated Training Data(ACL2019)

1. Introduction在一些语料资源匮乏的语种中,可用的数据可能只是部分标注的(部分NE正确标注,部分NE被标注为O),如下图所示:其中标签为NE的token可视为positive instance,标签为O的的token被视为negtive instance,被错分为O的NE就称为False Negative。本文提出了一种基于约束驱动的迭代算法(constraint-driven iterative algorithm)来学习发现噪声数据中的Negative False样例并降低他们的权重

2021-03-15 01:00:56 259

原创 Few-shot Learning for Named Entity Recognition in Medical Text(2018)

1. Summary本文对Electronic health records的一些数据集进行了命名实体识别研究。在利用其它相关数据集的基础上,对target dataset只采集10个样例进行few-shot learning,提出了五种提升性能的方法(tricks):(1)layer-wise initialization with pre-trained weights(2)hyperparameter tuning(3)combining pre-training data(4)custom

2021-03-15 00:57:14 446

原创 Improving Low-Resource Named Entity Recognition using Joint Sentence and Token Labeling(ACL2020)

1. Summary本文针对low-resource NER任务——小语种电商NER任务,提出了一种使用句子标签(易获得)与token-level NER的联合训练方法,该方法表明联合句子标签可有效提升low-resource NER的识别性能。本文的亮点主要是提出了利用sentence label的联合训练模型,并对attention机制进行了探究实验,发现使用self-learned的放缩因子效果更好。2. Content2.1 联合训练模型如下图所示:其中,句子分类任务与NER任务除输出层均

2021-03-15 00:53:21 541 7

原创 A Survey on Deep Learning for Named Entity Recognition(IEEE Transactions2020)

1. Summary文章主要介绍了NER的资源(NER语料及工具),并从distributed representation for input,context encoder和tag decoder三个维度介绍了目前现有的工作,并调研了目前最具代表性的深度学习方法。最后提出了目前NER系统面临的挑战以及未来的研究方向。2. Introduction(1) NEs通常分为两种:generic NEs (e.g., person and location) and domain-specific NEs

2021-03-15 00:47:42 246

原创 KDD2020 AutoGraph总结

研一下学期和组内同学一同参加了KDD Autograph2020的比赛,最后也拿到了第二名的成绩,下面对本次比赛做个总结。PASA_NJU代码总结github代码使用GraphNas对数据集搜索最优网络模型。(引自 Gao Y, Yang H, Zhang P, et al. Graphnas: Graph neural architecture search with reinforcement learning[J]. arXiv preprint arXiv:1904.09981, 2019.

2021-03-15 00:30:09 228

原创 主题(话题)模型LSA/PLSA/LDA简述

主题(话题)模型LSA/PLSA/LDA简述0. 预定义w 表示词,V 表示词表大小(固定值)。z 表示主题,K 表示主题数量。D = (d1,d2,...,dM)(d_1, d_2, ..., d_M)(d1​,d2​,...,dM​)表示语料库,M 表示文档数量。d = (w1,w2,...,wN)(w_1,w_2,...,w_N)(w1​,w2​,...,wN​)表示一篇文档,N 为文档中词的数量。注意话题模型是词袋模型,词之间并没有顺序。狄利克雷分布Dirichlet(α→\over

2021-03-12 21:04:18 801

原创 SSH免密登录配置

SSH免密登录配置配置过程假设有两台主机:master1(192.168.100.101)和master2(192.168.100.102),用户名为xxx。首先分别在两台主机上运行指令ssh-keygen -t rsa生成id_rsa私钥和id_rsa.pub公钥。然后将id_rsa.pub分别写入authorized_keys文件末尾,若不存在改文件则自主创建并执行chmod 600 authorized_keys修改文件权限,之后执行chmod 700 .ssh。.ssh目录下可创建co

2021-01-14 21:52:59 214

原创 Windows系统Python安装scrapy模块后提示"DLL load failed"

Windows系统Python安装scrapy模块后提示"DLL load failed"简介安装后出现"DLL load failed"简介Scrapy是一个功能十分强大的爬虫框架,支持爬虫自定义配置与并发爬虫。在Python环境中可以直接通过pip install scrapy进行安装,然而通过这种方法安装scrapy容易失败,因此推荐直接下载源包的方式来安装,Python各版本对应的包可...

2019-07-18 10:59:15 253

原创 Linux非root用户配置安装screen

Linux远程节点非root用户配置安装screen简介安装screenscreen使用相关简介  我们经常使用ssh或telnet远程登陆到Linux服务器,而执行一些长时间任务如ftp传输,深度学习等任务时常常使我们感到头疼,因为我们不能关闭远程会话,否则进程会强制终止。screen可以很方便地处理这种情况,让我们可以放心地断开连接而让Linux服务器继续执行任务。下面介绍Linux非ro...

2019-04-01 21:47:00 7092 12

原创 Linux非root用户安装tensorflow1.12.0-gpu + cuda9.0 + cudnn7.5.0

Linux非root用户安装tensorflow1.12.0-gpu + cuda9.0 + cudnn7.5.0简介安装Anaconda安装tensorflow-gpu 1.12.0安装cuda9.0和cudnn7.5.0验证安装是否成功简介  最近做的一个项目需要使用GPU来做深度学习训练任务,在查询了一些资料后,自己成功安装配置了好了tensorflow-gpu,下面是我安装过程的一些经...

2019-03-26 17:27:49 2376 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除