自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

IndexFziQ CSDN

A Ph.D. student in NLP at IIE, CAS.

原创 NLP与AI会议期刊详细整理「CCF, SCI」

本文档旨在调查所有可用的 NLP+AI 会议和期刊(主要针对自然语言处理学者),包括CCF等级、SCI、影响因子、主页和投稿介绍。 此处建议同学们早点想想未来走什么方向(比如教职/互联网/出国),就要决定自己是要投期刊,还是会议,还是追求影响因子。衷心祝愿您的论文被接受。我也将本文档已经发布到GitHub,欢迎来点赞~也欢迎贡献你所知道的会议期刊。

2022-10-23 16:28:50 8929 1

原创 如何转移conda环境(pack then tar)

conda环境从一个服务器(pc1)迁移到另一个服务器(pc2)。pc1安装conda-packpip install conda-pack打包pc1中自己的conda环境conda pack -n wxs //wxs为环境名,打包之后的文件名为wxs.tar.gz上传wxs.tar.gz到pc2的anaconda3的环境中首先创建wxs文件夹,再将压缩包解压到文件夹。一般情况下,anaconda3的环境文件夹名为“/home/username/.conda/env/”进入

2021-11-15 14:51:40 2530 1

原创 LaTeX多人批注

开头声明:\newcommand{\name1}[1]{{\color{blue}{[(Name1): #1]}}}\newcommand{\name2}[1]{{\color{red}{[(Name2): #2]}}}\newcommand{\name3}[1]{{\color{green}{[(Name3): #3]}}}LaTeX正文中用 \name1{note}来表示批注内容。

2021-09-26 09:57:56 445

原创 Python 重命名进程名

一般跑python程序都会有process name和对应的PID。如果和小伙伴同用一台服务器,大家的process name应该都是python,难以区分。下面的这个方法加入到python文件中,可以设置自己独有的进程名。安装包:pip install setproctitle代码:import setproctitle# 获取当前进程名# Windows可能有问题# proc_title = setproctitle.getproctitle()# print(proc_tit

2021-09-23 14:57:52 1671

原创 Markdown添加折叠内容

比如想要构建一个很长的list,可以使用下面的代码将详细内容折叠,有需要的人再去点开看。# A collapsible section with markdown<details> <summary>Click to expand!</summary> ## Heading 1. A numbered 2. list * With some * Sub bullets</details>...

2021-05-18 18:31:58 2200

原创 多系统解决Github图片显示不出来的问题

Mac/Linux环境下:用vim打开hostsudo vi /etc/hosts输入i,打开vim的插入模式(Insert mode),输入以下列表:# GitHub Start192.30.253.112 github.com192.30.253.119 gist.github.com151.101.184.133 assets-cdn.github.com151.101.184.133 raw.githubusercontent.com151.101.184.133 gist.gi

2020-12-23 19:11:58 141

原创 Conda虚拟环境下,安装pdftotext工具的注意事项

事先安装好anaconda的虚拟环境,当然也可以用base。envname是自己起的名字,python版本自定义。conda create -n envname python=3.8conda activate envnameconda config --add channels conda-forgeconda install poppler安装好pdftotext的依赖之后,就可以在当前虚拟环境下安装了:pip install pdftotext不然会报错 pdftotext.cpp

2020-11-28 14:33:55 573

原创 Mac和Linux将默认的Python版本指向Python3.x

首先安装python和python3Linux注意自己电脑python装的路径which pip-> /usr/bin/pythonwhich pip3-> /usr/bin/python3sudo ln -s /usr/bin/python /usr/bin/python3如果不行:sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 1sudo update-alternat

2020-10-22 14:55:45 768

原创 Python遇到的一些小问题记录

python tiny errorkeyerror(0):key在dict的key()中不存在,查看一下自己定义的标签和数据集读取之后的标签,类型是否一样。我遇到过自己定义的是str,读取的是int。TypeError: list indices must be integers or slices, not str这个说明,list[i],这个i你给的是str类型。RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when ca

2020-10-20 10:04:10 219

原创 论文笔记——对NLP深度神经模型的统一深入理解【神经网络可解释性】

From SJTU, MSRA and PKU.Authors: Chaoyu Guan, Xiting Wang, Quanshi Zhang, Runjin Chen, Di He, Xing Xie.Title: Towards a Deep and Unified Understanding of Deep Neural Models in NLPIn: ICML 2019.Co...

2019-10-07 16:47:13 2415

原创 论文笔记 — COMET【自动常识知识库构建】

From Allen Institute for Artificial Intelligence and Microsoft Research.Authors: Antoine Bosselut, Hannah Rashkin, Maarten Sap, Chaitanya Malaviya, Asli Celikyilmaz, Yejin ChoiTitle: COMET: Commonsen...

2019-07-04 12:07:39 4146

原创 论文笔记 — Transformer-XL [更优秀的长文本编码器]

From Google Brain and CMU.Authors: Zihang Dai∗, Zhilin Yang∗, Yiming Yang, Jaime Carbonell, Quoc V. Le, Ruslan SalakhutdinovTitle: TransformerXL: Attentive Language Models Beyond a Fixed-Length Cont...

2019-06-26 11:10:13 2115 1

原创 论文笔记 —— XLNet [在20项任务上超越BERT]

From Google Brain and CMU.Authors: Zhilin Yang∗, Zihang Dai∗, Yiming Yang, Jaime Carbonell, Ruslan Salakhutdinov, Quoc V. LeTitle: XLNet: Generalized Autoregressive Pretraining for Language Understa...

2019-06-21 22:40:44 1261

原创 Linux Must-Know 系列 —— ipynb转为其他格式

ipynb转为其他格式First, install jupyter.在linux,macos,centos命令行输入:htmljupyter nbconvert --to html notebook.ipynbpdfjupyter nbconvert --to pdf notebook.ipynbLatexjupyter nbconvert --to latex notebook....

2019-06-20 12:39:28 194

原创 Learn python with socratica [My notes] - part 15- Logging

Lesson 17Introductionlogging就是记录的意思,也就是生成日志的一种方式。在程序运行过程中,logging模块可以记录所有的一切【按需记录】。这对于开发者来说很重要,好的程序是错哪儿都知道直接知道发生什么问题。Functionslogging帮助程序员把重要的信息写入文件或者其他形式的输出,这些信息更多的是代码的执行部分和代码的问题。每个logging都有一个等级,...

2019-06-20 12:31:26 200

原创 基于机器学习的网络异常流量识别系统——实现篇

时隔两年,我最终还是把羞涩的代码公开了。当时初入机器学习,基本啥都不知道。现在一看代码,原来连个验证集都没有,溜了溜了。但我还是选择公开它,毕竟想让初学者少走弯路。秉着这个心态与大家一起学习,欢迎大家指出错误。链接是GitHub上的代码,我看了一下,好像当时我标了挺多注释的,应该算易懂的。https://github.com/IndexFziQ/ML-ATIC博客就不具体解释代码了,项目里都...

2019-06-13 15:10:23 7531 15

原创 Linux Must-Know 系列 —— 查看GPU使用情况

显示所有GPU的当前信息状态:nvidia-smi查询所有GPU的当前详细信息:nvidia-smi -q设备监控命令,以滚动条形式显示GPU设备统计信息:nvidia-smi dmon进程监控命令,以滚动条形式显示GPU进程状态信息:nvidia-smi pmon实时监测并高亮显示状态:watch -n 1 -d nvidia-smi,1代表间隔1s刷新。...

2019-05-14 10:29:21 336

原创 Linux Must-Know 系列 —— kill命令

一般,kill (-n) PID就可以满足日常所需了。-n是指信号类别,常用的如下:HUP 1 终端断线INT 2 中断(同 Ctrl + C)QUIT 3 退出(同 Ctrl + \)TERM 15 终止KILL 9 强制终止CONT 18 继续(与STOP相反, fg/bg命令)STOP 19 ...

2019-05-06 11:53:21 157

原创 Linux Must-Know 系列 —— 不挂断运行nohup+后台运行&+重定向

nohup command > file_name 2>&1 &nohup : 不挂断的运行,使命令永久的执行下去;&:是后台运行;2>&1:将标准错误(2)重定向到标准输出(&1),标准输出(&1)再被重定向输入到file_name文件中。command你要运行的命名,file_name你需要输出的文件名。...

2019-05-03 11:06:28 168

原创 论文笔记--Multi-Style Generative Reading Comprehension (Masque)

First published on indexfziq.github.io at 2019-04-10 17:00:00Introduction目前,本文是目前MARCO数据集NLG任务的第一名,作者是NTT公司的Nishina等人。文章突破了抽取式阅读理解模型的束缚,采用摘要的方式生成指定风格的答案,这两个突破算是GMRC的一个里程碑。在此篇文章之后,分析选手榜可以发现,沿用词方法的模型也...

2019-04-10 18:38:50 1117

原创 Python 学习笔记 -- string

ThPython StringsPython有一个名为“str”的内置字符串类,它有许多方便的功能(有一个名为“string”的旧模块,最好不用)。 尽管单引号更常用,但字符串文字可以用双引号或单引号括起来。 反斜杠转义在单引号和双引号文字中以通常的方式工作 - 例如 \ n、’、\“。双引号字符串文字可以包含单引号而不用任何大惊小怪(例如“我没有这样做”)同样单引号字符串可以包含双引号。字符...

2019-03-21 16:03:43 165

原创 论文笔记--Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification (V-Net)

First published on indexfziq.github.io at 2019-03-08 14:00:00Introduction本文出自Baidu NLP Research,在MS MARCO的V1版本上是第二;V2版本上QA任务是第三,well-formed任务是第二。代码没公开,基本的思想就是提出两个辅助任务,辅助抽取更好的答案片段。Motivation这篇文章的动机...

2019-03-08 14:15:21 937

原创 论文笔记--From Answer Extraction to Answer Generation for Machine Reading Comprehension (S-Net)

First published on indexfziq.github.io at 2019-01-17 19:10:40.Introduction本文出自微软亚研院,一作是北航的Chuanqi Tan, 代码没有公开,链接为台湾的一位同学用CNTK实现的代码。首次使用了Seq2Seq模型对MS-MARCO阅读理解数据集进行答案生成,比较符合MS-MARCO的本意,同时定义了先抽取再生成的框架...

2019-03-07 16:06:22 576

原创 Thinking about Multi-Task Learning

Welcome to star my repository https://github.com/IndexFziQ/Thinking-about-Multi-Task-Learning.Thinking about how multi-task learning(MTL) works in NLP. Inspired by the work from Ruder.The repository...

2019-03-07 16:01:49 307

原创 Learn python with socratica [My notes] - part 14- Python Tuples

Lesson 16Introduction不是所有的数据都能以pile的形式存储,一般情况下,把数据存储成序列更有用。Python提供了几种处理序列的方式,list就是其中一个常见方法,但是tuple是一种更小更快存储方法。那么,list和tuple有那些不同呢?开始做实验吧。Difference between List and Tuple第一个小不同,list用方括号定义,而tuple...

2019-01-03 16:56:34 173

原创 Analysis on MS MARCO leaderboard

My github project: https://github.com/IndexFziQ/MSMARCO-MRC-Analysis. Welcome to star my work!Analysis on MS MARCO leaderboardAnalysis on the MS-MARCO leaderboard, including V1 and V2, regarding the...

2018-12-28 15:29:56 742

原创 投ACL类会议的一些注意事项

投论文的时候一些完全可以避免的错误,千万不能当无所谓。转自:https://naacl2018.wordpress.com/2017/12/24/reject-without-review-avoidable-mistakes/The reasons for rejecting these papers without review are as follows, hopefully it c...

2018-12-19 10:49:55 2668

转载 提出正确的问题比得到正确答案更重要

Published by Daniel Lemiresource: https://lemire.me/blog/2018/12/06/asking-the-right-question-is-more-important-than-getting-the-right-answer/Arcticle:Schools train us to provide the right answers ...

2018-12-18 20:14:49 940

原创 Learn python with socratica [My notes] - part 13- Dictionary in Python

Lesson 15Introduction在计算机科学中,有一种数据结构叫关联数组(associative array),也就做映射(map)。在python中,这个数据结构被定义为字典(dictionary)。当你的数据需要以key-value(key:input -map-&amp;gt; value:output)的格式处理时,就需要字典。Create a New Dictionary假设我...

2018-12-11 16:52:49 278

原创 Learn python with socratica [My notes] - part 12- Lists in Python

Lesson 14List[序列]是Python中最基本的数据结构。序列中的每个元素都分配一个数字,即它的位置,或着称为索引,第一个索引是0,第二个索引是1,依此类推。本节讲述如何创建一个List,并且规范化这个过程。有两种创建List的方式:# One way is to use the list structureexample = list()example = [] #...

2018-11-26 10:42:18 227

原创 Linux 查看系统状态的一些命令

只是列表,具体的功能完全可以help查,持续更新中…Contents系统uname -a # 查看内核/操作系统/CPU信息head -n 1 /etc/issue # 查看操作系统版本cat /proc/cpuinfo # 查看CPU信息hostname # 查看计算机名lspci -tv # 列出所有PCI设备lsusb -tv # 列出所有USB设备lsmod # 列出加载...

2018-11-22 15:07:32 377

原创 Learn python with socratica [My notes] - part 11- Sets in Python

Lesson 13在Python中,数据结构形式有很多,包括:Set、List、Tuple和Dictionary。本节详细介绍一下Set,我们先新建一个set集合,用dir()得到它能使用的函数。 example = set() dir(example) # the following functions is what 'set()' can use['__and__', '__cl...

2018-11-21 20:01:43 179

原创 Python 学习笔记 -- pickle

pickle是python语言的一个标准模块,安装python后已包含pickle库,不需要单独再安装。注意引包的时候,python2是cPickle库,python3是pickle库。pickle模块实现了基本的数据序列化和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对...

2018-11-20 15:49:18 316

原创 训练神经网络一般调参步骤

在训练神经网络的时候,需要调的参数很多。实际训练的时候如果不按照一定的顺序,会很乱。因此正确有序地调参很重要,需要调节的参数大概有如下几个[1]:神经网络的层数每层神经元的个数如何初始化Weights和biasesloss函数选择哪一个选择何种Regularization?L1,L2Regularization parameter lambda 选择多大合适激励函数如何选择是否使...

2018-11-20 09:23:36 28473 19

原创 Learn python with socratica [My notes] - part 10- Functions

Lesson 12编程是会遇到逻辑重复的情况,通俗的讲,就是一个代码块可能会有多处要用到。这个时候,就需要函数了。用def作为函数体的开头其后是函数名(参数): dir() # inner functions in python ['In', 'Out', '_', '_2', '__', '___', '__bui...

2018-11-14 11:28:09 254

原创 Learn python with socratica [My notes] - part 9- If/Then/Else

Lesson 11写代码当时候,避免不了的就是循环结构,如果到flag条件,则执行,如果到跳转条件,则跳转到另一个块继续执行。关键词:if,else,then。下面举一个if-then的例子[ipython 不能运行整个代码文件,所以没有输入输出的实验效果,建议在]: # collect string / test length input = raw_input(&quot;P...

2018-11-14 09:04:07 282

原创 Learn python with socratica [My notes] - part 8- Datetimes Module

Lesson 10Datetime是一个很实用的模块,通常在我们写程序的时候,一般会用到系统时间来计算模型的效果,或者记录模型训练的过程。本节详细介绍python的这个模块。# first thing: import moduleimport datetime# Let's look at its dirdir(datetime)['MAXYEAR', 'MINYEAR', '...

2018-11-02 09:38:51 157

原创 Learn python with socratica [My notes] - part 7- Python Booleans

Lesson 9Booleans就是常说的布尔运算,True or False?计算机用1和0来隐形地表示,python中的布尔值如何表示的呢?# Booleans Value: True and False.&gt;&gt;&gt; TrueTrue&gt;&gt;&gt;true-------------------------------------------------...

2018-11-01 13:03:13 190

原创 论文笔记——Semantic Sentence Matching with Densely-connected Recurrent and Co-attentive Information(DRCN)

Introduction本文出自韩国 Naver Corporation 和 Seoul National University ,工作定义在句子匹配任务上。Sentence Matching的关键之处在于如何表示句子语义(目前感觉就是上下文信息和类似 POS 的特征信息,不能说是语义),如何理解句子之间的语义关系。查看相关工作可以得到,Attention 算法在刻画两个句子语义关系和对齐句子成...

2018-10-29 17:11:49 1966

原创 Learn python with socratica [My notes] - part 6- Interactive Help

Lesson 8课程介绍的python内容毕竟有限,所以在自学过程中你可能需要得到及时的帮助,使得自己对所要使用的方法有所了解。因此,你可以了解一下python的interactive help,学会使用它可以帮助你自学的时候事半功倍。...

2018-10-29 09:55:29 2945

提示
确定要删除当前文章?
取消 删除