自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (2)
  • 收藏
  • 关注

原创 TopK的线性时间算法

话不多说,直接上代码。

2024-03-15 18:21:06 360

原创 鲁祥老师吉他课学习笔记

鲁祥老师吉他课要点记录

2023-04-11 10:56:56 2186

原创 木吉他学习的高频问答(持续更新)

新手学吉他常见问题汇总

2023-01-15 12:45:13 718

原创 饥荒管理相关

管理员面板安装管理员面板mod,可避免过多手工指令输入https://steamcommunity.com/sharedfiles/filedetails/?id=1290774114安装之后,按下’Tab’键(键盘左侧)会出现管理相关按钮,功能如图:点击按钮右边的小箭头,可以看到第二组功能继续切换至第三组功能控制台管理员面板并不支持所有功能,还有一些指令只能手工输入登陆游戏之后,切换至英文输入法,输入"~"(键盘左上角的按键)之后出现如下命令控制台左下脚可能出现两种字样:“远程

2021-04-24 22:14:01 676

原创 《深度学习》第二章线性代数

第二章 线性代数目录第二章 线性代数目录线性代数的表示矩阵的转置矩阵相乘向量的线性相关性与矩阵的秩单位矩阵与逆矩阵向量的范数特征值分解线性代数的表示标量(Scalars) 单个数值:整数5、实数0.5、有理数1/3等 用小写字母表示,如 a, n, x向量(Vectors) 一维数组,无特别说明,即指列向量 加粗小写,如 x=⎡⎣⎢⎢⎢

2020-08-10 18:06:08 207

原创 iOS初学笔记

表格创建一个表格有两种方式:1、通过controller实现2、直接创建一个tableview前者用于整个页面或者window就是一个table,后者可能作为页面的一小部分tableview有两种形式,简单plain和分组grouped的,与简单不同的是,分组的table,组与组之间有一定间隔,可以设置各组的标题文字等。tableview的数据通过设置data source

2020-08-10 18:04:30 137

原创 字子序列中英翻译模型(五笔特征)

文章:Wei Zhang, etc. Subcharacter Chinese-English Neural Machine Translation with Wubi encoding主要思想:将五笔作为中文字模型特征用于翻译模型背景:有人使用了词子序列(sub-word)作为基本单位,用以规避典外词汇(Out Of Vocabulary, OOV)带来的问题,缩小了词表,并取得了良好的效果。五笔曾在其他文章中作为特征加入到翻译模型中,取得了优于字模型(character-level models)的

2020-07-30 14:34:04 363

原创 中文书写错误检测混合序列模型

中文书写错误检测混合序列模型文章:Hao Wang, etc. Chinese Spelling Error Detection Using a Fusion Lattice LSTM. 2019首先Spelling Error一般指的是英文的拼写错误,其实用在中文上不完全合适,因为中文是方块文字,错误有可能是拼音拼写导致的,也有可能拼写正确,但候选词选择错误,所以翻成输入错误会比较恰当。摘要:在于过去的中文输入错误一般以字和词的信息,没有把拼音加入其中,文章提出一种端到端混合模型FL-LSTM-CR

2020-07-28 11:43:23 345

原创 最早的统计分词

文章:Richard Sproat, A Statistical Method for Finding Word Boundaries in Chinese, 1990刚看了一篇2020年关于分词的综述,当中提到,最早使用统计方法进行分词的是1990的一篇文章,看了一下作者名字,Richard Sproat,是一个贝尔实验实的老外,这引起了我的兴趣。先上结论,这篇文章的方法思想来源于点互信息,与现在的各种模型相比,极其简单,但实验效果达到了惊人的准94%,召94%。论文的研究动机在于,词的划分结果,影

2020-07-21 11:34:28 141

原创 RK61键盘在ubuntu下的映射

新入手了KR61紧凑型键盘,发现在Ubuntu18.04下无法使用F1-F12,这对快捷键重度用户来说极为不方便。而且Fn+Fx甚至不能够被xev所捕获最后通过以下方法解决# echo 2 > /sys/module/hid_apple/parameters/fnmode来源https://forums.gentoo.org/viewtopic-t-1063898-start-0.h...

2020-05-04 11:39:57 558

原创 自制扫描文档

拍照材料拿裁纸刀把书页裁下来,装订好的厚书中间部分无法清晰拍摄,注意不要在桌子上裁,容易把桌子划到,尽可能找一把够坚硬的尺子设备三角架+相机+手机控制+一张比书本略大的纸作为背景条件充足的照明,可以是自然光或者近距离灯光拍摄方式将书整齐放在背景纸上,拍一页拿走一页,拿走的页不要翻面拍完一面之后把书页整理好,拍另一面,一部分一部分整理,否则书页对齐不了后期处理双面合并用she...

2020-03-08 19:00:30 188

原创 强化学习导论笔记——第二章 多臂老虎机问题

第二章 老虎机问题多臂老虎机问题单臂老虎机在拉下游戏臂后,有一定的概率获得奖励。而多臂老虎机需要选择到底拉哪个游戏臂,每个臂的中奖概率是不一样的。多臂老虎机正好适合用来讨论探索与利用的平衡问题。如果每次都采取贪婪算法,选择奖励概率的游戏臂,则完全是在利用行为的价值;如果选择的是非已知最佳的游戏臂,那就是在探索。一般来讲,利用可以使得单次回报最大,而探索则从长期来看可能产生更好的长期回报。本...

2018-11-29 10:22:11 1192

原创 强化学习导论笔记——第一章 介绍

第一章 介绍什么是强化学习强化学习的几个要素什么是强化学习强化学习的目标是如何将状态situation与动作action关联起来,以便取得最大的收益reward,即收益最大化。监督学习supervised Learning指的是从外部“监督者supervisor”提供的样本samples中提供的样本中学习,但交互式问题interactive problems通常无法从样本中穷举出来。对于强...

2018-11-29 10:17:57 348

原创 zim修改公式字体大小

查找zim帮助文档,原来生成公式是靠一个latex模板来实现的,官方给出的说明是编辑equation.tex,但实际并没有这个模板,但在plugin下,有一个equationeditor.tex网上查找修改公式的方法,有说用\displaystyle修饰的,但实际测试并不管用,同样不管用的还有常用的\large系列这时,我注意到首行可以指定字体大小\documentclass[12pt...

2018-06-29 21:39:31 949

原创 TextRank文档摘要

TextRank文档摘要思想:借用pagerank的思路,把词和句看成”顶点”,把他们的共现看成”边”,可以认为,存在共现关系,即可视为一种”推荐”,通过迭代,使得到更多推荐的节点取得更高的分值,用以提取关键词、关键句子。pagerank算法S(Vi)=(1−d)+d∑j∈In(Vj)1Out(Vj)S(Vj)S(Vi)=(1−d)+d∑j∈In(Vj)1Out(Vj)S(Vj)...

2018-06-28 20:23:09 836

原创 字符粒度表示用于词性标注

简述概括来讲,就是把单词的字符序列用CNN来提取特征,与预训练的word2vec一并,用于提升词性标注的效果文章全名:Learning Character-level Representations for Part-of-Speech Tagging字符特征字符特征的提取主要是考虑到字母的大小写、前后缀事实上是传统优化算法用于词性标注任务的重要特征,如果能恰如其分

2017-09-19 14:13:05 992

原创 利用词向量计算实体上下位关系

利用词向量计算实体上下位关系转至元数据结尾转至元数据起始概括来讲,就是在词向量中存在king-man=queen-woman的关系,同样存在上下位关系,如 虾-对虾=鱼-金鱼,以此为基础,进行聚类,并引入线性变换,使变换后的向量能更好地拟合这类关系。与之前的方法相比,文章的方案具有更好的泛化能力,在召回上尤为突出。上下

2017-09-19 14:11:58 949

原创 噪声对比估计的神经语言模型

噪声对比估计的神经语言模型GAN、skip-gram都提到或用到了NCE(Noise Contrastive Estimation),在NLP领域首次应用NCE就是这篇文章了A fast and simple algorithm for training neural probabilistic language models简介以极大似然估计为目标

2017-09-19 14:11:14 2476

原创 生成判别对抗网络

最近的一篇Wasserstein GAN火遍朋友圈,相关的文章也拿来读一读,赶个时髦简介文章用博弈论,令生成模型和判别模型的相爱相杀后,得到与训练数据分布尽可能接近的生成模型,一个扮演打假者,一个扮演造假者,前者试图在真货与假货中辨别哪个样本是假货(生成的),哪个是真货(真实样本),后者不断提高自己的制假水平,不让前者辨别出来文章全名:Generative Adversar

2017-09-19 14:10:05 608

原创 神经网络多轮对话系统(续)

简述文章与神经网络多轮对话系统一脉相承,文章的主要贡献在于,将几种网络结构的结果集成,取得了好于任一单一网络的结果。文章全名:Improved Deep Learning Baselines for Ubuntu Corpus Dialogs网络结构前作的结构可以进一步抽象成中间的NN可以是CNN, LSTM或Bi-LSTM,对应的图示为

2017-09-19 14:09:13 1227

原创 神经网络多轮对话系统

简述简单来讲,就是把上下文分别用RNN生成向量,计算两个向量变换后的内积对应二分类,判断一个回答是否是正确回答论文全名:The Ubuntu Dialogue Corpus: A Large Dataset for Research in Unstructured Multi-Turn Dialogue Systems背景这篇文章的主要贡献有两点:1、将Ub

2017-09-19 14:08:40 4352

原创 CNN用于文本分类

简述概括来讲,就是对不同尺度的窗口分别卷积,各尺度分别对不同时刻向量进行max-pooling,经过几层全连接之后进行分类,用word2vec来初始化输入矩阵有明显效果文章全名:Convolutional Neural Networks for Sentence Classification网络结构从左向右看:第一层对各词进行向量化,向量化有两种方式

2017-09-19 14:07:21 1097

原创 用于相关性计算的深度语义模型(续)

简述概括来讲,就是把DSSM(见用于相关性计算的深度语义模型) 中的全连接层换成了CNN+Max Pooling,变成了CDSSM文章全名:A Latent Semantic Model with Convolutional-Pooling Structure for Information Retrieval网络结构与DSSM一样,一个单词映射成ngram

2017-09-19 14:06:38 1432

原创 用于相关性计算的深度语义模型

用于相关性计算的深度语义模型转至元数据结尾转至元数据起始简述概括来讲,就是将有点击的Q-D对与无点的Q-D对做成对训练,最大化有点击对的条件概率P(D|Q),特征上把词转成字母序列的ngram,再进行深层映射。文章链接https://www.microsoft.com/en-us/research/wp-co

2017-09-19 14:05:39 1235

原创 翻译模型用于Query改写

简述总的来讲,就是将有点击的Query-Document(摘要)看成源语言和目标语言,用翻译模型计算二者的短语与短语之间的对齐关系,扩展Query的同时起到消歧的作用。文档名称:Query Rewriting using Monolingual Statistical Machine Translation技巧由于Query与文档之间,一般来讲并非严格对齐,需要对翻

2017-09-19 14:04:41 2438

原创 利用词向量计算上下位关系

概括来讲,就是在词向量中存在king-man=queen-woman的关系,同样存在上下位关系,如 虾-对虾=鱼-金鱼,以此为基础,进行聚类,并引入线性变换,使变换后的向量能更好地拟合这类关系。与之前的方法相比,文章的方案具有更好的泛化能力,在召回上尤为突出。上下位关系示例:词向量体现上下位关系示例:线性变换拟合目标函数:先对关系进行聚类,取

2017-09-19 14:03:56 2522

原创 [论文研读]非对称统计词向量(GloVe)

简述相对于Skip-gram来讲,主要区别在于 1、非对称的中心词与上下文向量表示 2、统计信息的利用(体现在偏置上) 3、目标函数 softmax->最小二乘法文章全名:GloVe: Global Vectors for Word Representation细节文章推导过程非常细,值得学习,但中心只有一个,就是目标函数 非对称统计词向量(GloVe) >

2017-09-19 14:02:50 462

原创 [论文研读]主题词向量

简介简单来讲,就是把通过LDA训练出的主题,作为词向量的一部分参与训练,对比了三种在目标/约束上有差别的模型,在词的相似度和文档分类上的效果。文章全名:Topical Word Embeddings模型总体框架是这样,先用LDA得到每个词在具体某个句子(Context/Document)中的主题zi,这里没有细讲,我猜测应该是取最大的主题,这样得到一个词-主题对,新

2017-09-19 14:01:46 627

原创 常用数学符号表

工作中常用到的数学符号表

2015-09-08 00:22:35 3515

practical common lisp英文版mobi

practical common lisp英文版mobi for kindle https://github.com/akosma/PracticalCommonLisp_ePub

2015-04-11

practical common lisp

practical common lisp一书的英文版pdf 源码来自github https://github.com/akosma/PracticalCommonLisp_ePub

2015-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除