元气少女wuqh-CSDN博客

1. 前言Accelerate 能帮助我们：方便用户在不同设备上 run Pytorch training script.mixed precision不同的分布式训练场景, e.g., multi-GPU, TPUs, …提供了一些 CLI 工具方便用户更快的 configure & test 训练环境，launch the scripts.方便使用：用一个例子感受一下。传统的 PyTorch trainin..

2022-05-26 20:08:24 12505

原创 VSCODE 远程 debug python，lauch.json 配置

{ // Use IntelliSense to learn about possible attributes. // Hover to view descriptions of existing attributes. // For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387 "version": "0.2.0", "configurations": [

2022-04-25 15:44:29 937

转载 ERROR 2002 (HY000): Can‘t connect to local MySQL server through socket ‘/var/run/mysqld/mysqld.sock‘

$ mysql -u<username> -p<password> 提示：ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock' (111)。解决方法：检查文件/var/run/mysql/mysqld.sock是否存在。若不存，则进行手动创建：$ touch /var/run/mysqld/mysqld.sock。更改文件权限，使

2021-12-12 17:31:16 2452 1

原创 2020.3 Enhanced meta-learning for cross-lingual named entity recognition with minimal resources 阅读笔记

MotivationProblem Setting:a) One source language with rich labeled data.b) No labeled data in the target language.现有的 Cross-lingula NER 方法可以分为两大类：a) Label projection (generate labeled data i...

2020-03-11 00:06:54 962

原创 2018.8. Unsupervised machine translation: A novel approach to provide fast... 阅读笔记

Unsupervised machine translation: A novel approach to provide fast, accurate translations for more languagesFB AI researchAbstract本文提出的方法由两个步骤构成：word-by-word initialization 和 translating sentence (...

2019-10-21 13:54:21 199

原创 2018.8. Phrase-Based & Neural Unsupervised Machine Translation 阅读笔记

2018.8-Guillaume Lample-Phrase-Based & Neural Unsupervised Machine TranslationFacebookAbstractThis paper: propose 2 modelsneural model (NMT)phrase-based model (PBSMT)both of them leverage...

2019-10-21 13:53:06 155

原创 2018.4. Unsupervised machine translation using monolingual corpora 阅读笔记

2018.4-Guillaume Lample, Marc’Aurelio Ranzato-Unsupervised machine translation using monolingual corpora only-ICLR2018Facebook AI researchAbstractTargetunsupervised translationThis paperMap...

2019-10-21 13:52:34 145

原创 2018.2. Unsupervised Neural Machine Translation 阅读笔记

2018.2-Mikel Artetxe, Kyunghyum Cho-Unsupervised Nueral Machine TranslationUPV/EHU, New York UniversityICLR2018AbstractThis paerbuild upon the recent work on unsupervised embedding mappings这篇...

2019-10-21 13:52:07 162

原创 2017. cheap translation for Cross-lingual NER 阅读笔记

cheap translation for Cross-lingual NER, Illinois Champaign提出了一个生成翻译字典的 cheap translation 算法该算法可以和 wikifier features、Brown Cluster features 等结合取得更好的效果通过实验说明当 source Lan. 与 traget Lan. 相似度比较高时，可以进一...

2019-10-21 13:51:02 255

原创 2018.9. Neural Cross-Lingual Named Entity Recognition 阅读笔记

Jiateng XieNeual Cross-Lingual Named Entity Recognition, CMUAbstract本文提出了两种方法来解决 under the unsupervised transfer setting 下 cross-lingual NER 中的挑战。lexical mapping (STEP 1-3). word ordering (STEP 4)....

2019-10-21 13:49:28 358

原创 code snippets

hit Ctrl + C to break out of training earlytry: for epoch in range(epochs): # code for training hereexcept KeyboardInterrupt: print('Exiting from training early.')

2019-04-24 10:33:57 221

原创 python argparse中action的可选参数store_true的作用

# test.pyimport argparseif __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument("--test_action", action='store_true') args = parser.parse_args() action_va...

2019-04-13 10:52:07 49817 11

原创 Beam Search score function

一般情况下，beam search 通常用于翻译等句子生成任务中。 beam_size 用来在翻译所所需时长和翻译准确度之间进行权衡。当beam_size = 1时，beam search 则退化为 greedy search。另一方面，当 n_best 的取值大于1时，由 beam search 可以得到一个 approximate n-best list，而不是只输入一个最优值。Hypot...

2019-02-01 14:33:35 1223

原创 2017.4-Jeff Donahue, Trevor Darrell-Adversarial feature learning-UCB-ICLR2017 阅读笔记

2017.4-Jeff Donahue, Trevor Darrell-Adversarial feature learning-UCB-ICLR2017本文创新点：提出 BiGANs，能够进行 inverse mapping (data => latent space)在GAN 中引入 encoder，命名为 Bi-GAN, 将 discriminator 对 X 和 G(z) 的...

2018-10-14 15:50:12 616

原创 2016.9-Jiwei Li-Deep reinforcement learning for dialogue generation-Stanford 阅读笔记

2016.9-Jiwei Li-Deep reinforcement learning for dialogue generation-arXiv-StanfordAbstractRecent neural modelsShort-sightedpredicting utterances one at a timeignoring their influence on future...

2018-10-14 15:47:00 365

原创自动微分方法简介

假设我们定义了一个方程：f(x,y)=x2y+y+2f(x,y)=x2y+y+2f(x,y) = x^2y + y + 2，我们需要对 xxx 和 yyy 求偏导，此时通常由以下几种做法：手动求导符号微分数值微分前向自动微分反向自动微分1. 手动求导拿起纸笔应用链式法则逐层求导即可。缺点是易于出错。2. 符号微分下图是符号微分方法在函数g(x,y)g(x,y...

2018-07-13 17:33:44 5090

原创 Ensemble Learning and Random Forest

1. Voting Classifiers分类 hard voting: 选择投票最多的类别soft voting: 选择概率和最大的类别，通常会比 hard voting 效果好一些。many weak leaners -&amp;gt; strong learner性能有限的原因各个classifier之间不够 independent, 预测的错误结果之间通常有一定的关联性 =&amp;...

2018-07-11 15:58:54 657

原创 Decision Trees

Decision TreeTraining and Visualizing a decision treeMaking PredictionsEstimating Class ProbabilitiesThe CART Training AlgorithmComputational ComplexityGini Impurity or Entropy?Regularization...

2018-07-11 15:40:58 1068

原创 Auto-encoding Variational Bayes 阅读笔记

MotivationPerform efficient inference and learning in :directed probabilistic modelscontinuous latent variablesintractable posterior distribution (即概率p(z|x)p(z|x)p(z|x)未知)large datasets解决方法...

2018-06-12 11:45:59 1913 2

原创 Online SVM 和 Hinge Loss

在线学习意味着应用增量学习方法来处理新增样本。对于 linear SVM 问题，求解方法之一是利用 Gradient Descent 最小化如下所示的代价函数（有SVM原问题得到），但遗憾的是与基于二次规划的求解方法相比，收敛速度要慢得多。【式-1】线性SVM分类代价函数 J(w,b)=12wTw+C∑i=1mmax(0,1−yi(wTxi+b))J(w,b)=12wTw+C∑i=1mm...

2018-05-23 22:55:29 869

原创 kernel SVM 和 multi-kernel SVM

3. Kernel SVM线性分类（超平面）并不能满足所有场合的需求，如形状为套环的样本集。此时便需要引入非线性分类方程：【式-0】非线性分类方程 H′(x)=wTϕ(x)+bH′(x)=wTϕ(x)+b H'(x) = w^T\phi(x)+b同理，在任一点 xxx 处，若 H′(x)&gt;0H′(x)&gt;0H'(x) > 0，则 xxx 属于第 I 类；若 H′(...

2018-05-23 16:56:45 1677

原创 SVM 中的mathematics —— Basic SVM 和 Soft Margin SVM

1. Basic SVM训练样本集：{(xi,yi),i=1,2,⋯,m=m++m−}{(xi,yi),i=1,2,⋯,m=m++m−}\{(x_i, y_i), i=1,2,\cdots, m=m^++m^-\}，其中，xi∈Rn,yi∈{+1,−1}xi∈Rn,yi∈{+1,−1}x_i\in R^{n},y_i\in\{+1,-1\}目标 1)：找到一个超平面{x|wTx+b=0}{...

2018-05-22 22:24:02 351

原创 SVM 概述

本篇为概述，数学推导见下篇：Linear SVM Classification适用场合：线性可分特点：large margin classificationhard margin classification:目标/核心：要求所有的样本必须被正确分类存在的问题：要求训练样本必须线性可分对 Outliers 特别敏感（产生泛化能力差的问题）soft margin cla...

2018-05-22 22:21:50 759

原创 Softmax Regression

Logistic Regression 常用于二分类的场合，而 Softmax Regression (又名 Multinomial Logistic Regression) 就是 Logistic Regression 在多类别场合下的推广，这种推广并不需要训练或者结合多个二分类分类器。1. 概率估计和类别预测基本思路：对某一样本/实例 xxx： - 首先计算该样本属于各个...

2018-05-19 19:18:26 455

原创逻辑回归 Logistic Regression

又名 Logit Regression. 通常用来估计样本属于某一类的概率。1. 概率估计【式-1】Logistic Regression模型估计概率（向量形式） p̂&amp;nbsp;=hθ(x)=σ(θTx)p^=hθ(x)=σ(θTx)\hat{p} = h_{\theta}(\mathbf{x}) = \sigma(\theta^T\mathbf{x}) 其中， σ(t)=...

2018-05-19 15:52:48 611

原创正则化线性模型：岭回归 Ridge Regression、Lasso 回归、Elastic Net (弹性网络) 和 Early stopping

模型正则化(减小自由度)是减少过拟合的方法之一。对多项式模型来说，正则化可以通过减少阶数来实现。对线性模型来说，正则化往往通过约束模型的权重来实现。Ridge Regression 岭回归, 又名 Tikhonov regularization岭回归是线性回归的正则化版本，即在原来的线性回归的 cost function 中添加正则项（regularization term）:...

2018-05-11 23:58:43 10418

原创判断模型是overfit还是underfit -- learning curve 与 bias/variance tradeoff

首先，我们先生成一组大致符合二次函数规律的训练师数据，再分别用 1) 线性函数，2) 二次函数和 3) degree=300的多项式函数进行回归分析，结果如下（代码见文末）在这个示例中，degree=300的情况明显overfit训练数据，linear model为underfit。二次函数则很好的拟合了训练数据，因为训练数据就是有二次函数生成的。而通常情况下我们并不知道训练数据符合...

2018-05-11 19:57:19 7488

原创多项式回归 Polynomial Regression

前面介绍了线性拟合数据的情况。那么，当数据并不符合线性规律而是更复杂的时候应该怎么办呢？一种简单的解决方法就是将每一维特征的幂次添加为新的特征，再对所有的特征进行线性回归分析。这种方法就是多项式回归。具体做法可以从示例代码中体会一下。。。注意当存在多维特征时，多项式回归能够发现特征之间的相互关系，这是因为在添加新特征的时候，添加的是所有特征的排列组合。以Scikit-Le...

2018-05-07 17:58:36 18431 1

原创线性回归 Linear Regression (2) —— 利用梯度下降法求解 & python 实现

Gradient Descent (GD) 的核心思想迭代地调整模型参数，来最小化代价函数 cost function。沿着下降梯度的方向一旦梯度等于0，便得到了(局部)极小值。具体步骤随机初始化参数 θθ\theta (random initialization)沿着负梯度方向逐步优化 θθ\theta（逐步减小cost function的取值），直到算法收敛。...

2018-05-07 11:11:38 2107

原创线性回归 Linear Regression (1)

1. 什么是线性模型 (linear Regression model)？线性回归模型通过简单计算输入特征的加权和，再加上一个常数项，即 bias term (又称为 intercept term) 来进行预测，如式-1所示。【式-1：线性回归模型预测】 ŷ=θ0+θ1x1+θ2x2+⋯+θnxxy^=θ0+θ1x1+θ2x2+⋯+θnxx\hat{y} = \theta_0 + \...

2018-05-05 17:36:19 1622

原创 Pycharm throws error :ImportError: No module named sklearn

本文以 Pycharm 找不到 “sklearn” 为例,说明一下在 Pycharm中报错 No module name * 时的一般解决方案我遇到的情况是: Pycharm中引用sklearn时代码下面出现了红线,运行程序时出现了上面的报错. 但在命令行输入$python 然后>> from sklearn.decomposition import PCA 时确不会报错.这说名自己的确是安

2017-12-09 18:46:38 4776

原创深度学习tensorflow环境配置：Ubuntu 16.04 LTS + GTX 1080 Ti，2017年11月

写在前面我是在11月20日左右配置的深度学习环境……怎么说呢，这个时间其实有点尴尬，很多东西都出了新版本，但可能不同工具之间一些由版本引起的问题还没有解决，所以，碰到了很多坑，还好最后都找到了解决办法。本文主要分享一下我参考的一篇非常靠谱的教程：深度学习tensorflow环境搭建（二）和内容连续的深度学习tensorflow环境搭建（三），以及每一个步骤里面一些你不注意可能会踩的坑……

2017-11-21 11:02:34 1235

原创 tmux安装 & tmux教程

0. 安装：$ sudo apt-get install tmux如果不可以，你可能需要更新一下再安装： $ sudo apt-get update$ sudo apt-get install tmux进入tmux: $ tmux然后就是快捷键的操作啦，下文中 C-b 指组合键 Control+b，告知tmux为快捷键操作。 ...

2017-08-10 16:08:01 1640

后盾网 CI框架 马震宇 模板

空空如也

后盾网 CI框架马震宇模板