AI
AndyViky
这个作者很懒,什么都没留下…
展开
-
nlp常用任务以及各类任务常用模型
nlp常用任务以及各类任务常用模型本文主要简单描述目前nlp方向的应用类型以及该类型下的常用方法(以及目前通用的数据集)详细信息参考自 https://github.com/sebastianruder/NLP-progressnlp四大任务类型序列标注:分词/POS Tag词性标注/NER命名实体识别分词/POS Tag词性标注目前分词和词性标注技术已经非常成熟,常用的库有Jie...原创 2019-12-02 16:33:34 · 2502 阅读 · 0 评论 -
使用torchtext将文本转为ID表示
使用torchtext将文本转为ID表示此文详细介绍了如何使用torchtext加载文本数据并且转为由ID表示的数据。torchtext 加载文本数据def get_dataset(path, text_field, label_field): train, dev = data.TabularDataset.splits( # 支持 json, dict, c...原创 2019-12-01 17:21:09 · 738 阅读 · 0 评论 -
nlp 中文数据预处理
nlp 中文数据预处理此博文详细介绍中文数据预处理的过程并配上一定量的代码作为实例数据加载(默认csv格式)import pandas as pddatas = pd.read_csv("./test.csv", header=0, index_col=0) # DataFramen_datas = data.to_numpy() # ndarray 转成numpy更好处理(个人喜好)...原创 2019-12-01 15:13:23 · 1572 阅读 · 0 评论 -
Fast Gradient Sign Attack(FGSM)算法小结
Fast Gradient Sign Attack(FGSM)算法小结对抗攻击引发了机器学习一系列的思考,训练出来的model是否拥有强大的泛化能力?模型的准确率是否真实?在对抗攻击中添加一些肉眼无法识别的噪声可能会对识别效果产生巨大的影响。什么是对抗攻击对抗攻击的核心思想就是人为地制造干扰项去迷惑模型,使模型产生错误的结果。在计算机视觉中,对抗攻击就是在原图上添加一些人为无法识别的噪声...原创 2019-05-26 18:45:29 · 4691 阅读 · 0 评论 -
空间转换网络(Spatial Transformer Networks)
空间转换网络(Spatial Transformer Networks)普通的CNN能够显示的学习平移不变性,以及隐式的学习旋转不变性,但attention model 告诉我们,与其让网络隐式的学习到某种能力,不如为网络设计一个显式的处理模块,专门处理以上的各种变换。空间变换网络,允许神经网络学习如何在输入图像上执行空间变换,以增强模型的几何不变性,意思就是在对样本内容作微小的移动之后不会...原创 2019-05-27 22:48:50 · 2129 阅读 · 0 评论 -
高斯混合模型知识小结
高斯混合模型知识小结简介高斯混合模型(Gaussian Mixed Model)顾名思义,指的是多个高斯分布函数的线性组合,理论上GMM可以通过不同个数的高斯分布拟合出任意类型的分布。设有随机变量X,则混合高斯模型可以用下式表示:其中πk是混合系数(mixture coefficient),满足:GMM的应用GMM一般用于聚类,有几个高斯分布函数即代表有几个分类,在GMM中选取一...原创 2019-06-01 22:56:22 · 928 阅读 · 0 评论 -
ClusterGAN知识小结
ClusterGAN知识小结简介ClusterGAN 是第一个解决GAN在潜在空间聚类问题的工作,通过从一个one-hot编码变量和连续潜在变量的混合中对潜在变量进行采样,结合反向网络(将数据投射到潜在空间)与聚类特定损失共同训练,能够实现在潜在空间的聚类。主要贡献在一般的GAN中,即使潜在变量保留了关于观测数据的信息,潜在点也会基于潜在分布而平滑地分散,导致没有可观察到的聚类。为了解...原创 2019-06-02 19:47:25 · 2826 阅读 · 0 评论 -
GANMM小结
GANMM小结简介GANMM (Generative Adversarial Network Mixture Model) 是利用 GAN 进行聚类的一个模型,在传统聚类中非常典型的一个方法是利用高斯混合模型去匹配各个分布,高斯混合模型顾名思义就是利用多个高斯分布分别去拟合不同的分类,即有几个高斯分布就有几个聚类。但是高斯混合模型的最大缺点是无法拟合非常复杂的数据,在现实生活中大多数的数据并不...原创 2019-06-09 17:51:22 · 3398 阅读 · 0 评论 -
DEC(Deep Embedded Cluster)小结
Deep Embedded ClusterReferences:https://zhuanlan.zhihu.com/p/50365577https://flashgene.com/archives/7798.htmlhttps://zhuanlan.zhihu.com/p/28967965http://proceedings.mlr.press/v48/xieb16.pdf原创 2019-06-30 09:40:22 · 6885 阅读 · 0 评论 -
各类GAN特征描述(持续更新)
各类GAN特征描述DC-GAN:structure:ps:(生成器的最后一层和判别器的第一层不加batch-norm)paper: http://arxiv.org/abs/1511.06434contributions:1 将网络应用于GAN的训练。2 为GAN的训练提供了一个很好的网络拓扑结构。3 表明生成的特征具有向量的计算特性。weakness:1 但是对GAN训练稳...原创 2019-07-20 16:46:09 · 2410 阅读 · 1 评论 -
BEGAN知识小结
BEGAN知识小结本文为阅读完BEGAN论文后作出的系统小结。论文地址简介BEGAN是Google在17年上半年出的一篇论文,该论文对GAN做了进一步的改进,使得在没有使用一些trick的时候GAN依旧可以训练的很好,模式奔溃和训练不平衡等问题也解决的非常好。以往的GAN都是希望生成器生成的model和真实数据的model分布尽量相近,BEGAN从loss的角度进行比较,希望生成器生成的...原创 2019-05-17 13:40:25 · 889 阅读 · 0 评论 -
starGAN知识小结
starGAN知识小结本文为阅读完starGAN论文后作出的系统小结。论文地址starGAN顾名思义就是星型GAN结构,其解决的主要问题为 multi-domain 的 image-to-image 转换。相比于传统的拥有 k 个 domain 的多领域图片转换需要训练 k(k-1) 个 generator ,效率极其低下,也无法充分地利用到训练数据,同时传统的解决方法也无法衔接多个数据集的...原创 2019-05-14 16:10:17 · 2285 阅读 · 0 评论 -
maching learning入门(一)
ml入门(一)powered by @李宏毅第一课(机器学习总揽)ml基本步骤找出一个function set让maching拥有衡量一个function好坏的能力loss function L:input: a function output: how bad it is使用一个好的演算法挑出最好的那个functionfind a function wit...原创 2019-03-25 17:18:15 · 629 阅读 · 0 评论 -
maching learning入门(三)
ml入门(二)powered by @李宏毅第七课(cnn)convolutionmax poolingflatten原创 2019-03-29 16:29:42 · 570 阅读 · 0 评论 -
maching learning入门(二)
ml入门(二)powered by @李宏毅第六课(deep learning)原创 2019-03-26 17:47:16 · 232 阅读 · 0 评论 -
deep learning入门(一)
DL入门(一)powered by @李宏毅第一课(Deep Learning概览)outline:1 Universalitytheroy: 使用一层的Neural network就可以fit所有的函数。what is the L-Lipschitz function?output的变化一定要小于等于input的变化。how many neurons are needed...原创 2019-04-05 12:54:54 · 483 阅读 · 0 评论 -
maching learning入门(四)
ml入门(四)powered by @李宏毅第十课(迁移学习)1 model fine-tuning(1) 由于target data较少,容易过拟合,解决办法: 1 conservative training(保守训练) copy大部分参数,update小部分参数 which layer can be transferred(copied)?2 multitask lea...原创 2019-04-01 11:20:52 · 313 阅读 · 0 评论 -
deep learning入门(二)
DL入门(二)powered by @李宏毅第四课(Sequence to Sequence)1 Sequence Generation输入一个vector,输出也为一个vector。2 Conditional Sequence Generation产生符合某种情景的句子或者图片…3 Dynamic Conditional Sequence Generation假如输入的是...原创 2019-04-06 16:38:11 · 337 阅读 · 0 评论 -
deep learning入门(三)
DL入门(三)powered by @李宏毅第九课(GAN)原创 2019-04-23 22:43:44 · 352 阅读 · 0 评论 -
maching learning入门(五)
ml入门(五)powered by @李宏毅第十三课(RNN,recurrent neural network,循环神经网络)全连接神经网络和卷积神经网络他们都只能单独的取处理一个个的输入,前一个输入和后一个输入是完全没有关系的。但是,某些任务需要能够更好的处理序列的信息,即前面的输入和后面的输入是有关系的。比如,当我们在理解一句话意思时,孤立的理解这句话的每个词是不够的,我们需要处理这些...原创 2019-04-02 10:14:28 · 364 阅读 · 0 评论 -
maching learning入门(六)
ml入门(六)powered by @李宏毅第十五课(Reinforcement Learning)让机器根据不同的action将会得到不同的response,可能是不好的,也可能是好的。reinforcement learning要做到的事情就是让reward最大化。有时reward的情况是非常sparse的,大部分reward的返回都为0。RL的难点在于如何在sparse的情况下得到...原创 2019-04-02 15:00:02 · 260 阅读 · 0 评论 -
deep learning入门(四)
DL入门(四)powered by @李宏毅第十课(DRL概念)原创 2019-04-26 17:59:52 · 183 阅读 · 0 评论 -
linux下软虹人脸引擎学习笔记一
linux下软虹人脸引擎学习笔记一跑通软虹人脸检测官网下载开发包, 获取相关id key解压 arcface_detection 获取源码 目录结构如下|----doc| |----ARCSOFT_FACEDETECTION_DEVELOPER'S_GUIDE.pdf 开发文档| |----releasenotes.txt 版本介绍以及一些相关笔记|-...原创 2018-02-10 10:39:17 · 1067 阅读 · 0 评论