- 博客(34)
- 资源 (45)
- 收藏
- 关注
原创 风格迁移相关
maxout:http://arxiv.org/pdf/1302.4389v4.pdf NIN:http://arxiv.org/abs/1312.4400Maxoutmaxout出现在ICML2013上,作者Goodfellow将maxout和dropout结合后,号称在MNIST, CIFAR-10, CIFAR-100, SVHN这4个数据上都取得了start-of-art的识别率...
2017-05-31 21:26:42 738
原创 Network In Network
arXiv:4 Mar 2014文章目的:主要是对于CNN结构进行改进,使得CNN能够学习到更加抽象和有效的非线性特征。论文地址:https://arxiv.org/abs/1312.4400《一》、Abstract为了增强模型在感知野内对局部patches的辨别力:卷积层:线性滤波器+非线性激活函数对输入进行扫描;网络中的网络NIN:1、提出在卷积层使用非线性代替...
2017-05-31 20:22:45 1281 1
原创 斯坦福大学cs229Andrew ng的机器学习课程
Andrew NG机器学习课程网易公开课 斯坦福大学公开课 :机器学习课程 机器学习课程教学官网:http://cs229.stanford.edu/syllabus.html Coursera最新版:https://www.coursera.org/learn/machine-learning/...
2017-05-17 16:53:20 3979
原创 强化学习资料
学习资料重要相关博客:http://blog.csdn.net/dark_scope/article/details/8252969专栏:http://blog.csdn.net/column/details/deeprl.html增强学习课程 David Silver (有视频和ppt):http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teac...
2017-05-17 15:32:01 2091
原创 产品读书《认知盈余》
可能从今天起,一姐我就要在自动驾驶的路上开工没有回头箭啦~ 导师分配的任务就是调研这个网站:http://www.cvlibs.net/datasets/kitti/index.php 也就是KITTI的数据集的网站~ 先PO几个我参考的资料源: Solomon1588的博客:http://blog.csdn.net/solomon1558/article/details/70173
2017-05-15 15:47:56 7008
原创 深度学习21天实战caffe学习笔记《17:学习资源》
按书上的进程今天应该就是新生了~全然木有学完tensorflow的激动,不过呢~~应该找个项目虐虐自己了~以下是资源哦~从书上扒下来的 ~~#~#**
2017-05-12 15:46:58 784 3
原创 深度学习21天实战caffe学习笔记《2 :深度学习工具》
深度学习工具汇总1. Caffe【Convolutional Architecture for Fast Feature Embedding】 —基于C++/CUDA/Python 实现的卷积神经网络,提供面向命令行、matlab、python的接口; —可以读源代码 —Caffe的main class:Blob 、Layer 、Net 、Solver —Protocol B...
2017-05-12 15:22:48 1373
原创 深度学习21天实战caffe学习笔记《1:深度学习的过往》
1. 深度学习DL:1.1、有监督学习、无监督学习、过拟合、训练样本、泛化、训练集、验证集、测试集这些和深度学习有关的知识需要实现明白,这里有一个深度学习的资料你们可以去下载; http://download.csdn.net/detail/julialove102123/9840329 1.2、相关公司及牛人和技术: Google------->Geoffrey ...
2017-05-12 13:56:32 2020
原创 Pycharm+SSH远程连接tensorflow
最近由于自己机器的一些个显示问题,不得不连接别人的机器进行代码调试!!!以下是我的心路历程安静~ 首先我说一下我做这个的背景:需要通过ssh在自己电脑的Pycharm上运行tensorflow(当然是远程服务器的tf),不过这里依旧存在一个问题即就是图像显示存在问题,所以这一部分我暂且不做解释!!! <一>、提前准备: Pycharm专业版、putty、tensorflow(python2.7
2017-05-10 22:24:09 1950
原创 使用putty登录显示network error:Connection refused
问题: 在局域网使用putty登录显示network error:Connection refused解决方法: 1.gedit /etc/ssh/sshd_config 将PermitRootLogin的注释取消,或者将no改为yes。(如果没有sshd_config文件说明linux上没有安装SSH,使用sudo apt-get install ssh安装之后,sshd-co...
2017-05-10 21:24:12 26095 3
原创 DISPLAY
在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.
2017-05-10 21:10:26 746
原创 Sarsa-Lamda
1、算法: Sarsa-lambda 是基于 Sarsa 方法的升级版, 他能更有效率地学习到怎么样获得好的 reward. 如果说 Sarsa 和 Qlearning 都是每次获取到 reward, 只更新获取到 reward 的前一步. 那 Sarsa-lambda 就是更新获取到 reward 的前 lambda 步. lambda 是在 [0, 1] 之间取值, 如果 lambda
2017-05-07 17:37:37 1746
原创 2023年转行AI产品经理入坑计划
hi,胖友们,我回来了,在编程工具类、数据分析类、线下新零售、电商、跨境SAAS等等领域摸爬滚打之后还是润回来了~对啦,姐要捡起我的AI,结合我的产品经验进军AI产品啦,希望可以赶上风口!做一只风口的猪,今天先制定一份为时2个月的复习计划(本人长时间关注AI咨询以及有计算机一级AI相关技术背景,所以先制定一个时间相对比较紧凑的复习计划),预计每天花3个小时。(写完还是有一点心有余悸,但还是决绝的入坑)
2017-05-07 17:22:36 2555 1
原创 Q-Learning实现
1、算法: 整个算法就是一直不断更新 Q table 里的值, 然后再根据新的值来判断要在某个 state 采取怎样的 action. Qlearning 是一个 off-policy 的算法, 因为里面的 max action 让 Q table 的更新可以不基于正在经历的经验(可以是现在学习着很久以前的经验,甚至是学习他人的经验). 不过这一次的例子, 我们没有运用到 off-policy
2017-05-07 15:41:23 5783 5
原创 强化学习系列 8 :Asynchronous Advantage Actor-Critic(A3C)
Asynchronous Advantage Actor-Critic(A3C)A3C:有效利用计算资源, 并且能提升训练效用的算法。平行训练:A3C 其实只是这种平行方式的一种而已, 它采用的是我们之前提到的 Actor-Critic 的形式. 为了训练一对 Actor 和 Critic, 我们将它复制多份红色的, 然后同时放在不同的平行宇宙当中, 让他们各自玩各
2017-05-07 10:57:32 3752
原创 强化学习系列 7 : Deep Deterministic Policy Gradient (DDPG)
<7>Deep Deterministic Policy Gradient (DDPG)改进版 Deep Deterministic Policy Gradient (DDPG):将 DQN 网络加入进 Actor Critic 系统中, 这种新算法叫做 Deep Deterministic Policy Gradient, DDPG 最大的优势就是能够在连续动作上更有效地学...
2017-05-07 10:49:11 9048
原创 强化学习系列 6 : Actor Critic
Actor Critic Actor Critic (演员评判家), 它合并了 以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients) 两类强化学习算法. Actor-Critic : Actor 的前生是 Policy Gradients , 可以在连续动作中选取合适的动作, 而 Q-learning 做这
2017-05-07 10:39:54 6747 2
原创 强化学习系列 5 : Policy Gradients
强化学习是一个通过奖惩来学习正确行为的机制. 家族中有很多种不一样的成员, 有学习奖惩值, 根据自己认为的高价值选行为, 比如 Q learning, Deep Q Network, 也有不通过分析奖励值, 直接输出行为的方法, 这就是今天要说的 Policy Gradients 了. 甚至我们可以为 Policy Gradients 加上一个神经网络来输出预测的动作. 对比起以值为基础的方法
2017-05-07 10:24:27 1913
原创 迁移学习系列资源
1、深度学习->强化学习-->迁移学习http://blog.csdn.net/jiandanjinxin/article/details/54133521?locationNum=6&fps=12、Tensorflow实现迁移学习3、杨强教授讲迁移学习,快摆好姿势听讲视频:http://www.cse.ust.hk/~qyang/https://mp...
2017-05-06 17:40:52 687
原创 2017强化学习资料汇总
转载自:https://zhuanlan.zhihu.com/p/238078751 前言ICLR 2017中和Deep Reinforcement Learning相关的论文我这边收集了一下,一共有30篇(可能有漏),大部分来自于DeepMind和OpenAI,可见DRL依然主要由DeepMind和OpenAI把持。由于论文太多,时间有限,先把论文列出来。之后根据情况做一定分析。
2017-05-04 22:05:37 1469
原创 学习:基于Google的TensorFlow框架来介绍深度学习
基于Google的TensorFlow框架来介绍深度学习。这个教程直接移植至Newmu的Theano Tutorials主题Simple MultiplicationLinear RegressionLogistic RegressionFeedforward Neural Network (Multilayer Perceptron)Deep Feedforward Neural Network...
2017-05-04 19:30:52 535
原创 经典网络结构VGG-net《Very Deep Convolutional Networks for Large-Scale Image Recognition》
论文地址:https://arxiv.org/abs/1409.1556论文翻译:http://blog.csdn.net/wangsidadehao/article/details/54311282VGG-Net来自牛津大学Andrew Zisserman 教授的组 (Oxford),在2014年的 ILSVRC localization and classification 两个问题上分别取得...
2017-05-04 11:48:23 1034
原创 经典网络结构AlexNet《ImageNet Classification with Deep Convolutional Neural Networks》
论文地址:http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf论文翻译:http://www.cnblogs.com/zf-blog/p/6432709.html2012年,Alex Krizhevsky发表了AlexNet,它是LeNet的一种更深更...
2017-05-04 11:41:00 1496
原创 Mask R-CNN
论文下载:https://arxiv.org/pdf/1703.06870.pdf 论文翻译:http://weixin.niurenqushi.com/article/2017-03-29/4805787.html项目地址:https://github.com/TuSimple/mx-maskrcnniccv2017的PPT: https://download.csdn.net/do...
2017-05-04 11:38:58 2561
原创 产品读书《魔鬼经济学2:拥有清晰思维的艺术》
导言:魔鬼经济学=荒谬怪诞经济学第一章:遏制气候变暖:火山爆发,用烟囱捅破天,还是架一根18英里长的管子?第二章:恐怖分子的银行账户有什么特点?第三章:犯罪率升高是因为电视看多了?第四章:疫苗、安全带和飓风:不一样的事情,一样的逻辑第五章:街头几女与百货商店圣诞老人有何相似之处;...
2017-05-03 19:05:13 674
原创 强化学习系列 4 : DQN
Deep Q Network.是一种融合了神经网络和 Q learning 的方法。1、神经网络传统的表格形式的强化学习有这样一个瓶颈,使用表格来存储每一个状态state, 和在这个 state 每个行为 action 所拥有的 Q 值. 如果全用表格来存储它们, 计算机内存不够, 而且搜索对应的状态也是一件很耗时的事. (比如下围棋).所以,我们可以利用神经网络将状态和动作当成神经...
2017-05-03 15:30:56 2635 1
原创 强化学习系列 3 : Sarsa
1、Sarsa的决策过程:Sarsa 的决策部分和 Q-learning 一模一样, 因为我们使用的是 Q 表的形式决策, 所以我们会在 Q 表中挑选值较大的动作值施加在环境中来换取奖惩. 但是不同的地方在于 Sarsa 的更新方式是不一样的.2、Sarsa 更新行为准则比如:我们会经历正在写作业的状态 s1, 然后再挑选一个带来最大潜在奖励的动作 a2, 这样我们就到达了继续写作业状...
2017-05-03 14:57:02 2258 3
原创 强化学习系列 2 :Q-Learning
Q-Learning决策过程:假设我们的行为准则已经学习好了, 现在我们处于状态s1, 我在写作业, 我有两个行为 a1, a2, 分别是看电视和写作业, 根据我的经验, 在这种 s1 状态下, a2 写作业 带来的潜在奖励要比 a1 看电视高, 这里的潜在奖励我们可以用一个有关于 s 和 a 的 Q 表格代替, 在我的记忆Q表格中, Q(s1, a1)=-2 要小于 Q(s1, a2)=1,...
2017-05-02 21:35:53 2141 1
原创 tensorflow资源整合
TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU)、服务器、移动设备等等。TensorFlow 最初由GoogleBrain 小组(隶...
2017-05-02 20:03:33 4144 2
原创 强化学习系列 1:强化学习入门简介
、强化学习入门简介强化学习是一种非监督学习的机器学习方法,对比监督学习,强化学习最开始并没有标好的标签,而是通过一次次在环境中尝试,获取数据和标签,然后通过学习自己总结出来的经验;一些比较有名的算法, 比如有通过行为的价值来选取特定行为的方法, 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network, Sarsa,还有直接输出行为的
2017-05-02 17:32:54 2183 3
转载 计算机视觉界期刊
Computer Version & Graphics & MultimediaRank 1:SIGGRAPH: ACM SIGGRAPH Conference (since 1974)CVPR: IEEE Conf on Comp Vision and Pattern Recognition (since 2000)ICCV: Intl Conf on Computer Visi
2017-05-02 15:51:48 626
转载 计算机视觉业界牛人
1.cv圈的格局, 按师承关系,总结a tree stucture of cv guys.David Marr----->Shimon Ullman (Weizmann)----->Eric Grimson (MIT) ----->Daniel Huttenlocher (Cornell) ----->Pedro Felzenszwalb
2017-05-02 15:47:44 1357
原创 You Only Look Once: Unified, Real-Time Object Detection
论文下载:http://arxiv.org/abs/1506.02640 代码下载:https://github.com/pjreddie/darknet这是继RCNN,fast-RCNN 和 faster-RCNN之后,rbg(Ross Girshick)大神挂名的又一大作,起了一个很娱乐化的名字:YOLO。 虽然目前版本还有一些硬伤,但是解决了目前基于DL检测中一个大痛点,就是速度问题。...
2017-05-01 22:44:01 538
管理十诫:影响你一生的管理哲学
2019-05-01
Single Image Dehazing via Multi-Scale Convolutional Neural Networks
2019-04-05
Learning Linear Transformations for Fast Arbitrary Style Transfer论文解读
2019-04-03
粉丝经济:传统企业转型互联网的突破口
2019-01-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人