人工智能
文章平均质量分 88
LXYTSOS
计算机视觉与强化学习。
展开
-
智能Agent笔记
理性Agent:追求尽可能好的行为表现。Agent表现如何取决于环境的本质。Agent通过传感器感知环境并通过执行器对所处环境产生影响。Agent的感知序列是该Agent所收到的所有输入数据的完整历史。一般地,Agent在任何给定时刻的行动选择依赖于到那个时刻为止该Agent的整个感知序列,而不是那些它感知不到的东西。从数学角度看,我们可以说Agent函数描述了Agent的行为,它将任意给定感知序列原创 2015-08-16 20:31:49 · 4092 阅读 · 0 评论 -
Kaggle座头鲸识别top5解决方案
比赛背景为帮助鲸鱼保护工作,科学家们使用照片监测系统来监测海洋活动。使用鲸鱼尾巴的形状和在录像中发现的独特标记来识别正在分析的鲸鱼的种类。在过去的40年中,大部分工作都是由个别科学家手工完成的,留下了大量的数据未开发未使用。因此Kaggle举办了这场比赛,提供了25000多张训练图片以及将近8000张测试图片,参赛选手需要编写算法,在测试图片中预测每张图片对应的最有可能的5个鲸鱼个体(每个鲸鱼个...原创 2019-05-29 19:53:21 · 2935 阅读 · 1 评论 -
PyTorch风格迁移,人人都是名画大师
爱好绘画的小伙伴们有没有想过将各种名画的风格融入自己的绘画作品当中?如今借助深度学习技术,很容易就能将名画的风格迁移到任何一张画中。Neural Transfer网络接收三张图片作为输入,一张内容图像,一张风格图像,一张由内容图像初始化的图像(最终将风格迁移到这张图像上来)。损失函数这里将会有两个损失函数:与内容图像之间的损失与风格图像之间的损失内容损失这个损失比较简单,只是单...原创 2019-06-02 21:53:07 · 2172 阅读 · 0 评论 -
大家的人工智能——正规方程
在《大家的人工智能——线性回归》中,我们介绍了如何找到一条直线来拟合训练数据,下面把之前的一元线性回归扩展到多元线性回归:y=θ0+θ1x1+θ2x2+⋅⋅⋅+θnxny = \theta_0 + \theta_1x_1 + \theta_2x_2 + ··· + \theta_nx_ny=θ0+θ1x1+θ2x2+⋅⋅⋅+θnxn其中θ0对应的是一元线性回归中的那个b,我们...原创 2019-06-09 10:48:49 · 5503 阅读 · 2 评论 -
目标检测第一弹——RCNN,SPP
R-CNN使用大容量卷积神经网络(CNN)自下而上生成候选区域(region proposals),以便定位和分割对象。标记训练数据稀缺,使用监督式预训练,基于特定领域的微调模型进行辅助,性能显著提升。R-CNN系统综述输入一张图像自下而上提取出大约2000个候选区域,对每个候选区域,首先将框稍微扩张使其包括部分上下文信息,然后将扩张后的图像resize到227 × 227(CN...原创 2019-06-16 20:51:48 · 654 阅读 · 0 评论 -
大家的人工智能——Logistic回归
在《大家的人工智能——线性回归》中,什么是拟合,代价函数,梯度下降,相信大家已经对这些基本概念有所了解。线性回归的应用场景是输出为连续的数值,比如下个月的房价多少,明天的气温多少。而在机器学习中还有一类任务,它的输出是离散的,比如明天他会不会去游泳(会或不会),这是狗还是猫,这就是分类任务,而Logistic回归就是处理这种分类任务的,不要看他的名字里面有“回归”两个字,但是它其实是个分类算法。它...原创 2019-06-20 21:35:17 · 557 阅读 · 0 评论 -
目标检测第二弹——Fast RCNN
Fast RCNNFast RCNN训练VGG19网络速度比RCNN快9倍,测试速度快213倍,与SPP网络相比,训练速度快3倍,测试快10倍,并且更准确。介绍在当时,目标检测训练任务都是分多个阶段进行模型训练,缓慢且不优雅。因此在Fast RCNN中提出了一种单阶段的训练方式,将物体分类和位置确定结合起来。测试阶段处理一张图片只需要0.3秒,并且在PASCAL VOC 2012数据集上更准...原创 2019-06-24 10:10:44 · 568 阅读 · 0 评论 -
大家的人工智能——决策树
在Logistic回归中,我们接触到了分类任务,今天我们将要介绍的是决策树,它是一种用于分类与回归的算法,这里主要讨论用于分类的决策树。决策树初探从名字中就不难猜出决策树模型是呈树形结构,在分类问题中,基于特征对实例进行分类,我们可以想象有一系列的if-else规则集合,通过判断特征是否符合这些规则来对实例进行分类。决策树结构决策树是一种对实例进行分类的树形结构,它由结点和有向边组成。而结...原创 2019-06-30 16:28:49 · 5879 阅读 · 0 评论 -
初识Keras
什么是KerasKeras是一个深度学习框架,与PyTorch不同的是,Keras提供高层次的模型构建模块,不处理张量操作,求微分等逻辑。而PyTorch中用户可以自己定义网络前向和反向传播的逻辑。而这些底层的操作,Keras则依赖其他后端来实现,在Keras中可以选择TensorFlow或Theano作为后端。而Theano现在已经停止维护了,所以还是用TensorFlow作为计算后端,这也是...原创 2019-07-25 21:39:23 · 457 阅读 · 0 评论 -
深度学习问答
Q:数据拆分时为什么最好拆分成训练集、验证集、测试集,而不是训练集和测试集?A:因为在开发模型的时候总是需要调节模型超参数,比如层数或层的大小。在调节超参数的过程中会将模型在验证数据上进行测试,这个调节过程本身也是一种学习,如果基于模型在验证集上的性能来调节超参数,会很快导致模型在验证集上过拟合,即使没有在验证集上训练。这是因为每次基于在验证集上的性能来调节超参数的时候,关于验证集的一些信息会泄...原创 2019-07-27 18:46:27 · 371 阅读 · 0 评论 -
kaggle糖尿病视网膜病变失明检测top5解决方案
比赛背景想象一下,在失明发生之前就能够发现病变。数以百万计的人患有糖尿病性视网膜病变,这是导致老年人失明的主要原因。印度的Aravind眼科医院希望在农村地区的人们中发现并预防这种疾病,而那里的医疗筛查很难进行。目前,Aravind技术人员前往这些农村地区拍摄图像,然后依靠训练有素的医生对图像进行检查并提供诊断。因此kaggle举办了场比赛来加快疾病筛查。(本人排名:top6%,162/2987...原创 2019-09-12 09:31:53 · 5335 阅读 · 10 评论 -
大家的人工智能——学习路线总览
最近有读者向小编反馈,之前写的文章对初学者来说太难看懂了,确实如此,那些比较适合对人工智能有初步了解的人看,但是对于初学者而言,看起来难免会觉得云里雾里了。为此,小编专门咨询了几位打算入门的初学者,总结之后有这么几点:总览人工智能基础性概念逐步深入应用场景如何使用应“广大”读者需求,从最简单的为大家介绍关于人工智能的东西,目前还不会太深入细节。我把人工智能相关的东西总结成了上面这...原创 2019-05-28 21:45:19 · 473 阅读 · 0 评论 -
PyTorch模型保存与加载
torch.save:保存序列化的对象到磁盘,使用了Python的pickle进行序列化,模型、张量、所有对象的字典。torch.load:使用了pickle的unpacking将pickled的对象反序列化到内存中。torch.nn.Module.load_state_dict:使用反序列化的state_dict加载模型的参数字典。state_dict 是一个Python字典,将每一层...翻译 2019-05-28 14:58:10 · 43930 阅读 · 14 评论 -
机器学习实战线性回归局部加权线性回归笔记
线性回归 用线性回归找到最佳拟合直线回归的目的是预测数值型数据,根据输入写出一个目标值的计算公式,这个公式就是回归方程(regression equation),变量前的系数(比如一元一次方程)称为回归系数(regression weights)。求这些回归系数的过程就是回归。假设输入数据存放在矩阵X X中,回归系数存放在向量w w中,那么对于数据X 1 X_1的预测结果可以用Y 1 =X T原创 2015-10-18 08:49:20 · 7911 阅读 · 3 评论 -
混沌,分形与人工智能
混沌这里所说的混沌并不是混乱之意,而是世间万物的一种属性。人们试图找到自然界事物发展的一定定律,然后用数学公式抽象出来,希望能预测将来事物发展轨迹,大部分时候可以奏效,但是极少时候也会出现问题,出现不可预测情况,比如气候骤变,股市突然暴跌。这些都体现了事物的混沌属性。混沌,是指在一个能被数学方程式精确描述的系统中,可以自发生成不可预测的现象,并且不需要任何外界的干预。有一种误解是,认为混沌就是一切事原创 2015-09-24 12:31:11 · 8743 阅读 · 5 评论 -
编译pycaffe SSD(python3.6,OpenCV3.4)
编译caffe(python3.6,OpenCV3.4)安装依赖包编译caffe首先要安装一大堆的依赖包:sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compilersudo apt-get install ...原创 2018-07-13 15:44:14 · 2857 阅读 · 0 评论 -
PyTorch深度学习60分钟快速上手(一),什么是PyTorch?
人工智能深度学习、机器学习 公众号:机器工匠学习目标:理解Pytorch 的 Tensor库,以及神经网络。训练一个简单的图像分类网络。假设已经了解numpy的基本用法,并确保已经安装好torch和torchvision。什么是PytorchPytorch是一个基于Python的科学计算包,用于以下两个目的:代替NumPy,使用GPU的加速能力。用于提供最大灵活性和速...原创 2019-05-18 23:08:19 · 662 阅读 · 0 评论 -
PyTorch深度学习60分钟快速上手(二),自动微分。
自动微分Pytorch中所有神经网络的核心是autograd包,我们先简单的来了解下这个包,然后来训练第一个神经网络。autograd包为tensor上所有操作提供了自动微分功能。Pytorch是一个先运行后定义(define-by-run)的网络框架,是一种动态网络图结构,因此代码如何运行决定了如何计算反向传播,并且每次迭代,反向传播都可能不同。张量(Tensor)torch.Tens...翻译 2019-05-20 13:49:09 · 568 阅读 · 0 评论 -
Pytorch迁移学习
在实际应用中,很少有人从头开始训练整个卷积网络,因为很难获得足够多的数据。因此,常用的做法是使用在庞大数据集上训练好的模型作为预训练模型,用来初始化网络,或者提取特征。迁移学习的主要应用场景有以下两种:微调模型。使用预训练模型初始化网络特征提取。除最后一层全连接层之外,固定网络中其他层的权重,最后的全连接层权重随机初始化,这一层的参数会得到训练。导包from __future__ i...翻译 2019-05-25 11:16:01 · 1369 阅读 · 0 评论 -
PyTorch深度学习60分钟快速上手(三),神经网络。
神经网络使用torch.nn可以很方便地构建神经网络。到目前为止,我们已经对autograd有所了解,nn依靠autograd来定义模型,并求微分。nn.Module包含了许多网络层,forward(input)能返回输出结果output。下面是分类数字图片的网络结构图:这是一个非常简单的前向网络,将输入经过若干网络层的处理,最后得出结果。神经网络的典型训练过程有以下几点:定义网...翻译 2019-05-21 21:12:08 · 1101 阅读 · 0 评论 -
torchvision 0.3重大更新,支持图像分割目标检测
前几天听说torchvision 0.3发布了,它支持分割模型、检测模型。而由于工作原因,刚好在寻找一种比容易使用的图像分割工具,不需要复杂的图像处理步骤、配置、训练代码,所以自然而然试试torchvision 0.3的功能了。下面记录一下小编我使用torchvision 0.3训练图像分割目标检测模型的过程。首先当然是安装torchvision 0.3啦,目前0.3版本的还不支持Window...原创 2019-05-30 18:34:57 · 2976 阅读 · 23 评论 -
PyTorch深度学习60分钟快速上手(四),训练分类器。
训练分类器现在我们已经知道如何定义网络结构,计算损失以及更新网络权重了,那么,如何准备数据?一般来说,处理图像、文本、语音或视频数据,我们可以直接使用Python的标准包将数据加载成numpy数组,然后将它转成torch.*Tensor。对于图片数据,可以使用Pillow,OpenCV;对于音频数据,可以使用scipy和librosa。对于文本数据,可以使用基于原生Python或Cy...翻译 2019-05-23 21:44:41 · 664 阅读 · 0 评论 -
大家的人工智能——线性回归
在《大家的人工智能——学习路线总览》中,相信大家已经对人工智能领域已经有了一个初步的了解,现在我们从其中一个小方面入门机器学习,今天我们将要讲述的是机器学习中的一种线性模型——线性回归。什么是线性回归让我们把思绪先倒回到初中数学课堂上(如果你已经上过初中),来回顾一个知识点:一元一次方程,给出如下坐标点(1,1.5),(2,2),(3,2.5),要求计算出当x=4时,y的值。相信大家都会首...原创 2019-06-05 13:44:50 · 2396 阅读 · 0 评论 -
kaggle气胸疾病图像分割top5解决方案
比赛背景突然喘气,无缘无故地无助地呼吸,这会是肺衰竭吗?气胸可由胸部钝伤、肺部疾病的损害引起,有时候甚至无法探寻诱因。在某些情况下,肺萎陷可能会危及生命。气胸通常由胸部X射线放射科医生诊断,但有时很难确诊。因此由医学影像信息学学会(SIIM)提供了气胸图片数据,kaggle举办了一场比赛,开发模型,为非放射科医生提供更可靠的诊断,并在疾病早期识别气胸,挽救生命。数据图片数据是胸透图片,并标注...原创 2019-09-22 11:17:27 · 2350 阅读 · 0 评论