AI/ML
wishchin
CV算法工程师:从事室内场景感知方面工作,完成算法实验和软件开发。
展开
-
CVPR 2022 最新350篇论文分方向汇总 / 代码
CVPR 2022 已经放榜,本次一共有2067篇论文被接收,接收论文数量相比去年增长了24%。在CVPR2022正式会议召开前,为了让大家更快地获取和学习到计算机视觉前沿技术,极市对CVPR022 最新论文进行追踪,包括分研究方向的论文、代码汇总以及论文技术直播分享。............转载 2022-08-15 10:24:51 · 1000 阅读 · 0 评论 -
计算机基础:离散数学和完备性
计算机的起源和数学基础有很深的渊源,深挖下去可以探讨到数学基础的集合论、哥德尔取得辉煌成果的证明论和模型论。也和哲学本身有有着基础层面的联系。哲学形式化基础: 数理逻辑。不可形式化的过程和结论都是违背认知的,涉及到知识论的基础讨论。近现代哲学形式化的基础基于数学的数理逻辑。数理逻辑的物质基础是集合论。10年来,人工智能在模式识别的机器学习中的深度神经网络学习即深度学习方面取得实用性的成果,甚至催生了类似商汤旷世这种仅在人脸识别方面就估值数十亿美元的商业公司。机器学习基本理论,可得到基础数学的泛函分析原创 2020-11-25 00:53:09 · 907 阅读 · 0 评论 -
人工机器:深度学习CNN到底实现了什么
现在的归纳式和生成式深度学习离AI还很遥远,AI更需要深度强化学习。参考:作为归纳学习的深度学习-https://blog.csdn.net/wishchin/article/details/71195098从泛函分析里得出的结论:模式识别的数学表示--https://blog.csdn.net/wishchin/article/details/74644489对一维信号识别和变长模式分析,我不甚了解,对LSTM处理变长一维特征之外的更强的作用也不是特别了解:https://blog.csdn.ne原创 2020-11-18 21:37:21 · 442 阅读 · 0 评论 -
VR: AR和VR演进哲学
Facebook 20亿美元(4亿美元+16亿美元股票换购方式)收购虚拟现实厂商Oculus 引爆AR产业,索尼不温不火逐步演进的头盔项目也该加速了。最近Oculus rift发布了商业版本:Oculus rift发布,体感游戏引入现实,AR游戏看似在15年的E3展会上变得火爆,热闹之后还有很长的路要走。 看看我们需要什么样的游戏? 黑白斯方块也可以让人不亦乐乎原创 2015-06-18 09:18:09 · 1051 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN结构进化(Alex、ZF、Inception、Res、InceptionRes)
前言: 深度学习:sigmod、tanh、ReLU函数的优缺点-文章图文并举;文章:CNN的结构分析--; 文章:历年ImageNet冠军模型网络结构解析---; 文章:GoogleLeNet系列解读---; 文章:DNN结构演进History—CNN-GoogLeNet :Going Deeper with Convolutions ;文章:Google最新开源Incepti...转载 2019-06-17 14:37:43 · 4207 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN结构/参数分析
前言:CNN迎接多类的挑战 特定类型的传统PR方法特征提取的方法是固定的,模式函数的形式是固定的,在理论上产生了特定的“局限性” 的,分类准确度可以使用PAC学习理论的方法计算出来。特定函数形式的模式识别准确度、泛化误差都受到模型本身VC维的限制。 使用不受限制的多层网络取代可以有明确语法形式的传统网络,可以突破特征提取和模式函数的固有限制,也导致了模式识...原创 2017-07-12 12:15:02 · 1638 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN方法
既然人工构建的特征hash函数并不能满足每一个场景的需求,每个经验都有局限,且特征提取的压缩映射必然导致压缩损失,为何不略过此环节,使用数据来完成此过程。越多的数据可生成越精确的分类结果,这就引出了一站式图像处理PR方法——CNN方法。IPPR又从分治法回到一站式方法。原创 2017-07-08 00:15:09 · 1341 阅读 · 0 评论 -
| 一文读懂迁移学习(附学习工具包)
当一个CNN用于另一个领域,就使用到了迁移学习。迁移学习是一种用于模型领域泛化和扩展的工具。 文章链接:独家 | 一文读懂迁移学习(附学习工具包) 参考:当深度学习成为过去,迁移学习才是真正的未来? 知乎:什么是迁移学习?2018年03月15日 17:24:291. 前言迁移学习(Transfer...转载 2019-06-17 14:43:39 · 2374 阅读 · 0 评论 -
机器学习中的群论方法
群论最初应用于高次方程解析解可解性的研究,致力于寻找方程解集的规则化和抽象化,并提取可解性的一般规律。在机器学习方面,模式分类主要应用数学方法,剥离概率范畴,一些模式分离的方法与方程解析形式化的方法有几分相似,群论方法也应用于机器学习领域。原创 2015-08-10 09:12:45 · 5368 阅读 · 1 评论 -
人工机器:Neural Turing Machines(NTM)
NTM通过融合一个注意力处理过程进行交互的外部存储器(external memory),来增强神经网络的能力。新系统等同于图灵机或者冯·诺依曼体系,但每个组成部分都是端到端可微的,因此可以使用梯度下降进行高效训练。初步的结果显示神经网络图灵机能够从输入和输出样本中推理出(infer)简单的算法,如复制、排序和回忆。翻译 2016-11-11 18:42:13 · 12810 阅读 · 3 评论 -
深度学习:又一次推动AI梦想(Marr理论、语义鸿沟、视觉神经网络、神经形态学)
几乎每一次神经网络的再流行,都会出现:推进人工智能的梦想之说。前言:Marr视觉分层理论 Marr视觉分层理论(百度百科):理论框架主要由视觉所建立、保持、并予以解释的三级表象结构组成,这就是: a.基元图(the primal sketch)—由于图像的密度变化可能与物体边界这类具体的物理性质相对应,因此它主要描述图像的密度变化及其局部几何关系。 ...原创 2013-12-21 18:41:25 · 1182 阅读 · 0 评论 -
人工机器:作为归纳系统的深度学习
深度学习为深度神经网络机器学习。07年最先引起注目的是DNN,在语音识别上有突出的表现;深度CNN在机器视觉领域的超常表现引领模式识别领域科学界和工业界的潮流,基于图像数据本身的二维结构天然适合CNN处理;RNN对时序和变长数据的处理优势促使语音识别和视频分析又有较大发展;此外可应用于增强学习的新的深度网络形式可以完成游戏策略训练过程,提供端到端的 模型训练方式:DeepMind用...原创 2017-05-05 15:53:15 · 1062 阅读 · 0 评论 -
人工机器:机器学习的哲学原理、基础及完备性的来由
观测->假设->归纳->演绎->过拟合,这是ML的一般套路和基础指导准则。 2018年03月11日 14:37:44导言 对于人工智能,有诸多定义,也有诸多质疑。各家的定义不用多追究。从各个领域提出对机器学习的理解,同时也表示出对定义的狭隘理解。从《计算机科学的离散结构》、到《pattern recognition》、...原创 2019-06-17 14:40:27 · 1594 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN稀疏结构进化(Mobile、xception、Shuffle、SE、Dilated、Deformable)
接上一篇:AI:IPPR的数学表示-CNN基础结构进化(Alex、ZF、Inception、Res、InceptionRes)。 抄自于各个博客,有大量修改,如有疑问,请移步各个原文.....17年的总结...CSDN吞图. 前言:AutoML-NasNet VGG结构和INception结构、ResN...翻译 2019-06-17 14:35:51 · 1598 阅读 · 0 评论 -
ZfNet解卷积:可视化CNN模型( PythonCode可视化Cifar10)
由来已久,ANN方法被称为模式识别里面的“黑盒”方法,因为ANN模型不能使用明确的函数——形式化的数学公式进行表示,同时也意味着应对评价模型,面对函数寻求最优解的优化方程也不能形式化表示。好在对于学习来说,形式化是非必须的,可形式化的SVM也面临着核函数的形式化难题,而CNN可以从语义层次进行解析,以弥补语法不能完备的缺憾。翻译 2017-12-25 16:00:00 · 1013 阅读 · 0 评论 -
EnforceLearning:迁移学习-监督训练与非监督训练
前言 CNN刷分ImageNet以来,迁移学习已经得到广泛的应用,不过使用ImageNet预训练模型迁移到特定数据集是一个全集到子集的迁移,不是标准定义的迁移学习(模型迁移),而是“模型移动”。若对网络结构不加修改地进行运用,则只是一个参数调优的过程。 迁移学习(Transfer Learning,TL)对于人类来说,就是掌握举一反三的学习能力。比如我们学会骑自...转载 2018-11-27 17:55:21 · 1986 阅读 · 0 评论 -
VC维与DNN的Boundary
原文链接:解读机器学习基础概念:VC维来去 作者:vincentyao目录:说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number of Hypotheses Growth Function Break Point与Shatter VC Bound VC dimens...翻译 2015-04-23 23:19:34 · 3167 阅读 · 0 评论 -
个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page?
文章链接:个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page? 感觉还是Fuck The Dog!看来还是以后把文章写在本地,然后再上传到CSDN吧。被CSDN的缓存机制坑了几次,得非常注意这次事件才行!!!...转载 2018-06-19 17:21:50 · 4771 阅读 · 0 评论 -
博客需要搬家
太他nia的垃圾了,写完之后点击发布,只保留了前一段,后面的长篇大论全都没了,感情是自动保存草稿的那一段,其他的呢。其他的呢?本地的没有上传上去,这个缓存机制有很大问题,太恶心人了!转移到其他地方吧................原创 2019-06-14 16:52:22 · 883 阅读 · 1 评论 -
语音跟踪:信号分解、锁相、鸡尾酒会效应、基于PR的信号分离
NLP中关于语音的部分,其中重要的一点是语音信号从背景噪音中分离。比如在一个办公室场景中,有白天的底噪-类似于白噪音的噪音、空调的声音、键盘的啪啪声、左手边45度7米元的地方同事讨论的声音、右手边1.5米远处同事讨论的声音、打印机的声音。各种声音混杂在一起,从自然人的角度来分别,很容易做到区分各种声音。 以自然人的观点来看,不自觉的感知中使用了空间传播模型和声音模式识...原创 2018-06-01 17:32:14 · 3065 阅读 · 0 评论 -
CNN结构:序列预测复合DNN结构-AcGANs、 ENN误差编码网络
前言:模式识别问题 模式函数是一个从问题定义域到模式值域的一个单射。 从简单的贝叶斯方法,到只能支持二分类的原始支持向量机,到十几个类的分类上最好用的随机森林方法,到可以支持ImageNet上海量1860个类且分类精度极高的InceptionV4(参考:CNNhttp://blog.csdn.net/wishchin/article/details/45286805),其模式...原创 2018-05-22 13:28:30 · 1676 阅读 · 0 评论 -
ES : 软件工程学的复杂度理论及物理学解释
系统论里面总是有一些通用的专业术语 比如复杂度、熵、焓,复杂度专门独立出来,成为复杂度理论 文章摘抄于:《非线性动力学》 刘秉政 编著 5.5 复杂性及其测度 热力学的几个专业术语 熵、焓、自由能、吉布斯自由能、复杂度 熵:体系混乱度(或无序度)的量度。S表示熵。也表示黑洞中不可用热量与其温度的比值。对于化学反...原创 2017-08-19 23:22:47 · 1146 阅读 · 0 评论 -
MaskRCNN:三大基础结构DeepMask、SharpMask、MultiPathNet
MaskXRCnn俨然成为一个现阶段最成功的图像检测分割网络,关于MaskXRCnn的介绍,需要从MaskRCNN看起。 当然一个煽情的介绍可见:何恺明团队推出Mask^X R-CNN,将实例分割扩展到3000类。 MaskRCnn取得的精细结果有三个主要技术构架:DeepMask、SharpMask、MultiPathNet。MaskRCNN与...转载 2018-03-22 17:45:36 · 3979 阅读 · 0 评论 -
Detectron-MaskRCnn:Mask判别和获取前向Mask的标签
对于FCN-SceneParse网络,最后卷积生成N个类别的maps,每个Map都得到图像所有点的单类概率。MaskRCNN的结构与FCN不相同。 参考三个文章: Detectron总结1:Blob的生成 和 generate proposal Detectron总结2:前向生成数据标签的过程 Detectron总结3:参数设置...转载 2018-03-23 13:19:39 · 1393 阅读 · 1 评论 -
初中生问题:求任意凸多边形的交叉面积
多边形相交的面积,即是 所有交点和内点组成的多边形连成的面积。再把多边形拆分成三角形,根据s2 = p * (p - a) * (p - b) * (p - c);计算出累加面积。原创 2017-10-18 10:00:12 · 3357 阅读 · 0 评论 -
AI:模式识别的数学表示(集合—函数观点)
模式函数是一个从问题定义域到模式值域的一个单射。 从简单的贝叶斯方法,到只能支持二分类的原始支持向量机,到十几个类的分类上最好用的随机森林方法,到可以支持ImageNet上海量1860个类且分类精度极高的InceptionV4,其模式函数为 f( x ) = { X——>Y }|{ X = ImageNet的图片,Y={ 1860个类的标记 } } 是一个单射函数。原创 2017-07-07 18:24:10 · 3617 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN可视化语义分析
ANN是个语义黑箱的意思是没有通用明确的函数表示,参数化的模型并不能给出函数的实际意义,甚至不能以解析函数的形式表示。而CNN在图像处理方面具有天然的理论优势,而Conv层和Polling层,整流层等都有明确的意义。可以跳过函数形式直接进行语义级别的解析。 可视化是直观理解的一个重要方式,CNN可视化可以辅助对特定数据集的特定网络进行语义级别的解析。转载 2017-07-24 11:46:23 · 608 阅读 · 0 评论 -
CNN结构:用于检测的CNN结构进化-结合式方法
类别失衡是影响 one-stage 检测器准确度的主要原因。那么,如果能将“类别失衡”这个因素解决掉,one-stage 不就能达到比较高的识别精度了吗?何凯明团队采用 Focal Loss 函数 来消除这个主要障碍。该团队设计并训练了一个简单的密集目标检测器—RetinaNet,是由一个骨干网络和两个特定任务子网组成的单一网络,骨干网络负责在整个输入图像上计算卷积特征图,并且是一个现成的卷积网络。 第一个子网在骨干网络的输出上执行卷积对象分类;第二个子网执行卷积边界框回归。转载 2017-08-21 22:25:40 · 4582 阅读 · 0 评论 -
CNN结构:用于检测的CNN结构进化-一站式方法
人眼能够快速的检测和识别视野内的物体,基于Maar的视觉理论,视觉先识别出局部显著性的区块比如边缘和角点,然后综合这些信息完成整体描述,人眼逆向工程最相像的是DPM模型。 YOLO的特别之处,在于把检测问题表示为一个分类问题,而不是以往的寻找绑定框/包围盒+分类的问题。使用一个网络实现检测的功能,成为一个端到端的图像检测系统。转载 2017-08-19 23:02:08 · 2099 阅读 · 2 评论 -
ES:AI 注释
为AI做注解: AI已经出第三版,大的框架没有改变,DNN也没有引入AI这本书。 在一个算法工程师 和一个硬件工程师之间,把 不鲁棒 与不稳定 两个 形容词 联系起来,这就是转换思维的必要性。科普的本质是 用一种语法 来解释另一种语法,并保持语义不变。原创 2017-08-19 23:41:22 · 724 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN基本结构分析( Conv层、Pooling层、FCN层/softmax层)
类似于SVM,CNN为代表的DNN方法的边缘参数随着多类和高精度的要求必然增长。比如向量机方法,使用可以映射到无穷维的高斯核,即使进行两类分类,在大数据集上得到高精度,即保持准确率和高精度的双指标,支持向量的个数会随着数据集增长,SVM三层网会变得非常宽。CNN方法的多层结构,在保留边缘映射的数目的同时可以有效地降低“支持向量”的个数,是通过函数复合—因式分解得到的,至于要使用多少...原创 2019-06-17 14:39:36 · 3388 阅读 · 0 评论 -
AI:PR的数学表示-传统方法PR
在图像处理PR领域,相对于ANN方法,其他的方法一般称为传统方法。在结构上,几乎所有的PR方法都是可解释的。而在规则和语义上,ANN方法一般是无法解释的,称之为PR的语义黑箱。对于图像处理IP来说,一般形式下的模式函数都是(降维)压缩hash函数。原创 2017-07-07 23:34:04 · 2958 阅读 · 0 评论 -
AI:IPPR的模式生成-CNN模块学习/训练方式(基本结构)
前言: 一个完备的模式识别系统,必然包含一个模式识别模型,此外还要附加一个评价模型,以及为了构建识别模型而构建的学习模型,并选择在学习模型中使用的学习方法。 表示(Representation) : 一个分类器必须用计算机可以处理的某种形式语言来表示。反过来讲,为模式识别模型选择一种表示,就意味选择一个特定的分类器集合。学习器可能学出的分类器只能在这个集合中。...原创 2017-07-23 22:02:14 · 4786 阅读 · 0 评论 -
MaskRCNN路标:TensorFlow版本用于抠图
MaskRCNN用于检测路标,作为更详细的目标检测,用以得到更精准的额路标位置,路标的几何中心点,用于构建更为精准的拓扑地图,减少构图误差。 抠图工具已经完成,把框抠出来,用0值表示背景。原创 2017-12-12 17:16:02 · 5699 阅读 · 10 评论 -
CNN结构:色彩特征提取-从RGB空间到HSV空间(色彩冷暖判断)
色彩冷暖判断不管是什么色相,都有冷暖之分,即使是蓝色也有偏暖的蓝,即使是红色也有偏冷的红。色彩冷暖具有相对性色彩明度变高/变低的过程,色彩冷暖倾向会变得不明显。色彩纯度变高,冷暖倾向变明显。转载 2017-11-27 17:34:33 · 4164 阅读 · 0 评论 -
CNN结构:色温-冷暖色的定义和领域区分(一)
转自知乎和百度百科:从零开始学后期 (色温的奥秘) 文章: 冷暖色区分?冷暖肤色适用于那些色系的彩妆? 文章:干货 |如何判断人体色冷暖?如何判断色彩冷暖?(值得收藏研读!) -蒜苗的回答 百科定义: 色温是表示光线中包含颜色成分的一个...原创 2017-11-22 15:06:22 · 8492 阅读 · 0 评论 -
场景分割:MIT Scene Parsing 与DilatedNet 扩展卷积网络
FCN中有两个关键,一个是pooling减小图像尺寸增大感受野,另一个是upsampling扩大图像尺寸。在先减小再增大尺寸的过程中,肯定有一些信息损失掉了,那么能不能设计一种新的操作,不通过pooling也能有较大的感受野看到更多的信息呢?答案就是dilated conv。原创 2018-03-16 15:38:29 · 2390 阅读 · 0 评论 -
NVIDIA各个领域芯片现阶段的性能和适应范围
NVIDIA作为老牌显卡厂商,在AI领域深耕多年。功夫不负有心人,一朝AI火,NVIDIA大爆发,NVIDIA每年送给科研院所和高校的大量显卡,大力推广Physix和CUDA,终于钓了产业的大鱼。 由弱到强理一下NVIDIA的现有产品线,在AMD锐龙发力之后,NVIDIA已经取代Intel,称为新的牙膏厂。 在与人工智能与机器人有关的平台上,NVIDAI产品线...原创 2018-03-16 11:49:24 · 3209 阅读 · 0 评论 -
模式识别两种方法:知识和数据
一:关于框架 在第三版 张学工编著的 《模式识别》 第一章 概论里面第3页,1.3. 这样写着:模式识别解决问题的的主要方法是基于知识的方法和基于数据的方法两类; (每一个作者都希望自己的所见所闻是正确的,这也仅仅是希望而已。因为这个希望后面有更深层的东西,自己的成果,别人的敬重,以及多年辛苦树立的权威,以及科学技术人员不能决定自己命运和方向的自卑感。当然这不是学者的错误,...原创 2014-03-31 13:02:00 · 2828 阅读 · 0 评论 -
CNN结构:用于检测的CNN结构进化-分离式方法
基于CNN的目标检测框架主要有两种:一种是 one-stage ,例如 YOLO、SSD 等,这一类方法速度很快,但识别精度没有 two-stage 的高,其中一个很重要的原因是,利用一个分类器很难既把负样本抑制掉,又把目标分类好。 另外一种目标检测框架是 two-stage ,以 Faster RCNN 为代表,这一类方法识别准确度和定位精度都很高,但存在着计算效率低,资源占用大的问题。转载 2017-08-15 10:27:38 · 2050 阅读 · 0 评论