文章杂谈
文章平均质量分 84
技术性杂谈文档
CVer儿
开源让世界更美好
展开
-
2012,改变人类命运的180天
谷歌猫项目搭建了一个神经网络,从YouTube上下载了大量的视频,不做标记,让模型自己观察和学习猫的特征,然后动用了遍布Google各个数据中心的16000个CPU来进行训练(内部以过于复杂和成本高为由拒绝使用GPU),最终实现74.8%的识别准确率。但如果把时间拉长,会发现从晶体管、集成电路,到Unix、x86架构,再到如今的机器学习,美国学界和产业界几乎都是领跑者的角色。从6月的谷歌猫,到10月的AlexNet论文,再到12月的太浩湖竞拍,差不多6个月的时间里,AI浪潮的伏笔几乎被全部埋下——原创 2024-07-25 18:52:49 · 896 阅读 · 0 评论 -
山东大学(威海)数据科学实验班20级软件设计大赛3D智慧医疗算法部分
算法部分共分为两个部分,第一部分:将base_train.zip数据集按10折交叉检验,基于baseline设计一个更好的算法,训练后输出一个10折平均dice。第二部分:对Paddleseg内置的各种分割模型,即VNet、UNETR、nnFormer、nnUNet、TransUNet、SwinUNet,进行尝试、对比,并提供详细的实验过程描述,评价结果需用表格或图展示出来。多器官数据集共有11个器官的标注,包括脾脏、右肾、左肾、胆囊、食道、肝、胃、主动脉、下腔静脉、胰腺、膀胱。转载 2024-07-15 02:41:09 · 25 阅读 · 0 评论 -
使用Paddle实现MRI医学图像超分辨率项目
In [13]# 没有进行patch分割成小块训练的from paddle.io import Dataset # 导入类库 Datasetclass MyDataset(Dataset): # 定义Dataset的子类MyDatasetelse:def data_augmentation(self,LR, HR): # 数据增强:随机翻转、旋转if n == 1:if n == 2:if n == 3:# 修改归一化# 以下是我测试时写的,没太大用plt.show()转载 2024-07-15 02:28:46 · 36 阅读 · 0 评论 -
飞桨采用NVIDIA Modulus打造汽车风阻预测模型DNNFluid-Car
首先,针对数据规模大的问题,研发团队基于飞桨大规模数据处理的能力,优化了数据读取方式,取多线程异步读取的方式,大幅提高了数据的读取效率,解决了模型训练的时间卡点,提高了模型的迭代速度,最终和单卡NVIDIA A100 GPU默认值配置相比,模型在Ahmed数据集上的训练速度从1200 s/epoch提升至120 s/epoch,提升幅度约10倍。作为纯数据驱动的模型,DNNFluid-Car模型的训练数据为CFD数值模拟数据,该数据的生成过程包括几何生成、网格划分、数值模拟和后处理。转载 2024-07-03 10:02:13 · 195 阅读 · 0 评论 -
刷脸背后,卷积神经网络的数学原理原来是这样的
在自动驾驶、医疗以及零售这些领域,计算机视觉让我们完成了一些直到最近都被认为是不可能的事情。今天,自动驾驶汽车和无人商店听起来不再那么梦幻。事实上,我们每天都在使用计算机视觉技术——我们用自己的面孔解锁手机,将图片上传到社交网络之前进行自动修图……卷积神经网络可能是这一巨大成功背后的关键组成模块。这次,我们将要使用卷积神经网络的思想来拓宽我们对神经网络工作原理的理解。打个预防针,本文包含相当复杂的数学方程,但是,你也不必为自己不喜欢线性代数和微积分而沮丧。我的目标并不是让你记住这些公式,而是为你提供一些关于翻译 2024-07-02 17:34:09 · 29 阅读 · 0 评论 -
卡本医疗亮相CUA2023,业内大咖齐聚共探泌尿前沿技术
聚焦精准诊疗,探索学科前沿研究成果、诊疗技术,发挥医工融合力量,助推临床技术创新。参与项目启动仪式的程帆教授、李恭会教授、邓健教授、袁敬东教授以及陈小刚教授表示,医学影像是医生的“眼睛”,希望通过医工融合和协同创新,帮助解决临床痛点难点问题,造福患者。针对泌尿外科临床痛点,卡本医疗瞄准科技创新前沿,将临床研究与影像组学、电磁引导、智能辅助等关键技术结合,推出VENUS多模态影像融合超声诊断系统,重新定义泌尿介入超声应用,打破医学影像高端应用的进口垄断局面,成为实现泌尿外科临床诊疗一大有力武器。原创 2024-06-20 16:19:38 · 850 阅读 · 0 评论 -
基于新型切片轮廓转换超分辨率的深度生成网络的高分辨率3D MRI重建
通过训练深度生成网络实现了5.5倍的超分辨率重建,与SMORE超分辨率重建方法和常规降采样训练的网络相比,该研究的SPTSR框架在50个测试案例中展示了最佳的整体图像质量。该研究所提出的SPTSR框架的目标是从单个2D切片堆叠的一个方向(例如,冠状MRI扫描)进行训练,并利用正交方向(例如,轴向MRI扫描)推理各向同性高分辨率的3D成像。与简单的双线性插值相比,SMORE和KS-ZF训练的网络去除了大部分阶梯和模糊伪影,但未能重建前列腺内的小结构,并且存在放大的噪声。因此,通过平面的推理。原创 2024-06-18 16:25:18 · 254 阅读 · 0 评论 -
卡本医疗VENUS登陆香港国际医疗展,探索全球医疗发展新机遇
其中,全球医学影像设备市场是全球医疗设备市场的最大组成部分,并保持着稳定增长趋势。卡本医疗高度重视科研投入、加速创新成果转化,目前已获得全球专利近50项,逐步建造属于自己的“护城河”,并通过在全国开展前沿学术交流、技术培训、临床研究等多维度发力,以满足更高水平的精准医学需求。在香港国际医疗及保健展上,卡本医疗海外市场负责人对VENUS的技术和临床应用进行了详尽的分享和演示,并与来自印度、墨西哥以及香港本土等地区的代理商就不同区域的医疗保健需求、经济及文化差异、市场拓展等进行了深度交流。夯实内功,强化外功。原创 2024-06-18 16:22:53 · 350 阅读 · 0 评论 -
达摩院医疗AI突破胰腺癌早筛难题,成果登上Nature Medicine,首次实现大规模胰腺癌筛查
论文共同一作、上海市胰腺疾病研究所曹凯医生介绍,此项研究构建了迄今最大的胰腺肿瘤 CT 训练集(包括 3208 名真实病人),最终通过全球十多家医院的多中心验证,测得 92.9% 的敏感性(判断存在胰腺病变的准确率)和99.9%的特异性(判断无病的准确率),在 2 万多人的真实病例回顾性试验中,发现了 31 例临床漏诊病变,有 2 例早期胰腺癌病患已完成手术治愈。「设想一下,我们去体检时做个最简单的平扫CT,就能查出有无胰腺癌,这将帮助到很多胰腺病人,减少悲剧的发生。转载 2024-06-18 16:21:35 · 27 阅读 · 0 评论 -
多模态影像融合--PLUS(Public software Library for Ultrasound)
PLUS是一个开源软件平台,提供了。转载 2024-06-18 16:17:11 · 16 阅读 · 0 评论 -
Hinton 万字访谈录
理想情况下,最好的人才是二者的结合体,但现实中并不总是能找到这样的人。一旦某个系统学习到的权重被确定,它可以被保存并在任意兼容的数字系统上重现,无需考虑硬件的具体差异,从而实现高效的知识共享。数字系统间可以通过微小的学习更新,然后共享这些更新后的权重,实现集体知识的即时同步,这是人类目前无法做到的。我认为最大的影响在于对一个抽象概念的认知转变:过去,许多人,包括统计学家、语言学家及多数 AI 研究者,对通过一个大型随机神经网络并辅以大量训练数据来学习执行复杂任务的想法持怀疑态度,他们认为这仅是“空想”。转载 2024-05-23 13:54:22 · 57 阅读 · 0 评论 -
专访联影智能联席CEO沈定刚:探索脑影像 AI 的无限可能
考虑到可以最大程度提升我们产品的可用性,我们这两个产品是在我们的两个平台(诊疗平台、科研平台)同步上线的,但这对应用本身来说,因为使用场景并不是完全一样的,会存在很多需要兼顾和调试的地方,尤其是交互设计方面,主要的目的也是让医生使用起来更方便,我们也花了一部分的精力在这里。我加入后,成功整合了这些资源。我们运用了一系列的专业技术,包括跨模态配准、信号质控、去噪、头动矫正、涡流矫正等等,这一系列的技术帮助我们实现了数据的全自动处理,也就意味着医生不需要任何操作,等待几分钟就可以得到一系列对应的参数。原创 2024-05-23 13:52:08 · 686 阅读 · 0 评论 -
大模型生产力的头场变革,从英特尔商用 AI PC 说起
此前加注在所有数字化基础设施之上的大应用、业务逻辑、软件也都将被重新写一遍,业务模式也将重构,在 AI PC 上,英特尔以经济性、物理性、数据安全性为三大准则,在技术和产品上不断更新迭代,在生态上与合作伙伴齐头并进,赋能各个场景,以水的姿态触达 AI 行业的每个角落。另一方面,端侧大模型对企业最大的好处是数据的安全性。当一项 AI 技术以同样的方式,默默地支持着各行各业的发展,没有特意彰显自己的地位与壁垒,反倒是一直以利他之心做着服务于整个产业之事,那个看似全在付出的厂商却可能成为最大的赢家。转载 2024-04-02 18:35:21 · 23 阅读 · 0 评论 -
numcpp& boost&vs2017踩坑记录
之前想用boost1.69版本,但是boost与numcpp编译过程死活找不到boost1.69,踩坑无数,只能采用1.79版本。注意的是Boost_DIR所在路径BoostConfig.cmake。之后就是配置numcpp和boost,numcpp是hpp的库,配置简单。编译过程遇见error MSB3073: 命令“setlocal”错误。项目属性页——配置属性——生成事件——生成后事件——在生成中使用“最后有人说NumCpp。实际测试性能能确实拉跨。生成vs2017工程。原创 2024-03-27 13:49:46 · 293 阅读 · 0 评论 -
CNN和LSTM的气象图降水预测
最原始的也是最简单的预测视频中的下一帧的内容的方法是使用CNN和LSTM。我们是否可以将预测天气雷达的下一个捕获信号的问题简化为预测视频中的下一帧的问题呢(雷达的讯号也是图像序列)。所以我收集了一些图像序列,并开始实验各种架构的卷积LSTM神经网络。每个训练数据点由36个连续的雷达原始文件(对应于间隔5分钟的3小时的测量)组成。然后将每个数据点分成两部分。前18帧用作“特征”(x),后18帧是神经网络在给定前18帧的情况下试图预测的内容(y)。翻译 2023-07-17 15:46:34 · 488 阅读 · 0 评论 -
pix2pix-gan医疗图像分割迁移
做pix2pix-gan的实验,数据包含两个部分mr 和 ct,不需要标签,因此上面的 def getitem(self, index):中不需要index这个参数了,类似地,根据需要,加入自己的参数,去掉不需要的参数。pix2pix-gan做医学图像合成的时候,如果把nii数据转成png格式会损失很多信息,以为png格式图像的灰度值有256阶,因此直接使用nii的医学图像做输入会更好一点。在自己构建数据层时都要基于这个类,类似于C++中的虚基类。自己构建的数据层包含三个部分。原创 2023-07-10 16:32:02 · 657 阅读 · 0 评论 -
CVPR2021|| Coordinate Attention注意力机制
Paper:https://arxiv.org/pdf/2103.02907.pdfGitHub:https://github.com/Andrew-Qibin/CoordAttention轻量,优秀,好用!讲之前我们先回顾一下以前的SE与CBAMSESE比较简单,看一下结构图差不多就能理解了,如果有些实现不太懂的,可以借鉴一下CBAM的。但SE只考虑内部通道信息而忽略了位置信息的重要性,而视觉中轻量,优秀,好用!转载 2023-07-03 19:14:03 · 2370 阅读 · 0 评论 -
UTNet:A Hybrid Transformer Architecture for Medical Image Segmentation
再通过堆叠不同层次提取的局部特征,逐步扩大感受野,获得更高层次的全局特征。Fig 2分别展示了在Transformer encoder和decoder中使用的多头自注意力模块(MHSA),他们流程相似,但是decoder中输入有两个,一个是通过skip connection连接过来的encoder的特征图,一个则是decoder前一层的低分辨率的feature map。这一相似程度随后会作为权重 乘以value的值,这样就计算出了注意力,并且基于的感受野是全局的感受野,是将所有的输入都考虑其中的。翻译 2023-05-07 20:51:27 · 215 阅读 · 0 评论 -
银行业哥伦比亚比索纸币检测
介绍假钞很容易成为小型和大型企业的问题。当这些钞票不是真的时,能够识别这些钞票是非常重要的。对于日常与现金打交道的商务人士和个人而言,此过程可能非常耗时。这就需要通过自动化来实现这一目标。因此,我们认为有必要开发一种自动机器学习假钞检测模型,即使是非专业人士也可以使用它来检测这些钞票的真伪。本文介绍了一个实际项目,我们在该项目中开发了一个深度学习和图像分类在银行业中的应用的真实原型。目标是使用现实生活中的问题场景完成机器学习演示。我们将从数据采集和深度清理/预处理到简单地部署经过训练的模型。原创 2023-04-07 10:26:07 · 245 阅读 · 0 评论 -
医学影像篇
研究前我们先要做好准备工作:(这个准备工作呢就好像小白做菜)最开始,我们往往主动提出或者被提出了一个临床问题(临床问题可能是老板直接安排的,也可能是在临床工作中提出经过文献调研归纳的),根据提出的临床问题和手头现有的病例,可以建立一个简化版的科学假设(例如:在xxx疾病中,影像组学模型可以预测/辅助诊断xxx结局;或者是影像组学特征可以反应xxx疾病的病理/生理异质性);(今晚老婆不在家,要自己做饭了,根据我平时吃饭的经验…)原创 2022-12-15 14:26:57 · 2504 阅读 · 0 评论 -
端侧softmax优化
当前我们在做端侧的AI处理的时候,很难百分百的将整个网络的推理过程做到一个graph里面。于是我们将AI在端侧的推理过程一般化,可以分成如下三个过程:(1)网络预处理(2)网络主体推理(3)网络后处理。我们取常见的几个AI任务进行分析,第一个我们先看看分类任务。还是套用上述的三个过程:(1)网络预处理:减均值除方差,数据白化等(2)网络主体推理:graph-inference(resnet、mobilenet、shufflenet等等)(3)网络后处理:softmax、sigmoid第二个我们可以看看检测任转载 2022-12-08 16:03:15 · 326 阅读 · 0 评论 -
爱奇艺在DCN、EDVR等 4K 超分模型上的 10倍加速实践
但很遗憾的是TensorRT7对于这种全新int8的转换方式支持还是有问题的,其中一个最大的问题就是卷积中的bias系数转换的时候弄错了,本应该乘的系数,变成了除,导致加入CNN中如果卷积有bias,那么它的精度将大幅下降。其实这个不是TensorRT一家的问题,对于TensorRT立志成为的通用深度学习编译器来说,深度学习模型和框架迭代非常快速,各种模型的计算需求层出不穷,想要归一化成为一个通用的IR表示是非常的困难,更不用说将模型推向性能的极致。QAT finetune过程是一个伪量化的过程。转载 2022-12-08 14:41:14 · 386 阅读 · 0 评论 -
调研。。。
SUNet-MTUNetsegmentation_mtunetUTNettransunetswinunet一篇水文:论文阅读——AG-Net:Attention Guided Network for Retinal Image Segmentation_黄小米吖的博客-CSDN博客原创 2022-12-06 22:38:37 · 165 阅读 · 0 评论 -
瓷砖表面瑕疵质检
经前期调研,瓷砖生产环节一般(不同类型砖工艺不一样,这里以抛釉砖为例)经过原材料混合研磨、脱水、压胚、喷墨印花、淋釉、烧制、抛光,最后进行质量检测和包装。最近天池上线的广东工业赛事针对瓷砖表面瑕疵进行智能检测,要求选手们相应的算法,尽可能快与准确的给出瓷砖疵点具体的位置和类别,主要考察疵点的定位和分类能力。工业缺陷检测是当前深度学习落地的热门项目,其中瓷砖生产过程中的“质量检测环节”需要检测出瓷砖表面的瑕疵,目前比较依赖于人工,效果和效率都层次不齐。花色简单,数量总共约12000张,包含训练集和测试集.转载 2022-08-19 11:25:39 · 1286 阅读 · 0 评论 -
智能盘点钢筋数量AI识别
大赛介绍2019数字中国创新大赛(DigitalChinaInnovationContest,DCIC2019)由福建省数字福建建设领导小组办公室、福建省工业和信息化厅、福州市人民政府、中国电子信息产业发展研究院、数字中国研究院和中国互联网投资基金联合主办,第十二届全国政协副主席王钦敏担任大赛总顾问。作为第二届数字中国建设峰会的重要组成部分,本届赛事分为大数据、人工智能、工业互联网三大类算法题,旨在解决数字经济建设发展中的痛点、难点,推动新一代信息技术和传统产业的深入融合,助力数字中国建设。........原创 2022-08-02 14:10:16 · 862 阅读 · 0 评论 -
BAT卖不动「医疗云」:医院逃离、山头林立、行有行规
复盘互联网厂商卖云与医院上云之路,雷峰网与多位三甲医院的信息中心主任、云公司高管进行了深入探讨,得出的一个结论是医院上云,要改写医疗行业内的技术守成、价值格局,这将是一个艰深且漫长的博弈过程。一个折中的办法,是承接城市级的云,将医疗作为其中一个部分,“间接”获得一部分的数据,但是核心的东西还是在运营商管控下的城市级云中。2018年5月,腾讯曾推出一款智能导诊产品——腾讯睿知,患者登陆接入睿知的医院公众号,直接口述病症就可获取有关具体疾病、对应科室、合适医生的信息,最终实现“精准挂号”。......原创 2022-07-26 16:58:06 · 573 阅读 · 1 评论 -
英特尔软硬优化,赋能东软加速智慧医疗时代到来
让医疗数据在相关医疗机构之间、医疗机构与上级主管单位乃至医疗机构与个人患者之间高效、快速、隐私和安全地共享流转与应用,离不开强大的云,同时当前以人工智能为代表的新兴技术,在医学诊断辅助诊断、疾病预测,可穿戴设备健康管理、智慧医院等各领域,也正不断赋能医疗行业。该平台拥有共享式医疗大数据科研平台工具集(包括知识服务平台、数据科学平台、医疗数据结构化平台等)和医疗语料库、用药知识库、诊疗知识库、健康知识图谱、医疗知识图谱等医疗数据集,支撑医疗专家与医疗科研咨询人员以云模式使用这些工具开展医疗科研工作。...原创 2022-07-26 16:40:21 · 713 阅读 · 0 评论 -
英特尔助力开立医疗推动超声产检智能化
测试配置英特尔®酷睿™i7-1185GRE处理器@2.80GHz,英特尔锐炬®Xe显卡@1.35GHz,96EU,ubuntu20.04,英特尔®oneAPIDPC++/C++编译器,英特尔®DPC++CompatibilityTool,英特尔®oneAPIDPC++Library,英特尔®IntegratedPerformancePrimitives,英特尔®VTune™Profiler。然而传统的产前超声检查对于医师的专业能力要求较高,且耗时耗力。...转载 2022-07-15 15:18:16 · 120 阅读 · 0 评论 -
驾驶员监控DMS
作者 | 黄浴(奇点汽车美研中心首席科学家兼总裁)来源 | https://zhuanlan.zhihu.com/p/68127887驾驶员监控系统(driver monitoring system,DMS)一般是对L2-L3级别的自动驾驶系统而言的,对L4级别是没有意义的,除非系统仍然是需要安全员的测试环节。监控的目的是发现驾驶员走神(distraction)、疲劳(fatigue)或者打瞌睡(drowsiness),甚至出现无法驾驶的意外情况,比如欺骗辅助驾驶系统用矿泉水代替双手在方向盘上,或者与乘客争转载 2022-07-12 17:43:53 · 624 阅读 · 0 评论 -
商汤智慧医疗团队研究员解读智慧医疗下的器官图像处理
提纲Part 1 智慧医疗下的器官图像分割技术● Introduction● 针对样本不平衡与对抗形状约束的放疗危及器官分割框架● 基于协同训练和平均模型的多器官分割● What's nextPart 2 Q&A智慧医疗下的器官图像分割技术1. Introduction放疗(Radiotherapy)是肿瘤的主流治疗方法。据世界卫生组织的数据显示,大约有70%的癌症患者需要接受放射治疗。放疗利用高能射线打入患者的体内,从而去破坏癌细胞的DNA结构,达到彻底杀死癌细胞的目的。但高能射线的放射性对于正常的组织转载 2022-06-15 19:00:12 · 655 阅读 · 0 评论 -
yolov5的工业缺陷检测
比赛介绍工业缺陷检测是当前深度学习落地的热门项目,其中瓷砖生产过程中的“质量检测环节”需要检测出瓷砖表面的瑕疵,目前比较依赖于人工,效果和效率都层次不齐。最近天池上线的广东工业赛事针对瓷砖表面瑕疵进行智能检测,要求选手们相应的算法,尽可能快与准确的给出瓷砖疵点具体的位置和类别,主要考察疵点的定位和分类能力。在本篇文章中,主要为大家介绍选择yolov5作为基线的方案,供大家参考。基于yolov5的方案线上结果: 切成 640x640 滑动窗口预测,耗时<1.5 h, 平均一转载 2022-05-26 13:31:05 · 3652 阅读 · 7 评论 -
传统方法的pcb缺陷检测
本文转载自新机器视觉,文章仅用于学术分享。基于统计分类的方法:(1)基于KNN方法(最近邻法):利用相似度,找出k个训练样本,然后打分,按得分值排序。(2)基于Naive Bayes算法:计算概率,构建分类模型。引导: 医生对病人进行诊断就是一个典型的分类过程,任何一个医生都无法直接看到病人的病情,只能观察病人表现出的症状和各种化验检测数据来推断病情,这时医生就好比一个分类器,而这个医生诊断的准确率,与他当初受到的教育方式(构造方法)、病人的症状是否突出(待分类数据的特性)以...转载 2022-05-26 13:36:54 · 2282 阅读 · 0 评论 -
创材深造:AI + 金属材料:更适合产业落地的方向
编辑/凯霞3 月 23 日,在机器之心 AI 科技年会上,创材深造创始人兼 CEO 王轩泽在「AI x Science 论坛」分享了主题为《AI + 金属材料:更适合产业落地的方向》的相关内容。分享就 AI 产业落地过程中可能遇到的问题进行了讨论,包括精度陷阱;行业壁垒并非技术,传统大厂转型自研;某些 toB 领域存在的一些问题;黑盒性质严重,客户不认可,短期内取代不了关键岗位人员;算法效果惊艳但落地艰难等精彩观点。王轩泽介绍说,AI 赋能金属材料的产业化,可以有效地规避或解决上述 AI 落地中转载 2022-05-13 13:28:21 · 547 阅读 · 0 评论 -
数坤科技:AI在医疗影像的应用和探索
机器之心编辑部3 月 23 日,在机器之心 AI 科技年会上,数坤科技研发副总裁危夷晨发表了主题演讲《AI 在医疗影像的应用和探索》,对 AI + 医疗影像行业进行了全面的介绍。以下为危夷晨在机器之心 AI 科技年会上的演讲内容,机器之心进行了不改变原意的编辑、整理:感谢机器之心邀请我来参加这次活动,我是数坤科技的危夷晨。我长期从事计算机视觉方面的科研和产品研发,之前在旷视科技和微软亚洲研究院工作。最近我加入了数坤科技,从事 AI 医疗影像方面的技术研发。这...原创 2022-05-13 13:25:31 · 832 阅读 · 0 评论 -
黑夜也能五颜六色,用深度学习实现全彩夜视系统
加州大学欧文分校的这项研究,让我们更期待未来更先进的彩色夜视仪。其实是很容易想到的图像增强手段,在一些军事大片中,士兵头戴夜视仪搜索前进似乎是少不了的场景。使用红外光在黑夜中观察的夜视系统通常将视物渲染成单色图像。图源:flir.com不过,在最近的一项研究中,加州大学欧文分校的科学家们借助深度学习 AI 技术设计了一新方法,有了这种方法,红外视觉有助于在无光条件下看到场景中的可见颜色。研究共同一作、加州大学欧文分校工程师、外科医生和视觉科学家 Andrew Brow.转载 2022-04-19 11:31:23 · 565 阅读 · 0 评论 -
成功检测远距离目标,将点云与RGB图像结合,谷歌&Waymo提出新算法:4D-Net
编者荐语来自谷歌的研究者提出了一种利用 3D 点云和 RGB 感知信息的 3D 物体检测方法:4D-Net。4D-Net 能够更好地使用运动线索和密集图像信息,成功地检测遥远的目标。转载自丨机器之心如今自动驾驶汽车和机器人能够通过激光雷达、摄像头等各种传感捕获信息。作为一种传感器,LiDAR 使用光脉冲测量场景中目标的 3D 坐标,但是其存在稀疏、范围有限等缺点——离传感器越远,返回的点就越少。这意味着远处的目标可能只得到少数几个点,或者根本没有,而且可能无法单独被 LiDAR 采集到。转载 2022-04-19 11:22:01 · 289 阅读 · 0 评论 -
像堆乐高一样解释神经网络的数学过程
选自:Medium作者:Omar U.Florez参与:Nurhachu Null、张倩模型的训练、调参是一项非常费时费力的工作,了解神经网络内部的数学原理有利于快速找出问题所在。本文作者从零开始,一步一步讲解了训练神经网络时所用到的数学过程。神经网络是线性模块和非线性模块的巧妙排列。当聪明地选择并连接这些模块时,我们就得到了一个强大的工具来逼近任何一个数学函数,如一个能够借助非线性决策边界进行分类的神经网络。运行代码的步骤如下:git clone https://github..转载 2022-04-19 11:10:21 · 164 阅读 · 0 评论 -
CNN和小波变换的视频监控中的火灾探测
本次介绍的文章是2022年发表在EngineeringApplications of Artificial Intelligence上的一篇关于火灾检测的文章,作者团队来自清华大学。2. 摘要火灾是威胁公共安全和社会发展的最常见的突发事件之一。近年来,以卷积神经网络为代表的智能火灾探测技术受到了学术界和工业界的广泛关注,大大提高了火灾探测的精度。然而,基于CNN的火灾探测系统仍然受到虚警的干扰和计算能力的限制。本文利用传统光谱分析在火灾图像检测技术中的优势,提出了一种新的小波- CNN方法,该方法利转载 2022-04-08 10:32:05 · 791 阅读 · 0 评论 -
面板缺陷视觉检测方案丨机器视觉技术数字化的降本增效
液晶面板行业的崛起,带动面板质检需求的暴增。传统的缺陷检测主要由人眼辨别,这给企业把控生产质量和提高生产效率,带来巨大困难。有鉴于此,采用一种新型的面板质量检测方式来代替人工检测是亟待解决的技术问题。行业痛点产品面积大产能高,人工无法做到每张都检测,存在漏检风险液晶面板未切割前通常面积很大,以10.5代线为例,整张面板面积可达到3370mm*2940mm,人工检测难度极大、易疲劳,采用人工检测不能保证产能及准确性。面板缺陷极易导致产品出现破碎液晶面板生产过程中会概率性出现崩边转载 2021-12-23 09:37:38 · 541 阅读 · 1 评论 -
TensorRT Inference Server 教程
通过一个简单易懂,方便快捷的教程,部署一套完整的深度学习模型,一定程度可以满足部分工业界需求。对于不需要自己重写服务接口的团队来说,使用 tesorrt inference sever 作为服务,也足够了。这里采取的案例是 centernet 检测,SSD,YOLO 系列都比较古老了,虽然教程也比较多,但是都不够简洁而且相对思想比较老,稍微用点新的。本教程使用的检测模型暂时不提供 model zoo,主要原因是官方 release 的 model 都带 DCN 模块,这个模块有 c++ 层面的库,作转载 2021-12-07 18:28:49 · 578 阅读 · 1 评论