开发物体识别桌、_Socionext联手大阪大学合作开发新型深度学习算法

SoC设计与应用技术领导厂商Socionext Inc.(以下“Socionext”,或“公司”)宣布,联合大阪大学数据能力科学研究所长原教授研究小组共同开发新型深度学习算法,该算法无需制作庞大的数据集,只需通过融合多个模型便可在极度弱光的条件下进行精准检测物体及图像识别。Socionext笹川幸宏先生和大阪大学长原教授在8月23日至28日(英国夏令时间)举办的欧洲计算机视觉国际会议(ECCV 2020)上报告了这一研究成果。

近年来尽管计算机视觉技术取得了飞速发展,但在低照度环境下车载摄像头、安防系统等获取的图像质量仍不理想,图像辨识性能较差。不断提升低照度环境下图像识别性能依旧是目前计算机视觉技术面临的主要课题之一。CVPR2018中一篇名为《Learning to See in the Dark》的论文曾介绍过利用图像传感器的RAW图像数据的深度学习算法,但这种算法需要制作超过200,000张图像和150多万个批注数据集才能进行端到端学习,既费时又费钱,难以实现商业化落地(如下图1)。

fb72fca2f2b8c9718e3786ecd59ec842.png

图1:《Learning to See in the Dark》及RAW 图像识别课题

为解决上述课题,Socionext与大阪大学联合研究团队通过迁移学习(Transfer Learning)和知识蒸馏(Knowledge Distillation)等机器学习方法,提出采用领域自适应(Domain Adaptation)的学习方法,即利用现有数据集来提升目标域模型的性能,具体内容如下(如图2):

(1)使用现有数据集构建推理模型;

(2)通过迁移学习从上述推理模型中提取知识;

(3)利用Glue layer合并模型;

(4)通过知识蒸馏建立并生成模型。

fc2d1b0b5701c036aa239c2091ab6e55.png

图2:本次开发的领域适应方法(Domain Adaptation Method)

此外,结合领域自适应方法和物体检测YOLO模型,并利用在极端弱光条件下拍摄的RAW图像还可构建“YOLO in the Dark”检测模型。YOLO in the Dark模型可仅通过现有数据集实现对RAW图像的对象检测模型的学习。针对那些通过使用现有YOLO模型,校正图像亮度后仍无法检测到图像的(如下图a),则可以通过直接识别RAW图像确认到物体被正常检测(如下图b)。同时测试结果发现,YOLO in the Dark模型识别处理时所需的处理量约为常规模型组合(如下图c)的一半左右。

963d9917a12b70cfd77d09a155c600a2.png

图3:《YOLO in the Dark》效果图

本次利用领域自适应法所开发的“直接识别RAW图像”可不仅应用于极端黑暗条件下的物体检测,还可应用于车载摄像头、安防系统和工业等多个领域。未来,Socionext还计划将该技术整合到公司自主研发的图像信号处理器(ISP)中开发下一代SoC,并基于此类SoC开发全新摄像系统,进一步提升公司产品性能,助力产业再升级。(一鸣)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大阪歯科大学 患者さんのための歯科用語集 日文PDF 大阪歯科大学は、平成5(1993)年に公開講座をスタートいたしました。市民 の皆さまと「お口の健康」について共に学ぶことを目的に、毎年、最新の話題 をテーマとして、これまで多彩な講座を開講してまいりました。夏は附属病院の ある天満橋学舎、冬は楠葉学舎と、年2回開催で、今年ではや22回目を迎え ることができました。今日まで一度も滞ることなく実施することができましたのは、 皆さまからのご支援の賜物と、深く感謝いたしております。 さて、回を重ねるごとに、ご参加の皆さまより、さまざまなご意見を伺います。 中でも多いのが、「専門用語の難しさ」についてです。歯科や医学の専門用語 については、できるだけわかりやすい言葉でお伝えできるよう心がけておりますが、 これが簡単なようでなかなか大変なことであります。専門用語には、その分野の さまざまな概念が組み込まれており、これを一般の言葉に置き換えて話そうとすれ ば、かえって説明口調に陥り、その本質をお伝えできないことにもなりかねません。 そこで、このたび歯科医療において使われる基本的な用語についてまとめ、 小冊子として発行いたしました。公開講座の時のみならず、日常的にもご活用 いただければ幸いです。
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。
### 回答1: 以下是一些用于表情识别的数据集: 1. CK+:由加拿大多伦多大学的情感计算实验室创建,包括593个静态面部表情图像和8个动态面部表情视频。 2. JAFFE:日本大阪大学的情感计算实验室收集的静态面部表情图像,包括7种基本表情,每种表情有10个样本。 3. FER2013:由Google开发,包括35,887个面部表情图像,标记为7种基本表情。 4. AffectNet:由美国的亚利桑那州立大学和印度的德里技术大学合作创建,包括一百万张面部表情图像,标记为11个情感类别。 5. Emotionet:由德克萨斯A&M大学的研究人员创建,包括45个面部表情类别和250,000张图像。 6. MMI Facial Expression Database:由荷兰的Twente大学的多媒体信息实验室创建,包括超过2800个面部表情图像和动态视频,记录了3D表情运动。 7. BU-3DFE:由美国波士顿大学创建,包括100个参与者的超过250,000张图像,记录了不同的面部表情,姿态和光照条件。 这些数据集可以用于开发和评估表情识别算法和模型,有助于推动该领域的研究和发展。 ### 回答2: 表情识别是一种通过分析面部表情来识别和理解人类情感状态的技术。以下是一些常用于表情识别的数据集: 1. 阿姆斯特丹动态面部表情数据库(AMFED):这是一个包含面部动态表情的公开数据集,包括各种情感状态的面部表情。 2. 静态和动态的面部表情数据集(CK+):这是一个带有人工标注的数据集,包含了来自各种国籍和文化背景的参与者的面部表情,用于情感分类和识别任务。 3. 非基于语义的情感分析(FER2013):这是一个大规模的公开数据集,包含来自互联网的近80,000张面部表情图像,标记了七个不同的情感类别。 4. 面部动作与视觉表情数据集(Oulu-CASIA):这是一个包含了来自各种情感和年龄组的面部表情的数据集,适用于面部动作识别和情感分类任务。 5. 面部表情图像与3D面部动作数据集(BU-3DFE):这是一个包含了2D和3D面部表情数据的数据集,可用于情感识别和面部动作分析。 这些数据集提供了丰富的面部表情图像和相关的标签,可以用于训练和评估表情识别算法的准确性和性能。 ### 回答3: 用于表情识别的数据集有许多,以下是其中一些常用的数据集: 1. CK+(Cohn-Kanade+):这是一个包含各种面部表情的数据集,由Cohn-Kanade研究团队创建。它包含了一系列面部表情的视频和静态图像,被广泛用于表情识别算法开发和评估。 2. FER2013:这是一个公开的人脸表情数据集,由Kaggle举办的FER(面部表情识别)竞赛提供。该数据集包含了超过35,000张大小为48x48像素的灰度图像,标注了7种不同的表情类别。 3. MMI(Multi-Modal Emotion Recognition):这是一个多模态的情绪识别数据集,由挪威奥斯陆大学的情绪计算实验室(UiO)创建。该数据集包含了来自不同表情数据库的视频和音频记录,并提供了多个感官的表情标注。 4. AffectNet:这是一个大规模的面部表情数据集,包含了超过1百万个图像,标注了11种不同的表情类别。该数据集由纽约大学的研究团队创建,旨在为深度学习算法提供充足的训练材料。 5. RAF-DB(Ryerson Audio-Visual Database of Emotional Speech and Song):这是一个音频视觉情感数据库,包含了来自电影、电视剧、广告、歌曲等不同来源的音频和视频记录。该数据集中的表情标注较为细致,被广泛用于研究情感识别与情感合成。 除了上述数据集,还有许多其他的表情识别数据集可供选择,每个数据集都有其特定的优劣和应用场景。研究人员和开发者可以根据自己的需求和研究方向选择适合的数据集来进行表情识别算法的实验和评估。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值