公众号内容拓展学习笔记(2022.3.5)
📎 今日要点
-
上海交大提出CDNet:基于改进YOLOv5的斑马线和汽车过线行为检测 ⭐️⭐️
- Abstract: 基于改进YOLOv5的斑马线和汽车过线行为检测CDNet
- Paper: CDNet: A Real-Time and Robust Crosswalk Detection Network on Jetson Nano Based on YOLOv5
- Code: https://github.com/zhangzhengde0225/CDNet
- Tips: 本研究提出基于改进YOLOv5的人行横道检测网络(CDNet),实现车载摄像头视觉下快速准确的人行横道检测,并在Jetson nano设备上实现实时检测。
-
图像自适应YOLO:模糊环境下的目标检测(附源代码) ⭐️⭐️
- Abstract: 一种新颖的图像自适应YOLO (IA-YOLO) 框架
- Paper: MVPTR: Multi-Stage Vision-Language Pre-Training via Multi-Level Semantic Alignment
- Code: https://github.com/wenyyu/ImageAdaptive-YOLO
- Tips: 研究者提出了一个可微分图像处理 (DIP) 模块来考虑YOLO检测器的不利天气条件,其参数由小型卷积神经网络(CNN-PP)预测。以端到端的方式联合学习CNN-PP和YOLOv3,这确保了CNN-PP可以学习适当的DIP,以弱监督的方式增强图像以进行检测。
-
你玩的音游可能真是AI生成的,Love Live!工作室发了篇论文,用AI节省50%作谱时间 ⭐️⭐️
- Abstract: Love Live!工作室发了篇论文,用AI生成音游曲谱节省50%作谱时间
- Paper: GenéLive! Generating Rhythm Actions in Love Live!
- Code: https://github.com/chrisdonahue/ddc
- Tips: GenéLive利用卷积堆栈进一步提取音频特征,加深AI对乐曲本身的理解,同时增加专门用于分析节拍信息的Bi-LSTM,以便于AI生成更能表达情绪的谱面。
-
- Abstract: iFLYTEK 2021高分辨率遥感影像提取方案
- Paper: The Winning Solution to the iFLYTEK Challenge 2021 Cultivated Land Extraction from High-Resolution Remote Sensing Image
- Tips: 本文构建了一条高效的高分辨率遥感图像耕地提取流程,提供了详细的overlap-tile融合策略,以生成无缝和连续的分割结果。
-
OCR光学字符识别方法汇总(附开源代码) ⭐️⭐️
- Abstract: OCR光学字符识别方法汇总(附开源代码)
- Code: https://github.com/ouyanghuiyu/chineseocr_lite
- Tips: 目前比较常用的中文OCR开源项目是 chineseocr,最近又有一个新开源的中文OCR项目,登上Github Trending榜单第二——chineseocr_lite
-
一文看尽 CVPR2022 最新 22 篇论文(附打包下载) ⭐️⭐️
- Abstract: 一文看尽 CVPR2022 最新 22 篇论文
- Address: https://bbs.cvmart.net/articles/6124
- Tips: 本文汇总了22篇最新放出的CVPR 2022网络架构设计、姿态估计、语义分割、动作检测、三维视觉等方向的论文,附文章打包下载地址。