深圳季连AIgraphX
码龄6年
关注
提问 私信
  • 博客:116,906
    社区:3
    116,909
    总访问量
  • 83
    原创
  • 16,694
    排名
  • 2,700
    粉丝
  • 学习成就

个人简介:发展通用人工智能,让未来出行与数字物流更加智能和安全

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2019-05-08
博客简介:

AIgraphX

查看详细资料
  • 原力等级
    成就
    当前等级
    5
    当前总分
    1,044
    当月
    8
个人成就
  • 获得1,313次点赞
  • 内容获得22次评论
  • 获得1,647次收藏
创作历程
  • 59篇
    2024年
  • 24篇
    2023年
成就勋章
TA的专栏
  • aiXpilot 智驾大模型1
    付费
    58篇
  • ADAS 高级驾驶辅助系统
  • AEB 自动紧急制动系统原理及产品实现
    13篇
  • ACC 自适应巡航控制系统原理及产品实现
    7篇
  • NAP 高阶智能辅助驾驶
  • aiXplay 自动驾驶系统
    3篇
兴趣领域 设置
  • 人工智能
    自动驾驶智慧城市
  • AIGC
    stable diffusion
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

软件定义汽车时代,当前智能汽车软件开发模式是什么?

软件定义汽车,EE架构从分布式向中央计算演进。
原创
发布博客 2024.10.17 ·
427 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

未来汽车究竟该是什么样子?

未来汽车可以遵从先锋重构美学,从都市活力、智慧灵气、沉侵体验三个维度进行诠释,增加出行体验。
原创
发布博客 2024.10.16 ·
509 阅读 ·
2 点赞 ·
1 评论 ·
1 收藏

51-63 VADv2: End-to-End Vectorized Autonomous Driving via Probabilistic Planning 基于概率规划的端到端自动驾驶

基于概率规划的端到端、矢量驾驶模型VADv2,性能远超同期多模态大语言驾驶模型DriveMLM。
原创
发布博客 2024.07.17 ·
975 阅读 ·
11 点赞 ·
1 评论 ·
13 收藏

51-62 Autonomous Grand Challenge at the CVPR 2024 Workshop | 自动驾驶挑战赛获奖作品

参赛选手分别在端到端、无图、占用网络等领域提交了自己的解决方案。
原创
发布博客 2024.07.08 ·
1009 阅读 ·
27 点赞 ·
1 评论 ·
26 收藏

51-61 CVPR 2024 最佳论文 | Rich Human Feedback for Text-to-Image Generation

受大模型中RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型,提出了先进的RichHF-18K数据集和多模态RAHF模型。
原创
发布博客 2024.06.26 ·
1508 阅读 ·
32 点赞 ·
0 评论 ·
30 收藏

51-60 CVPR 2024 最佳论文 | Generative Image Dynamics

将傅里叶域中密集、长期的运动建模为频谱体积,并通过渲染模块对从频谱体积转换的运动纹理生成动画,实现单个静止图像的动画。
原创
发布博客 2024.06.24 ·
1627 阅读 ·
22 点赞 ·
1 评论 ·
20 收藏

51-59 CVPR 2024 | ChatSiM:Editable Scene Simulation for Autonomous Driving via Collaborative LLM

ChatSim利用了大型语言模型LLM智能体协作框架,采用了一种新颖的多摄像头神经辐射场McNeRF和多摄像头照明估计McLight方法实现了自动驾驶场景可编辑与生成。
原创
发布博客 2024.06.14 ·
1024 阅读 ·
32 点赞 ·
0 评论 ·
22 收藏

51-58 CVPR 2024 Bosch博世出品 | VLP: Vision Language Planning for Autonomous Driving

视觉语言规划VLP模型使ADS具有模仿人类常识的能力,并参与安全运动规划的上下文推理。
原创
发布博客 2024.06.12 ·
1184 阅读 ·
17 点赞 ·
0 评论 ·
12 收藏

51-57 CVPR 2024 | Cam4DOcc:自动驾驶应用中仅摄像机4D占用预测基准

本文提出了一种仅摄像机4D占用预测的新基准Cam4Occ,同时引入端到端时空网络OCFNet,预测当前和未来4D占用。
原创
发布博客 2024.06.11 ·
2251 阅读 ·
18 点赞 ·
1 评论 ·
16 收藏

51-55 CVPR 2024 | AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving

本文利用视觉语言模型VLM、大型语言模型LLM设计了一个自动化数据引擎AIDE。该引擎可以自动识别问题、有效地整理数据、通过自动标注改进模型,并通过生成不同的场景来验证模型。
原创
发布博客 2024.06.06 ·
972 阅读 ·
30 点赞 ·
0 评论 ·
29 收藏

51-56 CVPR 2024 | UniPAD:A Universal Pre-training Paradigm for Autonomous Driving 自动驾驶的通用预训练范式

UniPAD提出了一种自动驾驶通用的自监督预训练范式,巧妙地将NeRF作为统一的3D渲染解码器,使其能够无缝集成到2D和3D框架中。
原创
发布博客 2024.06.03 ·
926 阅读 ·
29 点赞 ·
0 评论 ·
9 收藏

51-54 CVPR 2024 | DrivingGaussian:周围动态自动驾驶场景的复合高斯飞溅( Sora能制作动作大片还需要一段时间 )

DrivingGaussian采用复合高斯飞溅进行全局渲染,用于表示周围动态自动驾驶场景,在多运动对象、多相机一致性以及高保真度上实现了优秀的性能。
原创
发布博客 2024.05.27 ·
1279 阅读 ·
13 点赞 ·
0 评论 ·
26 收藏

51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预训练场景理解 (含模型数据流梳理)

DriveWorld在UniAD的基础上又有所成长,提升了自动驾驶目标检测、目标追踪、3D占用、运动预测及规划的性能。
原创
发布博客 2024.05.21 ·
1384 阅读 ·
28 点赞 ·
1 评论 ·
25 收藏

51-52 CVPR 2024 | Generalized Predictive Model for Autonomous Driving,自动驾驶通用预测模型

作者提出了通用的大规模自动驾驶视频预测模型GenAD,在实现过程中,进一步提出了迄今为止最大的自动驾驶场景训练数据集OpenDV-2K。
原创
发布博客 2024.05.18 ·
1204 阅读 ·
17 点赞 ·
0 评论 ·
23 收藏

51-51 CVPR 2024 | Panacea:自动驾驶全景可控视频生成

作者提出了全景可控自动驾驶视频生成模型Panacea,同时也制作了一个新自动驾驶视频数据集Gen-nuScenes。
原创
发布博客 2024.05.16 ·
1130 阅读 ·
21 点赞 ·
0 评论 ·
25 收藏

51-50 两万字长文解读ControlNet论文和代码,以及自定义模型训练和图片精确控制生成实验

本文解读了2023最佳论文ControlNet的论文和代码,同时完成了“自定义”数据集训练和图像精确生成控制测试。
原创
发布博客 2024.05.13 ·
1343 阅读 ·
26 点赞 ·
0 评论 ·
28 收藏

51-49 CVPR 2024 | OMG:通过混合控制器实现开放词汇的运动生成

OMG从零样本开放词汇文本提示中生成引人注目的动作。这款控制器关键思想是将 pretrain-then-finetune 范式运用到文本-运动的生成中,主要贡献是扩大了模型和数据集大小,以及引入motion ControlNet和混合控制MoC块,实现了文本和运动特征对齐。
原创
发布博客 2024.05.06 ·
1244 阅读 ·
31 点赞 ·
0 评论 ·
12 收藏

51-48 CVPR 2024 | Vlogger: make your dream a vlog 自编剧制作视频博客

为处理复杂的故事情节和多样化的场景,本文提出了一个名为Vlogger的通用AI系统,将长视频生成任务优雅地分解为四个关键阶段,包括 (1) 剧本Script,(2) 演员Actor, (3)制作人ShowMaker 和 (4) 配音员Voicer。
原创
发布博客 2024.05.06 ·
1469 阅读 ·
13 点赞 ·
1 评论 ·
25 收藏

51-47 CVPR 2024 | DynVideo-E:利用动态NeRF对大规模运动和视角变化的视频编辑

DynVideo-E框架首次引入动态NeRF作为视频表示,通过人体姿态引导将视频信息聚合到3D背景空间和3D动态人体空间中,进而能对大规模运动、视图变化和以人为中心的视频进行编辑。
原创
发布博客 2024.04.29 ·
1043 阅读 ·
27 点赞 ·
0 评论 ·
10 收藏

51-46 MCDiff,可控视频合成的运动条件扩散模型

我们引入了 MCDiff 动作条件扩散模型,它从一帧图像和一组笔画开始生成细粒度的可控视频。MCDiff首先利用流补全模型F根据视频帧的语义理解和稀疏运动控制来预测稠密视频运动。然后,扩散预测模型G合成高质量的未来帧,形成输出视频。
原创
发布博客 2024.04.27 ·
660 阅读 ·
10 点赞 ·
0 评论 ·
27 收藏
加载更多