自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 Real-time object detection and 3D scene perception in self-driving cars

自动驾驶汽车领域正在快速发展,近年来取得了许多突破。自动驾驶汽车可以彻底改变交通运输,无人驾驶的未来将带来深远的好处,包括安全和环境激励[1],[2]。尖端研究有许多途径,世界各地许多领先的汽车研发集团[3]都在追求这一领域。美国汽车工程师协会(SAE)[4]定义了自动驾驶的六个级别,标准化了这项技术的进步,DARPA城市挑战赛[5]-[7]是朝着开发完全自动驾驶城市车辆迈出的重要一步。然而,实现这一潜力伴随着解决许多技术挑战。

2024-02-28 11:23:33 981

原创 A Survey for Foundation Models in Autonomous Driving

深度学习(DL)与自动驾驶(AD)的结合标志着该领域的重大飞跃,引起了学术界和工业界的关注。配备摄像头和激光雷达的AD系统模仿人类的决策过程。感知、预测和规划。感知,利用DL和计算机视觉算法,重点是对象检测和跟踪。预测交通代理的行为及其与自动驾驶车辆的交互。规划通常是分层结构的,涉及制定战略驾驶决策、计算最佳轨迹和执行车辆控制命令。基础模型的出现,特别是在自然语言处理和计算机视觉领域,为AD研究引入了新的维度。这些模型是不同的,因为它们是在广泛的网络规模数据集上训练的,而且参数大小很大。

2024-02-21 16:13:09 624

原创 Scene Understanding for Autonomous Driving Using Visual Question Answering

自动驾驶是一个快速发展的领域,有可能彻底改变交通运输。然而,自动驾驶汽车的决策过程可能是不透明和容易出错的,正如近年来发生的几起事故所证明的那样[22],[26]。由于自动驾驶任务涉及的高安全要求和高风险成本,可解释人工智能(XAI)正在成为自动驾驶最重要的组成部分之一,因为它旨在了解模型的决策过程。从机器学习模型中获得解释的一种方法是让它回答关于它用来做出决策的元素的问题。视觉问答(VQA)[1]旨在根据图像中存在的对象或主题提供问题的答案,也称为查询。

2024-01-25 00:30:35 891

原创 Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving

大型视觉语言模型(VLM)在自动驾驶领域引起了越来越多的兴趣,因为它们在复杂推理任务中的先进能力对于高度自主的车辆行为至关重要。尽管具有潜力,但由于缺乏带有注释推理链的数据集来解释驾驶中的决策过程,因此对自动驾驶系统的研究受到阻碍。为了弥补这一差距,我们提出了Reason 2Drive,一个基准数据集,超过600 K的视频文本对,旨在促进复杂驾驶环境中可解释推理的研究。我们明确地将自动驾驶过程描述为感知,预测和推理。

2024-01-24 19:00:36 944

原创 V∗: Guided Visual Search as a Core Mechanism in Multimodal LLMs

人类智能的标志之一是能够处理和整合多感官信息来执行复杂的任务。我们认知推理过程中涉及视觉信息的一个突出方面是进行视觉搜索的能力-在复杂的现实世界场景中有效识别和定位关键对象的过程。这种机制在与环境的交互中起着基础性的作用,并且无处不在,从在杂乱的桌子上找到钥匙到在人群中寻找朋友。此外,对于需要多个推理步骤的复杂任务来说,它也是必不可少的步骤。视觉搜索的复杂性在认知科学和视觉科学中已经研究了很长时间[37,46,48,50-52]。虽然视觉搜索对人类来说似乎很直观,但它实际上是一个。

2024-01-23 22:21:55 1007

原创 On the Road with GPT-4V(ision): Early Explorations of Visual-Language Model on Autonomous Driving

对自动驾驶技术的追求取决于感知、决策和控制系统的复杂集成。传统的方法,无论是数据驱动的还是基于规则的,都因无法把握复杂驾驶环境的细微差别和其他道路使用者的意图而受到阻碍。这一直是一个重要的瓶颈,特别是在开发安全可靠的自动驾驶所需的常识推理和细致入微的场景理解方面。视觉语言模型(VLM)的出现代表了实现完全自动驾驶汽车的新前沿。本报告对最新的VLM GPT-4V(Vision)及其在自动驾驶场景中的应用进行了详尽的评估。我们探索模型的能力,理解和推理驾驶场景,作出决定,并最终采取行动的能力的驱动程序。

2024-01-23 17:40:07 931

原创 LLM4Drive: A Survey of Large Language Models for Autonomous Driving

自动驾驶技术是交通和城市交通革命的催化剂,它有从基于规则的系统过渡到数据驱动战略的趋势。传统的基于模块的系统受到级联模块间累积误差和预设规则不灵活的限制。相比之下,端到端自动驾驶系统由于其完全数据驱动的训练过程,有可能避免错误积累,尽管由于其“黑匣子”性质,它们往往缺乏透明度,使决策的验证和可追溯性变得复杂。最近,大型语言模型(LLM)已经展示了理解上下文、逻辑推理和生成答案的能力。一个自然的想法是利用这些能力来实现自动驾驶。

2024-01-23 15:44:13 1190

原创 Vision Language Models in Autonomous Driving and Intelligent Transportation Systems

视觉语言模型(VLM)在自动驾驶(AD)和智能交通系统(ITS)领域的应用由于其出色的性能和利用大型语言模型(LLM)的能力而引起了广泛的关注。通过整合语言数据,车辆和交通系统能够深入了解现实世界的环境,提高驾驶安全性和效率。在这项工作中,我们提出了一个全面的调查在这一领域的语言模型的进展,包括当前的模型和数据集。此外,我们还探讨了潜在的应用和新兴的研究方向。最后,我们深入讨论了挑战和研究差距。本文旨在为研究者提供目前的工作和未来的发展趋势的VLM在AD和ITS。

2024-01-22 23:09:51 1135

原创 DriveLM: Driving with Graph Visual Question Answering

我们研究了如何将在网络规模数据上训练的视觉语言模型(VLM)集成到端到端驾驶系统中,以提高泛化能力并实现与人类用户的交互。虽然最近的方法通过单轮视觉问答(VQA)使VLM适应驾驶,但人类驾驶员在多个步骤中进行决策。从关键对象的定位开始,人类在采取行动之前估计对象交互。关键的见解是,我们提出的任务,图VQA,我们通过感知,预测和规划问答对建模图结构的推理,我们获得了一个合适的代理任务来模仿人类的推理过程。

2024-01-22 20:15:04 829

原创 Talk2BEV: Language-enhanced Bird’s-eye View Maps for Autonomous Driving

这项工作介绍了Talk 2BEV,这是一个大型视觉语言模型(LVLM)(指预处理微调的视觉语言模型;即,可以将文本和图像作为输入,并根据视觉上下文输出文本的模型)接口,用于自动驾驶环境中的鸟瞰图(BEV)地图。虽然现有的自动驾驶场景感知系统主要集中在预定义的(封闭的)对象类别和驾驶场景集合上,但Talk 2BEV将通用语言和视觉模型的最新进展与BEV结构化地图表示相结合,消除了对特定任务模型的需求。这使得单个系统能够满足各种自动驾驶任务,包括视觉和空间推理,预测交通参与者的意图以及基于视觉线索的决策。

2024-01-17 18:57:31 799

原创 Robust Real-time Multi-vehicle Collaboration on Asynchronous Sensors

协同感知显著提高了互联自主车辆的感知性能。它不是纯粹依靠范围有限的本地传感器,而是使多辆汽车和路边基础设施能够共享传感器数据,以协同感知环境。通过我们的研究,我们意识到,合作感知系统的性能是有限的,在现实世界的部署,由于(1)在数据融合过程中的传感器数据不同步和(2)闭塞区域的不准确定位。为了应对这些挑战,我们开发了RAO,这是一种创新的,有效的,轻量级的协作感知系统,通过我们新颖的运动补偿占用流量预测和按需数据共享。

2023-12-14 14:29:03 88

原创 Joint Foundation Model Caching and Inference of Generative AI Services for Edge Intelligence

在本文中,我们提出了一个联合基础模型缓存和推理框架,旨在通过在生成AI服务的提供过程中有效地管理缓存的PFMs和用户请求,来平衡推理延迟,准确性和资源消耗之间的权衡。具体而言,考虑到在上下文学习能力的PFMs,一个新的度量命名为上下文的年龄(AoC),提出了模型的新鲜度和相关性之间的例子在过去的演示和当前的服务请求。基于AOC,我们提出了一个最少的上下文缓存算法来管理缓存在边缘服务器的历史提示和推理结果的PFMs。数值结果表明,该算法可以降低系统成本相比,现有的基线,通过有效地利用上下文信息。

2023-11-30 14:23:39 66

原创 An Efficient Deep Reinforcement Learning Algorithm for Solving Imperfect Information Extensive-Form

在大规模不完全信息可拓形式博弈imperfect information extensive form games (IIEFGs)博弈中,学习纳什均衡Nash equilibrium (NE)的最流行方法之一是反事实遗憾最小化的神经变体neural variants of counterfactual regret minimization(CFR)。CFR是**跟随正规化领导者 FTRL(Follow The-Regularized-Leader)**的一个特例。

2023-10-28 16:02:39 160

翻译 Towards Vehicle-to-everything Autonomous Driving: A Survey on Collaborative Perception

Towards Vehicle-to-everything Autonomous Driving: A Survey on Collaborative Perception

2023-10-12 16:57:53 246

原创 cv2.error: OpenCV(4.6.0) :-1: error: (-5:Bad argument) in function ‘imshow‘

cv2.error: OpenCV(4.6.0) :-1: error: (-5:Bad argument) in function 'imshow'

2022-10-26 11:02:12 6746 1

原创 压缩成.tgz格式

Linux 文件压缩成tgz格式

2022-07-12 23:02:08 2888

原创 杨辉三角Java

杨辉三角public class yangHuiTest { public static void main(String[] args) { //1.声明并初始化二维数组 int [][] yangHui = new int [10][]; //2.给数组元素赋值 for(int i = 0;i < yangHui.length;i++) { yangHui[i] = new int [i + 1]; //给数组首元素赋值 yangHui[i][0] = yan

2022-03-08 15:43:50 203

原创 二进制位运算2

_04_是不是2的整数次方用一条语句判断一个整数是不是 ** 2 的整数次方2的整数次方,二进制中只有一个1(x-1)&x : 将x的二进制数中的低位1消去x: 01000x-1: 00111(x-1)&x:00000**public class _04_是不是2的整数次方 { public static void main(String[] args) { System.out.print("请输入任意整数:"); Scanner scanner = new

2022-03-08 15:30:56 390

原创 二进制位运算1

_01_唯一成对的数**问题描述1—1000这1000个数放在大小为1001的数组中,只有唯一的一个元素值重复,其他均只出现一次。每个数组元素只能访问一次,设计一个算法,将这个重复的元素找出来。不用辅助存储空间,能否设计一个算法实现?题解分析我们知道,在位运算中,a^a = 0,b^0 = b。这样我们可以利用这个性质将不重复的数都消掉,就可以得到重复的那个数了。但是1—1000中只有一个数是重复的,如果我们直接将这1001个数进行异或,就会将这个重复的数给消去。仔细想一想,我们可以这样:我

2022-03-08 15:28:05 376

原创 图——DFS和BFS

DFSpublic class dfs { private static String[] nodeName = {"A","B","C","D"}; private static int Max = Integer.MAX_VALUE; private static int [][]maxtix = new int[][] { {0,1,Max,1}, {Max,0,1,Max}, {Max,Max,0,Max}, {Max,Max,Max,0}, }; public stat

2022-03-08 15:23:47 74

原创 排序——冒泡排序

冒泡排序public class 冒泡排序 { public static void main(String[] args) { int num[]= {9,8,7,6,5,4,3,2,1}; int temp = 0; for(int i = 0;i<num.length-1;i++) { for(int j = 0;j<num.length-i-1;j++) { if(num[j+1]<num[j]) { temp = num[j+1];

2022-03-08 15:21:49 47

原创 递归问题——最大公约数

最大公约数import java.util.Scanner;public class 最大公约数 { public static void main(String[] args) { Scanner scanner = new Scanner(System.in); System.out.println(f(scanner.nextInt(),scanner.nextInt())); } static int f(int i,int j) { if(i<j) { i =

2022-03-07 18:34:49 63

原创 递归问题——汉诺塔

汉诺塔**移动次数为:2^n - 1算法分析(1) 把n-1个盘子由A 移到 B;    (2) 把第n个盘子由 A移到 C;    (3) 把n-1个盘子由B 移到 C;从这里入手,在加上上面数学问题解法的分析,我们不难发现,移到的步数必定为奇数步:    (1)中间的一步是把最大的一个盘子由A移到C上去;    (2)中间一步之上可以看成把A上n-1个盘子通过借助辅助塔(C塔)移到了B上,    (3)中间一步之下可以看成把B上n-1个盘子通过借助辅助塔(A塔)移到了C上;**pu

2022-03-07 18:33:40 55

原创 递归例题1

第一题 递归求数组和public class 递归求数组和 { public static void main(String[] args) { int arr[] = {1,2,3,4,5}; int len = arr.length;//len的值为5 int res = f(arr,len); System.out.println(res);} static int f(int arr[],int len) { if(len == 1) { return arr[0]

2022-03-07 18:32:06 53

原创 leetcode算法入门day5——链表

链表的基本结构package day5;public class ListNode { int val; ListNode next; ListNode() { } ListNode(int val) { this.val = val; } ListNode(int val, ListNode next) { this.val = val; this.next = next; }}第一题 合并两个有序链表21@Date 2022年1月18日将两个升序链表合并

2022-03-07 18:25:46 69

原创 leetcode算法入门day4

第一题 翻转字符串344@Date 2022年1月17日编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。不要给另外的数组分配额外的空间,你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。示例 1:输入:s = [“h”,“e”,“l”,“l”,“o”]输出:[“o”,“l”,“l”,“e”,“h”]package day4;public class 翻转字符串344 { public static void main(String[] a

2022-03-07 18:21:39 73

原创 leetcode算法入门day3——双指针

第一题 两数之和1@Date 2022年1月16日给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。示例 1:输入:nums = [2,7,11,15], target = 9输出:[0,1]解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。package

2022-03-07 18:19:12 69

原创 leetcode算法入门day2——双指针

第一题 轮转数组189**@Date 2022年1月15日给你一个数组,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。示例 1:输入: nums = [1,2,3,4,5,6,7], k = 3输出: [5,6,7,1,2,3,4]解释:向右轮转 1 步: [7,1,2,3,4,5,6]向右轮转 2 步: [6,7,1,2,3,4,5]向右轮转 3 步: [5,6,7,1,2,3,4]**package day2双指针;import java.util.Arrays;p

2022-03-07 18:15:37 87

原创 leetcode算法入门day1

第一题 错误版本278**@Date 2022年1月14日假设你有 n 个版本 [1, 2, …, n],你想找出导致之后所有版本出错的第一个错误的版本。你可以通过调用 bool isBadVersion(version) 接口来判断版本号 version 是否在单元测试中出错。实现一个函数来查找第一个错误的版本。你应该尽量减少对调用 API 的次数。**package day1二分;public class 错误版本278 { /* The isBadVersion API is d

2022-03-07 18:12:24 44

原创 Java中字符数组与字符串的转换方法

1.字符串转字符数组String myString = "hello123"; //创建一个字符串变量myString char[] myCharArray; //创建一个字符数组myCharArray myCharArray = myString.toCharArray(); //将字符串变量转换为字符数组 for(int i=0; i<myCharArray.length; i++) { System.out.print(myCharArray[i] + " "); //将每个字

2022-03-06 21:43:07 16591 1

原创 return new int[]{-1, -1};

return new int[0];return new int[]{-1, -1};1.public int[] twoSum(int[] nums, int target),方法定义了返回int2.return new int[0];中new int[0]代表着创建了一个长度为0的int数组,这里与int[] arr = new int[0]进行对比可能更容易理解,后者是创建了数组并将其引用赋值给变量arr,return new int[0];而这里并没有赋值操作,而是直接返回了这个数组3.

2022-01-16 22:16:20 3291 1

原创 net::ERR_CONNECTION_REFUSED解决办法

如图解决方法:打开后台服务器后刷新即可。

2021-08-12 23:01:29 5282

原创 matlab更换YAHEI CONSOLAS HYBRID字体

#1.下载链接YAHEI CONSOLAS HYBRID.TTF#2.具体操作##下载链接里的字体,将其放到“C:\Windows\Fonts”文件夹。##重启matlab,主页->预设->字体,选择YaHei Consolas Hybrid。若字体中没有YaHei Consolas Hybrid出现,按照下面的方法添加##将YaHei Consolas Hybrid字体文件放到matlab的安装目录下的sys\java\jre\win64\jre\lib\fonts文件夹中,重启

2021-08-05 17:35:23 1229 1

原创 数据库和表的基本操作

数据库和表的基本操作创建和查看数据库1.操作数据库create database [if not exists是否要提前检查是否存在这个数据库] db_name [create_specificatioon [, create_spcification] create_specification:[DEFAULT] character set charset_name字符集类型名称 | [default]collate collation_name校对规则的名称创建一个名为mydb1的数据库cr

2021-08-04 21:39:19 1460

原创 matlab基础语法

# %% matlab基础语法% 后面的加分号时,运行结果在命令窗口不显示。% 不加分号时,当点击回车时,运行结果就会立即显示出来!%% 清除clear all %清除工作区中的所有变量clc %清除命令行中的所有命令%% 加减乘除%% 字符串s = 'a'abs(s) % ascII码 char(65)num2str(65) % 65length(s)%% 矩阵A =[1 1 4 1/3 3; 1 1 4 1/3 3; 1/4 1/4 1 1/3 1/2;.

2021-08-04 21:32:24 1127

原创 C Primer Plus中在比姓名宽度宽3的字段中打印名字

#include<stdio.h>#include<string.h>int main(void){ char name[40]; printf("please enter your name.\n"); scanf("%s",&name); printf("\"%20s\"\n",name); printf("\"%-20s\"\n",name);...

2020-02-25 16:10:12 1580 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除