- 博客(27)
- 资源 (203)
- 收藏
- 关注
原创 PPP-RTK 技术详解
【摘要】PPP-RTK作为下一代高精度定位技术,融合了PPP(精密单点定位)的全球覆盖与RTK(实时动态差分)的快速收敛优势,实现1-5cm精度、30秒-5分钟快速定位,无需本地基站支持。其核心原理通过全球参考站网络反推卫星轨道偏差和钟差,结合区域大气模型实现快速解算。国际主流服务商(如u-blox PointPerfect、Trimble RTX)通过L波段卫星/互联网双通道下发修正数据,特别适合自动驾驶、跨国部署等场景。相较传统RTK,PPP-RTK将基站建设维护转移至服务商侧,用户端实现"无
2026-06-08 09:00:00
325
原创 基于多模型融合的交通灯状态感知系统
红绿灯检测是自动驾驶感知系统的核心模块之一,负责实时识别交通信号灯的状态(红、黄、绿、黑、未知)及倒计时信息,为决策规划提供关键输入。本系统采用 “检测 + 分类”两阶段架构,结合多模型推理、高精地图融合、时序滤波等策略,在复杂光照(白天/黑夜)、多城市场景下实现高精度、高鲁棒性的感知能力。
2026-02-12 08:30:00
1644
原创 自动驾驶感知系统核心模块详解
在高级别自动驾驶系统中,环境感知是决策与控制的基础。本文详细解析一套面向量产落地的高性能、高可靠感知系统架构,涵盖 交通灯识别、自由空间检测、静态地图构建、多传感器融合、目标跟踪与轨迹预测 等关键子模块。该系统融合了相机、激光雷达(LiDAR)等多源传感器数据,采用深度学习模型与传统算法相结合的方式,在保证实时性的同时提升鲁棒性与安全性。所有模块均部署于车载计算平台(如 NVIDIA Orin),通过 TensorRT 加速推理、GPU 预处理优化、车载中间件通信,并具备完善的 性能监控、故障降级、诊断日
2026-02-10 17:01:15
809
原创 Chinese-CLIP 图文相似度计算实战
摘要:Chinese-CLIP是阿里巴巴开发的专为中文优化的多模态预训练模型,可将图像和中文文本映射到统一语义空间,实现零样本图文匹配和跨模态检索。与DINO、YOLO不同,它专注于全局图文匹配而非目标检测,具有快速特征提取优势。测试显示模型能准确判断图像内容与文本描述的匹配度,如识别"皮卡丘"的准确率达94.36%,"车"达99.41%。该模型通过简单API即可实现图像-文本相似度计算。
2026-02-06 21:23:02
297
原创 YOLOWorld 实现开集障碍物检测
本文探讨了开集障碍物模型的构建方法,该模型能同时识别已知障碍物(如车辆、行人)和检测未知障碍物(如掉落纸箱)。通过YOLO-World模型实现开放世界感知,结合自定义类别(car、dog等)和OOD检测技术,可区分已知/未知物体。实验使用Python代码加载模型、设置类别并进行推理,最终输出检测结果并可视化。关键点在于利用文本提示和置信度阈值来实现开集检测,为自动驾驶等场景提供更全面的环境感知能力。
2026-02-06 17:09:23
230
原创 基于 DINO 与 Chinese-CLIP 的自动驾驶语义检索系统架构
摘要:本文介绍了一个基于DINO和CLIP模型的智能视觉系统架构。系统采用DINOv2模型进行开集检测,可识别未预定义类别的目标;使用达摩院Chinese-CLIP模型处理中文语义查询,实现图像和文本的双通道向量化。通过向量数据库存储目标物特征,支持文本或图片两种查询方式,最终通过相似度排序返回匹配结果。该架构特别适用于车载摄像头等广角场景,能有效识别车辆、行人、路标等多种目标,并支持中文语义检索。
2026-02-03 20:48:27
701
原创 Apache Flink 在 Kubernetes 上的高效部署与优化实践
本文档提供Kubernetes环境下部署Apache Flink作业的系统化实践方案。在镜像构建方面,建议采用多阶段构建合并RUN指令,分离基础镜像与作业镜像;资源调度上,通过节点标签划分固定与弹性节点,配合动态扩缩容算法实现潮汐调度;日志管理采用持久化存储与独立部署HistoryServer;启动优化包括远程提交JAR包和K8s软硬亲和性调度策略。这些方案覆盖了Flink在K8s环境中的关键部署维度,旨在提升资源利用率、运行稳定性和作业启动效率。
2026-02-02 16:00:00
1009
原创 智能化定制化交付:多区域并发项目高效落地方法论
智能化定制化交付不仅是技术问题,更是组织、流程、文化与工具的综合体现。职责清晰:产品、平台、交付三方协同,各负其责;流程规范:从需求到上线全程可追溯、可衡量;知识沉淀:案例库、指导书、知识库助力经验复用;工具赋能:自动化工具链提升效率与一致性;风险可控:提前识别痛点,建立预防机制;弹性扩展:支持大规模并发与复杂定制场景。未来将进一步探索AI辅助交付、智能监控预警、自动化的测试与部署等新技术应用,推动交付模式向更智能、更自主、更高效的方向演进。
2026-02-02 10:30:00
1775
原创 大模型时代的智能问数:多策略召回与精排技术实践
本文介绍了一套面向业务用户的智能问数系统,旨在通过自然语言交互实现高效、准确的数据查询。系统融合大语言模型(LLM)、检索增强生成(RAG)、NL2SQL及数据治理等技术,构建了从问题理解、语义改写、Schema链接到SQL生成与执行的完整技术链路。针对用户提问中常见的模糊表达、行业术语和时间指代等问题,系统首先通过RAG知识库进行关键词替换与语义规范化;随后采用多阶段向量召回与大模型重排序策略,精准匹配数据库中的表与字段;为提升SQL生成准确性,引入DSL(领域特定语言)作为中间表示,实现“Text →
2026-02-02 10:00:00
979
原创 Spark 向量化执行引擎技术选型与实践指南
本文对比了Spark向量化执行的两种主流方案Gluten+ClickHouse和DataFusion+Blaze。测试显示Blaze性能提升约3倍,优于Gluten的2倍,特别适合高吞吐OLAP场景。功能方面,Blaze支持Kerberos认证和断点续传,企业级特性更完善,但两者均未原生支持Hudi。建议针对Hudi采用谓词下推、列裁剪等优化,并优先在Blaze上实现向量化读取。选型建议:高性能OLAP选择Blaze,安全集群必须使用Blaze,快速验证可选Gluten,长期生产环境推荐Blaze。
2026-02-02 09:40:49
489
1
原创 Flink 向量化执行引擎:架构设计与实现
摘要:Flink向量化引擎通过三层架构实现流批一体场景的性能突破。在Flink内核层引入Plugin机制实现算子替换,胶水层完成RexNode到SubstraitIR的转换,Native层基于定制DuckDB实现SIMD加速。创新点包括行转列、流转微批、ZeroCopy传输等技术,使简单SQL性能提升7倍以上,复杂SQL提升3倍,成为首个完整支持流式向量化的Flink实现。项目通过非侵入式改造和标准中间表示,实现了Java与C++的高效协同,为实时计算提供了新的性能标杆。
2026-02-02 09:00:00
1792
原创 Nginx 四层 TCP 与七层 HTTP 转发实战指南
本文对比分析了Nginx中四层TCP转发和七层HTTP转发的核心区别与应用场景。四层转发工作在传输层,仅解析IP和端口,配置简单、性能高,适合HTTPS透传和TCP/UDP协议转发;七层转发工作在应用层,完整解析HTTP协议,支持基于URL、参数等细粒度控制,适用于Web业务和复杂处理场景。文章通过配置示例和特性对比,建议根据业务需求选择:非HTTP协议/高性能需求用四层,Web业务/精细控制用七层,也可混合使用发挥各自优势。
2026-01-30 10:35:30
1498
1
原创 自动驾驶领域OCC标注
OCC标注是自动驾驶环境感知的核心技术,通过将车辆周围三维空间离散化为规则栅格,标注每个栅格的占据状态、类型和语义类别,形成高密度环境表征。该技术解决了传统3D检测的漏检问题,特别适用于复杂场景下的目标识别。核心标注规范包括栅格划分规则、必填字段和动态场景补充标注,采用0.1-0.5m的分辨率平衡精度与成本。标注流程涉及数据预处理、预标注、人工精标和质检复核。应用场景涵盖BEV语义分割、路径规划等。落地需注意平衡精度效率、统一标准、适配传感器能力和优化存储。OCC标注为自动驾驶算法提供了关键的数据基础。
2026-01-20 15:12:07
1042
原创 高精地图元数据详细
高精地图JSON数据结构解析:为自动驾驶提供环境感知与路径规划支持。该数据结构采用分层设计,包含六大核心模块:1)元数据(metadata)确保版本兼容性;2)几何数据(geometry)提供厘米级精度的道路、车道和设施3D模型;3)语义数据(semantics)赋予交通规则和属性标签;4)拓扑数据(topology)描述车道连接关系;5)定位数据(localization)提供高精度定位锚点;6)动态数据(dynamic_supplement)支持实时更新。这种结构化数据支撑自动驾驶三大核心功能:高精定位
2026-01-14 19:18:53
703
原创 车道线拟合算法--自动驾驶
车道线拟合是自动驾驶感知层的核心算法,旨在从传感器数据中提取车道线特征点,通过数学模型拟合出连续平滑的车道轮廓。算法分为2D和3D拟合,针对直道和弯道分别采用直线拟合(如RANSAC)和曲线拟合(如多项式、B样条)。工程流程包括特征点预处理、坐标系转换、模型自适应选择、鲁棒拟合计算和后处理优化。针对自动驾驶场景的遮挡、噪声等问题,算法需结合先验约束和多传感器融合,确保鲁棒性、实时性和准确性。3D拟合通过融合视觉深度估计和点云数据,为路径规划提供全局几何约束。
2026-01-14 11:52:16
1059
原创 智能问数NL2SQL
本文介绍了NL2SQL(自然语言转SQL)的实现流程。系统首先对用户输入进行意图识别和问题改写,处理模糊表达和行业术语;然后通过schema-linking算法完成选表和选列操作,该算法包含实体切分、指标/维度分类、多向量召回(采用bge-m3模型粗排)和精排(使用qwen32b大模型重排)等步骤;最后通过text2dsl2sql方式生成准确SQL。核心创新点在于多向量召回策略(指标列组合召回、相邻实体组合召回和问题直接召回)以及大模型辅助的精排机制,有效提升了列选择的准确性。
2026-01-05 09:00:00
516
原创 自动驾驶轨迹追踪技术
自动驾驶轨迹追踪结合PID与MPC算法,通过多传感器融合实现高精度控制(横向误差<0.32m),支持高速(116km/h)和低附着路面(μ=0.3)场景。基础模型在轨迹规划中的应用分为定制模型(6类)和指导模型(2类),关键技术包括微调流程设计(数据扩展、视觉适配器、轨迹表示)和性能优化(推理速度0.8-3.6fps,精度提升方案)。典型模型如CarLLaVA、GPT-Driver分别实现无链推理和思维链推理,轻量级模型(如10亿参数SimLingo)更适合边缘部署。
2026-01-05 09:00:00
636
原创 flink k8s源码解析
其中KubernetesJobManagerSpecification的生成规则,生成配置来源文件一个是pod模板文件里面生成和JM自定义参数组成,后者可以填充前者生成的FlinkPod(将mount、环境变量、cmdjob、hadoop配置文件、kerberos配置文件等都填充到模板生成的FlinkPod里面)。但是对于有定制化要求的CR,比如对JM、TM cpu和内存可以用户自定义,那么我们可以使用用户的自定义参数装饰一下原生的CR,使其成为一个新的CR,然后提交给k8s。
2025-12-27 18:47:05
721
原创 自动驾驶感知技术
77GHz 相比 24GHz,在相同体积下可设计更多收发阵元,获得更窄波束,测角精度更高。核心用于目标检测、换道辅助、自适应巡航控制(ACC)、停车辅助等功能,抗干扰能力强。用于障碍物检测、车道线识别、交通信号检测等核心感知功能,是视觉感知的核心传感器。主要应用于障碍物检测、车辆定位、地图构建(SLAM)等高精度感知功能。单目相机:探测车辆前方环境,识别道路、车辆、行人等目标;后视相机:探测车辆后方环境,具备较强的恶劣环境适应性;盲点监测、车道偏离预警、近距离障碍物探测(行人、车辆)
2025-12-24 10:42:48
691
原创 SIM语义分割模型效果测试
SIM是Meta在SAM基础上开发的语义分割扩展模型,主要解决了SAM无法输出语义类别标签的问题。相比SAM仅支持实例分割,SIM新增了文本提示直接指定语义类别的能力(如"pedestrian"、"car"),同时保留了SAM的零样本分割、灵活提示和视频通用性等优势。SIM支持视频语义追踪,兼容SAM生态,可通过少量标注数据微调适配垂直场景。其工作流程为:输入图像→SIM语义分割→掩码后处理→特征提取→实体分类,最终输出带语义标签的分割结果。SIM需要与实体分类器配合
2025-12-24 10:12:24
927
原创 图图搜索模型DINO v2
DINOv2模型是一种自监督视觉Transformer模型,专为图像特征提取和相似性匹配设计。该模型无需标注数据即可生成高质量的图像嵌入向量,支持多尺度特征学习,并能与主流向量索引兼容。本文提供了使用DINOv2进行图像特征提取和相似性检索的Python实现,包括环境配置、特征提取函数以及两个示例:单张图像特征提取和相似图像检索。代码展示了如何加载预训练模型、处理图像数据、计算余弦相似度并输出相似度排名。该方法适用于图像检索、内容匹配等场景,具有高效和语义关联性强的特点。
2025-12-23 10:58:00
589
原创 向量化数据库索引
向量数据库通过多级优化实现高效检索:1)核心采用HNSW/IVF等向量索引算法,将复杂度从O(n)降至O(logn);2)硬件层面优化向量计算与存储;3)检索逻辑优化如提前过滤;4)工程化优化如批量检索和增量更新。主流索引中,HNSW适合低延迟场景,IVF适合大数据量,二者可混合使用。此外还支持标量索引和倒排索引,分别用于结构化数据和文本检索。这种分层优化体系使向量数据库能实现毫秒级亿级向量检索。
2025-12-23 10:54:58
891
原创 大模型训练测试
摘要:本文记录了YOLOv8本地部署和训练过程。首先通过pip安装ultralytics库,演示了图片、视频和摄像头的检测命令。重点描述了使用CVAT工具标注车道线数据时遇到的问题:当只标注部分实体时,会导致模型漏检率高、泛化能力差和训练效果下降。在两次训练过程中均出现"no labels found"警告,最终模型未能正确识别车道线。文章分析了部分标注对模型性能的三方面负面影响,包括学习不充分、数据分布偏差和损失函数失真,并建议完整标注所有目标实体以提高模型准确性。
2025-12-02 20:45:48
257
原创 游戏的灵魂
<br />中国的很多游戏空有不输给他人的画面 <br />却缺少了游戏的灵魂 <br />中国游戏是靠灵魂活着的 <br />年轻的项目组 <br />年轻的题材 <br />人总要为年轻付出代价 <br />只是没人知道 <br />这个代价有多大
2010-12-04 11:07:00
830
2
原创 箴言
1.公司需要看人品和忠诚度,其次再看的是能力。2.机不可失,时不再来。3.别人都是希望自信的男孩,而不是希望得到同情的男孩。4.不需要同情,要自强,如果一个人靠同情生活,那么这个人肯定一事无成。5.不要虚荣。6.做事不要是缩头乌龟,要敢作敢当。7.宁为玉碎,不为瓦全,宁鸣而死,不默而生。
2009-07-23 00:14:00
906
Balancing cost-quality tradeoff in cooperative ad hoc sensor networks
2011-04-19
Adaptive MAC protocol for UAV communication networks
2011-04-19
Decentralized control of unmanned aerial vehicle collaborative sensing missions
2011-04-19
A Model for Cooperative Mobility and Budgeted QoS in MANETs
2011-04-19
Communication-assisted topology control for autonomous unmanned systems
2011-04-19
自动驾驶轨迹规划,进展与挑战
2025-12-16
我在京东写的traffic server笔记
2018-08-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅