- 博客(53)
- 资源 (3)
- 收藏
- 关注
原创 存储与 AI 的深度融合:一文读懂阿里云 OSS 向量 Bucket 架构原理
阿里云OSS向量Bucket创新性地将向量检索能力集成到对象存储中,解决了AIGC时代非结构化数据管理的痛点。其核心采用"统一接口、存算分离"架构:通过标准OSS API同时管理文件和向量数据,底层由对象存储引擎和向量检索引擎分工协作。数据写入采用异步设计,文件即时存储而向量后台索引;查询时先通过向量引擎快速检索,再获取文件元数据。这种设计既保持了OSS的高性能特性,又提供了专业的向量检索能力,大幅降低了开发者的维护成本和资源开销,为RAG等AI应用提供了简单高效的云原生数据基础设施。
2025-11-27 16:14:03
924
原创 向量搜索,ANN 综述
本文深入解析近似最近邻搜索(ANN)技术,重点介绍其四大主流方法:基于树、哈希、量化和图结构的算法。文章指出ANN通过牺牲微小精度换取百倍速度提升,有效解决高维数据搜索难题。特别分析了当前性能最优的HNSW算法,其分层图结构结合"高速公路"机制实现高效搜索。最后提出评估指标(召回率、延迟等)和选型建议,强调ANN是AI时代处理海量向量数据的核心技术,在推荐系统、图像搜索等场景发挥关键作用。
2025-11-27 18:09:35
674
原创 向量搜索原理与索引结构详解
摘要: 阿里云OSS向量Bucket通过向量搜索技术革新数据检索方式,将文本、图像等数据转换为高维向量,利用语义相似性实现高效搜索。核心原理包括向量嵌入(Embedding)和距离度量(如余弦相似度)。为应对海量数据检索挑战,采用近似最近邻(ANN)算法,如HNSW图索引和IVF倒排聚类索引,结合量化技术(PQ)优化内存使用。OSS向量Bucket整合这些技术,提供云原生的高效AI检索能力,无需额外维护向量数据库实例。
2025-11-27 17:56:52
986
原创 对象存储与语义检索的深度融合研究
摘要: 生成式AI和大语言模型的快速发展推动企业数据基础设施从"关键词匹配"转向"语义理解",向量嵌入成为非结构化数据的新型索引方式。传统架构中对象存储与向量数据库分离导致高成本与复杂性,而"存储原生向量搜索"通过将向量能力下沉至对象存储层,实现高效低成本的智能检索。阿里云OSS和AWS S3 Vectors率先采用该架构,支持多模态检索和RAG应用,成本降低达90%。核心技术包括向量元数据定义、异步索引构建和Serverless查询优化。尽管在实
2025-11-27 16:15:00
983
原创 阿里云向量 Bucket (Vector Bucket)构建知识库RAG
阿里云推出向量Bucket,将向量数据库功能集成到对象存储OSS中,支持向量数据存储、索引构建和相似度检索。主要优势包括低成本(比传统方案降低90%以上)、海量存储能力和统一管理。适用于RAG、多模态检索和个性化推荐等场景。用户可通过控制台管理索引,使用SDK进行数据操作,实现"对象即向量"的存储模式。该功能特别适合数据量大但访问频率不高的AI应用场景。
2025-11-27 15:46:46
616
原创 向量搜索技术深度研究报告:架构原理、核心算法与企业级应用范式
信息检索技术的演进历程,本质上是人类试图让机器理解语言深层含义的漫长探索。从早期的布尔逻辑检索、倒排索引(Inverted Index)到如今的向量搜索(Vector Search),这一领域的每一次飞跃都重塑了数据交互的边界。当前,随着大语言模型(LLM)的爆发式增长和检索增强生成(RAG)架构的普及,向量搜索技术已从学术界的边缘课题跃升为企业级AI基础设施的核心组件。
2025-11-24 01:32:32
2262
原创 RAG 同 Prompt Engineering
本文探讨了Prompt Engineering(提示词工程)与RAG(检索增强生成)技术的区别与联系。提示词工程专注于优化输入提示以引导模型输出,而RAG则通过检索外部知识库动态构建提示内容。虽然RAG的核心可视为高级提示词工程,但其底层包含复杂的检索系统和数据处理流程。两者在实际应用中相互依存:RAG提供精准数据检索,提示词工程则确保模型输出的准确性和规范性。开发者需同时掌握这两种技术,才能构建高效的生成式AI应用系统。
2025-11-24 01:06:48
1211
3
原创 如何统计区域内的物体数量
本文介绍了如何使用Supervision和YOLOv8实现区域物体计数功能。首先安装相关库并提取视频帧,通过PolygonZone工具确定目标区域坐标。然后加载预训练的YOLOv8模型检测行人,利用Supervision的PolygonZone功能统计区域内人数,最后生成带标注的视频结果。该方法可应用于客流统计等场景,通过设定阈值可触发不同业务逻辑。整个过程展示了从视频处理到目标检测再到区域计数的完整计算机视觉应用流程。
2025-11-23 00:56:28
941
原创 缓解电动汽车里程焦虑:一个简单的AI模型如何预测港口可用性
评估重点关注充电站的类型和时间段,即模型与基准模型出现差异的时段,具体而言,我们关注的是充电站流量变化显著的时段。我们的目标是在最大限度提高预测能力的同时,尽可能减少特征集(即模型用于进行预测的具体、可测量的数据点),以确保快速部署和低延迟。该模型的优势在于其简洁性,它能够利用易于获取的特征,同时在强大的基准模型基础上实现性能提升。我们开发了一种独特的模型,用于预测在当前时间起一定分钟数内,某个站点的电动汽车充电端口可用的概率,这有助于电动汽车驾驶员高效地规划行程,同时最大限度地减少在充电站的等待时间。
2025-11-22 22:26:49
1011
原创 LightRAG:简单快速的检索增强生成
检索增强生成(RAG )系统通过整合外部知识源来增强大型语言模型 (LLM),从而提供更准确、更符合上下文且满足用户需求的响应。然而,现有的RAG 系统存在诸多局限性,例如依赖扁平数据表示和上下文感知不足,这会导致响应碎片化,无法捕捉复杂的相互依赖关系。此外,图结构与向量表示的融合有助于高效检索相关实体及其关系,显著提升响应速度,同时保持上下文相关性。增量更新算法进一步增强了这一能力,确保及时整合新数据,使系统能够在快速变化的数据环境中保持高效响应。
2025-11-22 22:05:17
238
原创 MySQL 业务数据,报表方案
特性方案一:OLAP (StarRocks/Doris)方案二:Elasticsearch方案三:传统 DB 优化多表关联能力极强(支持星型模型 Join)弱 (需打宽表)弱 (5000万 Join 慢)动态字段支持强(原生 JSON/Map 支持)极强(原生支持)差 (需转 JSON 或行转列)查询速度秒级/毫秒级秒级分钟级/超时运维成本中 (需维护新组件)中高低 (但开发成本高)适用场景复杂统计报表、BI 看板搜索+筛选、简单统计T+1 离线报表、数据量小。
2025-11-22 21:42:27
523
原创 java 函数式编程 stream
阿发的探索,除了上述的基本函数,还有其他与流处理相关的类和方法,特别是类,它提供了大量的静态工具方法,使得收集流数据变得更为简单和强大。
2025-11-21 01:23:18
691
原创 JAVA 函数式编程1
也就是参数是String, 返回值是length方法的返回类型] 方法引用使得我们可以更简洁地创建函数式接口的实例,尤其是像 java.util.function.Function 这样的可以映射一个对象到另一个对象的接口。接受一个 double 值作为输入,并返回一个经过某种运算后的 double 结果,例如平方。apply() 方法是 Function 接口的核心抽象方法,当你有一个实现了 Function 接口的对象时,你可以调用 apply() 方法传入一个参数,它将根据函数逻辑生成一个结果。
2025-11-21 01:19:51
509
原创 2025年11月中国AI智能体平台格局:主要参与者、产品与市场趋势
中国AI智能体市场正呈现爆发式增长,预计从2023年的554亿元跃升至2028年的8520亿元,年均增速达72.7%。行业将2025年定位为"AI智能体元年",标志着技术应用的关键拐点。市场呈现B端(企业效率优化)和C端(个性化服务)双轨发展,由互联网巨头与创新初创企业共同驱动。当前技术聚焦低代码开发、RAG增强和智能体协同等方向,但在算力成本、可靠性及伦理等方面仍面临挑战。AI智能体已深入金融、教育、医疗等领域,并逐渐向"数字分身"方向发展,预示着人机交互模式的根本
2025-11-20 16:55:30
2478
原创 ffmepg 整理
如果你想将多个视频合并为一个多画面(比如分割屏幕)的视频,你可以使用 FFmpeg 的 hstack(水平堆叠)和 vstack(垂直堆叠)滤镜。请注意,FFmpeg 是一个非常复杂和强大的工具,有很多可能的选项和滤镜。例如,如果你有两个视频文件 input1.mp4 和 input2.mp4,并想把它们水平合并在一起,你可以使用以下命令:css。例如,如果你有两个视频文件 input1.mp4 和 input2.mp4,并想把它们水平合并在一起,你可以使用以下命令:css。,你可以相应地调整命令。
2025-11-20 10:24:58
745
原创 使用yoyo 快速检测后厨的 老鼠和人
系统内置 coco128.yaml , 包括80个物体,其中包括了人,但是未包含老鼠。(或其他更大的模型),这个模型已经完美地学会了识别“人”(类别0)以及其他79个类别。基础模型选择::使用。
2025-11-20 10:06:22
233
原创 Yolo 快速使用
关键指标详细含义 :一组是训练损失(Loss),另一组是验证精度(mAP)。1. 训练损失指标(在训练循环中) 这组数据(box_loss, cls_loss, dfl_loss)是模型在学习过程中看到的值。它们代表“模型做错了多少”。它安装的 PyTorch 2.1.2 版本不会使用您旧 CPU 所缺乏的高级指令(因此不会再 Illegal instruction 崩溃),同时 cu118 版本也能完美利用您 V100 显卡的强大驱动。(激活后,您的命令行提示符前面会出现 (yolo_env) 字样)
2025-11-20 09:55:37
923
原创 图像处理技术演进
在计算机视觉(Computer Vision, CV)和图像处理领域,技术栈非常丰富。通常我们将其分为(基于算法和数学运算) and(基于神经网络)。是这个领域的“瑞士军刀”,但在实际开发中,它通常与其他库配合使用。
2025-11-19 09:31:35
1501
原创 餐饮业运营智能化的深度技术分析:基于 YOLOv8 与 YOLO11 架构的监控与流程优化
在数字化转型的浪潮下,餐饮服务行业正经历着从依靠人工经验管理的传统模式向数据驱动的智能运营模式的深刻变革。随着劳动力成本的上升、食品安全法规的日益严格以及对翻台率(Table Turnover Rate)等关键绩效指标(KPI)的极致追求,计算机视觉(Computer Vision, CV)技术已成为现代餐饮企业不可或缺的技术支柱 1。本报告旨在对 Ultralytics 公司开发的 YOLOv8 及最新发布的 YOLO11 架构在餐饮场景中的应用进行详尽的、专家级的技术分析。
2025-11-18 23:51:03
527
原创 面向混合模态文档的高级多模态检索增强生成(RAG)架构范式与实施
在企业级知识库的构建与应用中,检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为连接大语言模型(LLM)与私有数据的核心桥梁。然而,随着业务场景的深入,单一文本模态的处理范式已无法满足复杂文档的解析需求。当前的行业痛点正如查询所指出的:传统的RAG架构将知识库预处理为向量数据库时,对纯文本处理尚可,但在面对图文混排资料(如包含架构图的技术手册、含财务报表的PDF、带统计图表的研报)时,往往面临“语义断层”。
2025-11-18 23:37:33
661
原创 调用链监控
Created with Raphaël 2.1.0用户请求(url/dubbo服务)用户请求(url/dubbo服务)方法B方法B方法C方法C在当前thread 中创建一个transaction,记录调用地址&开始时间在根节点上增加子节点B,记录B的开始执行时间在B节点上增加子节点C,记录C的开始执行时间记录方法C的完成时间记录方法B的完成时间返回响应给客户端。记录transaction结束时间,
2015-12-17 14:57:29
1777
转载 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2015-12-17 14:00:13
511
原创 使用greys 排查问题案例
场景类HankService 类的updateHsfServices方法执行失败, 假如是线上环境,日志也没有输出,不许debug,如何排查问题。package com.alibaba.cainiao.cndcp.web.hank;public class HankService implements BeanFactoryAware, InitializingBean {public HsfD
2015-04-17 15:20:17
2623
翻译 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2015-04-10 15:12:30
483
转载 Java nstrumentation 功能
2006 年底,Sun 公司发布了 Java Standard Edition 6(Java SE 6)的最终正式版,代号 Mustang(野马)。跟 Tiger(Java SE 5)相比,Mustang 在性能方面有了不错的提升。与 Tiger 在 API 库方面的大幅度加强相比,虽然 Mustang 在 API 库方面的新特性显得不太多,但是也提供了许多实用和方便的功能:在脚本,WebServ
2015-04-04 18:17:27
673
原创 webx 中request 对象作为单例注入的实现
webx 文档中描述: 你不能把一个短期的对象如request、response和request context注入到MyAction这个singleton对象。然而,在Webx中,这样做是可以的!奥秘在于Request Contexts服务对上表所列的这些短期对象作了特殊的处理,使它们可以被注入到singleton对象中。事实上,被注入的只是一个“空壳”,真正的对象是在被访问到的时候才会从线程
2015-03-29 19:45:43
3304
原创 linux 乱码问题
linux 、 vi 编码问题一、概念官网: https://kenai.com/projects/btrace/etc/sysconfig/i18n, 系统国际化配置文件, 也就是,你的系统桌子图标文字、菜单文字,帮助提升文字, 控制台下的提示文字,仅仅一层皮而已。 vi /etc/sysconfig/i18n 默认为: LANG=”en_US.UTF-8” SYSFONT=”
2015-03-09 18:19:53
805
原创 spring schema 扩增 (dubbo 为例)
<beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dubbo="http://code.alibabatech.com/schema/dubbo" xsi:schemaLocation="h
2015-03-08 16:14:41
2153
原创 博文站点-----
正明(章文嵩) 集团核心系统高级研究员,LVS集群项目创始人与开发者微博:http://weibo.com/wensong8 正祥(阳振坤) OceanBase项目负责人,淘宝顶级科学家阳振坤的博客 http://blog.sina.com.cn/kern0612微博 http://weibo.com/kern0612 毕玄(林昊) 集团核
2015-02-25 15:39:16
588
转载 深入分析 Java 中的中文编码问题
http://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/几种常见的编码格式为什么要编码不知道大家有没有想过一个问题,那就是为什么要编码?我们能不能不编码?要回答这个问题必须要回到计算机是如何表示我们人类能够理解的符号的,这些符号也就是我们人类使用的语言。由于人类的语
2015-02-12 17:42:08
574
原创 pomelo 开发棋牌手游 (博客迁移)
一、整服务器部署架构。服务端包含:两组serverconnector server : 用于建立后维护长连接、根据用户不同的ip一致性hash分配到固定server; 维持session; 路由转发room Server:一个room server 代表一个游戏房间, 例如初级房、中级房等。只有同一房间的用户可以组成游戏。room server 维护游戏牌局信息,处理开始
2015-01-05 20:26:07
9984
原创 pomelo 安装小结 (博客迁移)
第一步: 安装nodewget http://nodejs.org/dist/v0.10.22/node-v0.10.22-linux-x64.tar.gzchown -R admin:admin 【node解压目录】 。解压, 然后 ln -s [node 解压目录] /usr/local/node第二步: 安装pomelo需要安装make 和 gcc ,
2015-01-05 20:22:38
1008
原创 pomelo-logger文件加载引发问题的解决
在使用pomelo 开发过程中碰到一个问题, 自定义的pomelo-logger 的配置文件是,无论我如何配置,都只会使用默认的控制台输出,而无法输出到指定文件。问题排查使用npm list 结果如下。pomelo-logger 被加载了两次。 只有pomelo@0.7.5框架中输出的日志是按照,配置输出的。我的工程中使用,使用pomelo-lo
2015-01-05 20:19:06
1741
转载 转centos添加swap分区
关于 Linux 中 Swap(交换分区),类似于 Windows 的虚拟内存,就是当内存不足的时候,把一部分硬盘空间虚拟成内存使用,从而解决内存容量不足的情况。那么如何在 centos中手动添加 Swap 呢1、检查 Swap 空间在设置 Swap 文件之前,有必要先检查一下系统里有没有既存的 Swap 文件。运行以下命令:swapon -s如果返
2015-01-05 20:14:37
905
原创 centos 上用手机调试android (博客迁移)
1、手机不连接电脑,运行lsusb命令;2、手机连接电脑,运行lsusb命令;3、对比1 、2 结果,不同之处为Bus 002 Device 005: ID 18d1:4ee2 Google Inc.4、在/etc/udev/rules.d 目录下新建一个文件 51-android.rules,并在文件中添加如下内容SUBSYSTEM=="usb", S
2015-01-05 20:13:25
949
原创 服务端发布流程
一、登录jenkins 平台:打开http://192.168.1.144:8080用户名密码: xxx xxx选择要发布的项目, 将鼠标移动到"name"列右侧, 在下列列表中选择 “立即构建”。 你会在,左侧,构建执行状态列表上,看到一个构建任务的进度条。构建结束构建成功:w 项“编译晴雨表”上显示,白云,多云或太阳。构建失败: w 项“编译晴雨表”上显示,乌云。‘构建
2015-01-05 20:05:26
849
原创 mysql 线上参数优化 持续调整
测试场景: 10个链接,每个链接一个线程,每个线程,根据给定的500个,user_id逐条 更新lvban_user_sysinfo的edittime, 统计各个线程,执行的时间。一 、 mysql缺省配置,1.1 线下20.106机器 (平均update时间 : 1800/500=3.6毫秒)Thread-0range :[1394076164934--139407616677
2015-01-05 20:02:49
807
原创 maven 仓库 nexus 的安装与迁移
一、全新安装nexus1、我们采用的war 包安装, 直接下载nexus的war包, nexus-2.3.1-01.war。2、将nexus-2.3.1-01.war丢到tomcat 的webapp目录下。我们的tomcat 用的是 /usr/local/project/nexus/tomcat3、运行tomcat 的start.sh4、第一次运行,你会发现在${user.home
2015-01-05 19:59:48
12292
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅