- 博客(26)
- 收藏
- 关注
原创 DPDK性能优化实践:系统级性能调优的方法论与实战(一套通用的方法论)
本文探讨了高性能网络处理中的系统化优化方法。针对当前性能优化中存在的“玄学”调优问题,提出了基于DPDK框架的全栈协同优化思维。构建了四层优化方法论:测量驱动层、硬件感知层、算法优化层和系统协调层。技术实现方面详细介绍了性能分析工具、CPU缓存优化、SIMD指令加速、NUMA内存管理等关键技术,通过代码示例展示了DPDK在实际优化中的应用。综合考虑硬件架构、软件算法和系统协调等维度,才能实现整体性能的最优。
2025-07-11 22:11:43
693
原创 关于AI领域火热的Context Engineering 是什么以及应用场景分析,日常使用应该如何落地?
如果你关注AI领域,可能会频繁听到一个新词:“Context Engineering”(上下文工程)。那么,Context Engineering究竟是什么?它又将如何改变LLM应用的开发范式,并带来哪些新的机遇?对普通人来说如何应用?
2025-07-10 14:06:35
659
原创 DPDK graph图节点处理框架:模块化数据流计算的设计与实现
DPDK图处理框架通过数据流计算模型解决传统网络处理架构的紧耦合问题。它将处理流程抽象为由节点(Node)和边(Edge)构成的有向无环图,实现处理逻辑的模块化分离与动态组合。该框架包含三大核心特征:1)计算图抽象模型,将处理单元封装为独立节点;2)支持运行时动态图构建与拓扑优化;3)采用高效图遍历算法进行数据流调度。这种设计在保持高性能的同时显著提升了系统的灵活性和可扩展性,为网络数据处理提供了创新解决方案。
2025-07-09 22:26:16
877
原创 DPDK的虚拟化加速技术:vhost-user与virtio高性能是如何实现的
虚拟化技术面临的主要性能挑战在于网络I/O瓶颈,传统方案性能损失可达50%以上。DPDK虚拟化技术通过多项创新实现了性能突破: 采用vhost-user协议和virtio设备优化,将性能损失降至5%以内 核心设计理念强调"保持隔离性的同时最大化资源共享" 关键技术包括: 零拷贝虚拟化设计(共享内存机制) 硬件加速与软件优化的多层次融合(SR-IOV/vDPA) 用户态虚拟化架构(vhost-user协议) virtio设备前端深度优化 ,是指的参考的技术架构
2025-07-09 21:52:32
1339
原创 【DPDK应用篇】事件驱动架构:eventdev异步处理模型的设计与实现
DPDK的事件驱动架构(EventDev)提出了一种全新的解决方案:异步解耦的系统架构艺术。它不再是简单的生产者-消费者模型,而是一个智能的事件调度系统,本文主要揭示其设计到实现的原理
2025-07-07 22:36:30
1133
原创 DPDK查找算法特性解读:哈希表和LPM路由表的实现
摘要 DPDK作为高性能网络数据包处理的核心框架,其查找算法设计实现了精准与效率的平衡。文章分析了三种关键查找技术:Cuckoo哈希通过双哈希机制和踢出策略实现O(1)平均查找时间;LPM路由表采用24+8分层结构确保固定时间复杂度;FIB则针对现代硬件优化,利用DIR24-8算法和SIMD指令实现高效查找。
2025-07-07 08:01:02
1279
原创 DPDK网络转发技术:L2/L3转发的高性能实现
本章探讨dpdk在网络核心的转发功能上的高效设计,L2/L3针对流量特点的处理特性,其思想可以延伸到数据包处理、抓包驱动、流量路由、转发业务等算法的应用,是非常指的借鉴的
2025-07-07 07:40:45
1002
原创 深度解读Karpathy说的Software 3.0时代,感觉是个人的机会很大的时代
Andrej Karpathy在2025年6月的Y Combinator AI创业学校演讲中,提出了革命性的Software 3.0概念, Substack 这不仅是技术范式的转变,更是商业模式的颠覆,是个人极大的机会
2025-07-06 23:50:33
576
原创 高性能网络I/O实现:ethdev设备抽象层深度解析
DPDK的ethdev设备抽象层通过创新性的双路径架构设计,在保持硬件无关性的同时实现了接近裸机的性能表现。其核心在于控制平面与数据平面的分离,其中快慢路径的设计是研究者参考和深究的方向。
2025-07-06 16:13:38
845
原创 DPDK基础架构解析:EAL环境抽象层的设计与实现
DPDK核心组件EAL解析与实现 EAL(Environment Abstraction Layer)是DPDK高性能网络框架的核心基础层,它为上层应用提供统一的操作系统与硬件抽象接口。通过分层设计理念,EAL实现了: 硬件资源统一管理、智能初始化机制、 高效内存架构:整合大页内存、NUMA感知和共享内存管理,为数据包处理提供低延迟访问 ;是学习DPDK的基础
2025-07-06 14:28:40
827
原创 聊聊DPDK:为什么2025年这个抢手的“老技术“一人难求
随着AI的飞速发展,你看到的底层技术也存在巨大的市场空缺,DPDK技术就是空缺的主力军。市场上更是高薪招聘也是一人难求,就这个现象,探讨作为行业者的学习和发展方向
2025-07-05 15:47:16
1234
原创 深度解读《现代人工智能:本质、途径和方向》:一个结构化的技术分析
即如何将物理世界中的原始、高维、非结构化的信息(如像素、声波)转化为机器可以理解和处理的、具有良好数学性质的结构化形式(如特征向量)。将贝叶斯推理的框架与大模型强大的表示能力相融合,有望让AI学会“思考”和“推理”,而不仅仅是“识别”和“生成”。张志华教授的这份讲义为我们提供了一张宝贵的“技术地图”,帮助我们系统地理解了现代AI的内在结构、主流路径和未来方向,对于任何希望在该领域进行深入探索的人来说,都具有极高的参考价值。然而,要迈向更高阶的智能,必须具备在不确定性下进行推理的能力。
2025-06-17 14:19:14
762
原创 华为助力!解决 DeepSeek R1 访问拒绝,免费畅玩满血版算力平台的使用分享
DeepSeek R1 发布还不到半个月,就在 AI 领域大放异彩,以其卓越的性能和出色的表现 “杀疯了”。今天,就来给大家分享一个能流畅使用 DeepSeek R1 满血版的方法。当然这背后离不开华为的重磅出手,华为与硅基流动平台展开联动,共同组建了 DeepSeek R1 的算力平台,现在面向大众开放使用。硅基流动平台堪称 “宝藏”。这里不仅有满血版的 DeepSeek R1 模型,让你尽情体验其强大的语言处理能力,还汇聚了各大主流的大语言模型、视觉模型、语音模型等。
2025-02-06 10:09:54
663
原创 AI Agent构建 - LangChain(基础篇一)
LangChain 更适合需要高度定制化、复杂任务处理和多模型集成的场景,而 Dify、Coze 等平台更适合快速搭建标准化应用。如果你需要灵活性和深度控制,LangChain 是更好的选择;如果你追求快速开发和部署,Dify 或 Coze 可能更合适。
2025-01-09 16:23:00
867
原创 Mistral AI 重磅升级Le Chat与Pixtral Large,为什么能挑战open AI?
在人工智能领域,Mistral AI一直是创新的先行者。2024年11月18日,Mistral AI宣布对其生成式AI助手Le Chat进行重大升级,并推出了最新的多模态模型Pixtral Large。这些升级不仅提升了人机交互的流畅性与效率,还为用户在研究、创作等领域提供了更直观且高效的工具。本文将深入探讨Mistral AI的最新技术,并与其他主流模型进行对比分析。
2024-11-25 09:42:42
1128
原创 AI工具wiseflow-一个爬虫王者神器,让你百倍速挖掘各行业最新知识
我们缺的其实不是信息,我们需要的是从海量信息中过滤噪音,从而让有价值的信息显露出来,wiseflow可以快速爬取,智能过滤,精准分类,一切都是自动化操作!
2024-11-18 16:27:25
9253
6
原创 聊聊DPDK中cuckoo hash为何采用BFS而非DFS
BFS(广度优先搜索)的核心概念可以用三句话概括:搜索方式:从起点开始,像水波纹一样向外扩散,先访问距离近的,再访问距离远的数据结构:使用队列(FIFO)存储待访问的节点,保证按层次顺序访问特性保证:由于是按层次访问,首次到达目标点的路径一定是最短路径
2024-10-31 11:44:42
706
1
原创 AI驱动下的SDS崭露头角,SDS vs SaaS:软件行业的未来已来,你准备好了吗?
SDS模式的兴起,预示着软件行业将进一步渗透到各个经济领域,重塑行业格局。随着AI技术的发展,SDS公司将有机会在新的领域中取得成功,但这也要求它们在质量保证、计费模式和客户服务等方面进行创新和适应。未来已来,你准备好拥抱SDS模式了吗?
2024-10-29 15:04:18
959
原创 Cursor!一款轻松设计和研发产品的AI工具,还没安装?以及国内轻松获取Cursor Pro 订阅升级的教程(25年1月亲测)
它是一款国内可以免费使用的,无需魔法的AI编辑器,支持自动编码,支持CHAT对话,支持gpt4、gpt-4o、claude-3、claude-3opus、甚至o1模型等等(目前高级的模型需要订阅到pro版本,下面我将详细介绍)Cursor已经普及到小盆友都简单易用,很好的帮助你做产品设计,助你实现自己的想法,通过问答就可以系统化的编码,不多做解释了,乘着初期赶紧安装和使用起来吧,来独立打造自己的理解产品!六、接着在侧边栏,选择 **“支付服务”**,然后选择Cursor服务,点击下一步支付。
2024-10-09 09:57:55
12444
1
原创 探讨应用层网络协议栈设计-捕获模块(二)
网络世界就像一条繁忙的高速路,而数据包就是在这条路上飞驰的车辆。我们的任务是挑选出某些特定的车辆进行检查,这就好比在网络中捕获我们需要的数据包。不同的包捕获方案就像是设置在高速路上的不同类型的检查站,它们各有各的工作方式和效率
2024-06-11 17:16:50
1229
原创 探讨应用层网络协议栈设计-捕获模块(一)
捕获模块主要是针对互联网上传输的流量进行捕获,捕获的目的是将二进制的bit数据,提供给后续的模块进行解析、信息提取、审计、研判等等,以支撑市场的业务需求
2024-05-28 17:31:39
1077
原创 探讨应用层网络协议栈设计-基础篇(二)
第二要事,职责定义好,检查下定义的模块是否身兼数职,多则惑少则得,一个模块需要的是专精,出问题人人都会去找专家,不是去查百科全书,多了就不伦不类,多了第一要事就没做好;给与每个模块合理的任务,让其各尽其责,稳定有序运作起来,这是系统的意义。
2024-05-21 15:59:24
398
1
原创 探讨应用层网络协议栈设计-基础篇(一)
介绍基础模块定位线程竞争处理负载均衡设计工作模式设计快慢的分离应用层网络协议栈的开发,它是一套通用的解决网络需求的系统,网络需求指的是对网络数据的监控、审计、研判、提取、防护、可视等;具体比如现在要对一个公司,整个高校,一个地区互联网出入口流量做一个检查,检查该地区是否有人使用QQ传输非法文件,监测公司是否有人上班摸鱼,高校是否有人考试作弊(基于网络作弊手段),电脑或服务器是否被黑客攻击,被攻击了后的防护措施,这些都在网络协议栈的业务范畴中。
2024-05-17 16:43:52
1816
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅