- 博客(53)
- 收藏
- 关注
原创 【AI Infra】谷歌数据中心液冷技术:AI时代的散热革命
本文回顾了谷歌在Hot Chips 2025大会上分享的数据中心液冷技术,重点关注其在应对AI时代高功耗和散热挑战中的应用、技术细节以及与PC发烧友领域的异同。Nvidia展示了带有外部水冷连接的GB300服务器,Rebellions AI也展示了其ML加速器的水冷设置。这与PC发烧友的“开盖”操作类似,旨在通过直接接触芯片裸片来提高传热效率,以应对TPUv4相比TPUv3高出1.6倍的功耗。系统规模: 数据中心液冷系统跨越整个机架,而PC液冷则局限于单个机器。液冷回路跨越整个机架,而非局限于单个服务器。
2025-11-07 14:03:24
980
原创 【LLM技术实践】六大策略优化LLM上下文管理
本文探讨了大型语言模型(LLM)上下文管理的6种策略,以应对长上下文导致的4类问题:上下文中毒、分散、混乱和冲突。核心策略包括:1)RAG选择性添加信息;2)工具加载只选相关工具;3)上下文隔离实现多线程处理;4)上下文修剪删除冗余信息;5)总结提炼关键内容;6)上下文卸载将信息存储到外部。研究表明,这些策略不仅能提升模型性能(如工具加载提升44%),还能降低18%功耗和77%速度。有效的上下文管理对优化LLM代理至关重要。
2025-08-26 15:06:32
1063
原创 20年AWS服务进化史
AWS服务20年演进:从EC2、S3到Lambda的重大升级 本文梳理了AWS近20年来的关键服务演进。早期服务存在诸多限制:EC2实例不稳定、S3仅最终一致性、Lambda有5分钟超时等。如今EC2支持实时配置变更,S3实现读写一致性,Lambda运行时长延至15分钟。网络方面,VPC对等连接优化为Transit Gateway,CloudFront更新时间从45分钟缩短至5分钟。成本模型从预留实例转向Savings Plans,计费粒度细化至秒级。安全方面,默认启用加密和访问控制,IAM角色成为权限管理
2025-08-24 10:38:54
1156
原创 【AI Updates】DeepSeek-V3.1开启智能体新时代
DeepSeek-V3.1发布,开启智能体时代新篇章。该版本核心创新为"混合推理"模式,支持"思考"与"非思"两种模式,通过界面按钮或API端点切换。"思考模式"显著提升效率,在多步推理、工具使用等智能体任务中表现优异,支持128K长上下文。技术更新包括840B token的持续预训练、Anthropic API兼容及严格函数调用支持。V3.1 Base和V3.1开源权重已发布,新定价将于2025年9月5日生效。
2025-08-22 13:00:55
1182
原创 浏览器自动化革命:Playwright到原生CDP的进化
此文章讨论了 Browser-Use 公司决定放弃 Playwright 浏览器自动化框架,转而直接使用 Chrome DevTools Protocol (CDP) 的原因。
2025-08-22 09:15:00
1652
原创 【AI Infra】关于GPU架构、性能、扩展
本文深入探讨了 NVIDIA GPU 的工作原理、互联方式以及它们如何影响大型语言模型(LLMs)的扩展,并与TPU进行了比较。
2025-08-21 09:57:19
848
原创 【GenDev】关于Cursor的一些基础问题
Cursor,这是一款由Anysphere开发的人工智能驱动代码编辑器,自2023年3月发布以来,因其创新性的人工智能集成而迅速普及。文章分析了Cursor的关键功能,例如人工智能代码自动补全、聊天助手、内联编辑模式、BugBot、后台代理以及持久的项目知识(通过规则和记忆实现)。此外,该内容还深入探讨了Cursor的基础设施,包括其广泛使用的云服务提供商和用于支持每天数十亿次人工智能代码完成的各种工具,同时强调了该产品对速度和用户隐私的重视。
2025-08-20 15:50:21
1139
原创 【总结】网络安全基础知识
基础知识什么是网络安全采取必要措施,来防范对网络的攻击,侵入,干扰,破坏和非法使用,以及防范一些意外事故,使得网络处于稳定可靠运行的状态,保障网络数据的完整性、保密性、可用性的能力CIA。举例:QQ被盗:保密性受到侵犯,可能被举报,删好友,亲人受骗数据被黑:完整性受到侵犯,个人权限被入侵破解,重要数据被盗取或者删除数据被加密:可用性受到侵犯,勒索病毒加密重要数据,并勒索赎金网络安全有哪些术语?漏洞:可能被一个或者多个威胁利用的资............
2025-04-04 22:30:00
1318
原创 【操作教程】在亚马逊云科技上使用n8n快速构建个人AI NEWS助理
使用开源工具N8N构建您的ai news助理,并每天推送新闻到notion里
2025-04-04 18:10:30
2026
原创 【linux】关于内存相关指标、内存回收、内存泄漏、内存调优等一些内存优化问题~
本文分别从以下几个部分展开,内存瓶颈有什么特征?如何去优化?以及怎么去衡量一个系统的内存情况,有什么指标和工具?内存泄漏怎么发现,内存回收相关知识,另外,还给出了一些常见的内存调优方法和内核调整参数。
2022-11-22 11:28:11
1820
原创 【容器网络】跨主通信网络实现方法之host-gw实现原理
本文主要讲述容器跨主机通信实现方法原理解析之host-gw实现、包括flannel插件的host-gw实现原理,calico插件的host-gw,IPIP模式实现原理
2022-11-15 17:48:00
1448
原创 【安全】对称加密、非对称加密、数字签名和CA是什么?
今天学习了关于网络通信过程中的安全相关的知识,还有一些基础的概念,现做以总结,博客的图示都是自己画的,如果能够有助于你的理解,请点个赞收藏一下~~
2022-11-08 22:01:58
2374
原创 【栈】python、单调栈解决收集雨水问题、力扣42题
解释:上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图,在这种情况下,可以接 6 个单位的雨水(蓝色部分表示雨水)。给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。输入:height = [0,1,0,2,1,0,1,3,2,1,2,1]输入:height = [4,2,0,3,2,5].........
2022-08-06 17:03:18
425
原创 【系统】什么是中断?如何处理软中断过多?
Linux 系统为了解决中断处理程序执行过长和中断丢失的问题,将中断过程分成了两个阶段,分别是「上半部和下半部分」。
2022-07-29 17:11:17
1497
原创 【K8S】详解容器网络中的overlay、underlay
Underlay网络性能优于Overlay网络。Overlay网络利用隧道技术,将数据包封装到UDP中进行传输。因为涉及数据包的封装和解封,存在额外的CPU和网络开销。虽然几乎所有Overlay网络方案底层都采用Linuxkernel的vxlan模块,这样可以尽量减少开销,但这个开销与Underlay网络相比还是存在的。所以Macvlan、Flannelhost-gw、Calico的性能会优于Dockeroverlay、Flannelvxlan和Weave。............
2022-07-28 09:00:00
6073
原创 【云存储】云存储技术的概念和其优势
云存储是在云计算概念上衍生、发展出来的一个概念,它除了可以节省整体的硬件成本(包括电力成本)外,还具备良好的可扩展性、对用户的透明性、按需分配的灵活性和负载的均衡性等特点。近年来,虽然已经有很多公司推出了云存储产品,包括AmazonS3,MicrosoftAzure,GoogleAppEngineP使用的Datastore,以及GoogleCloudStorage等。云存储是通过网络将大量普通存储设备构成的存储资源池中的存储和数据服务以统的接口按需提供给授权用户。超大规模。.........
2022-07-21 09:20:56
5136
原创 awk,sed,grep,shell编程题目总结【更新ing】
一、文档处理写一个 bash脚本以统计一个文本文件 nowcoder.txt中每一行出现的1,2,3,4,5数字个数并且要计算一下整个文档中一共出现了几个1,2,3,4,5数字数字总数。假设 nowcoder.txt 内容如下:a12b810ccc2521abc9asf你的脚本应当输出:line1 number: 2line2 number: 1line3 number: 4line4 number: 0sum is 7#!/bin/bashexec<nowcode
2022-05-31 22:07:48
3373
原创 【K8S集群搭建记录】centos7上使用haproxy+keepalived+docker搭建k8s集群
1、查看防火墙,iptables规则是否禁用getenforce firewalldgetenforce iptables必须保证这两个都是 disabled2、关闭selinux:getenforce 为disable如果没有关闭的话vim /etc/selinux/config将SELINUX设置为disable3、关闭swap(我安装的v1.23.0不关闭也没报错,所以我没关闭,早一些的版本是需要关闭的,这里提供关闭的方法)swapoff -a #暂时关闭永久关闭vim
2022-05-22 20:47:27
781
原创 【Docker】Why docker、Docker容器网络、docker常用命令
目录虚拟化技术的分类:主机级虚拟化技术的实现:type-I:type-II:容器级虚拟化:Docker和虚拟机有什么区别?linux的6种名称空间:docker容器网络自定义docker0桥的IP地址:如何实现两主机间docker通信如何创建自定义docker桥docker常用命令:创建容器终止容器删除容器、镜像:docker inspect 获取镜像或者容器的元数据:容器交互,查看容器运行日志:.........
2022-05-20 08:15:00
406
原创 【Docker】docker镜像的获取、制作方法、Dockerfile
目录docker镜像docker镜像的获取:docker镜像的制作方法:基于容器制作镜像:基于docker file制作:dockerfile instructions:FROM:COPY:WORKDIR:ADD:VOLUME:EXPOSE:ENV:RUN:COMMAND:ENTRYPOINT:USER:根据entrypoint文件编译镜像:容器健康状况检测:总结之前学习docker的笔记,如有描述不当的地方,欢迎评论区留言~.
2022-05-19 17:57:15
2843
原创 【AWK】awk 基础用法和应用
很久之前学的AWK,现在回看笔记,对其进行一个小小的总结~awk可以做什么?1. 能够将给定的文本内容,按照我们期望的格式输出显示,打印成报表。2. 分析处理系统日志,快速地分析挖掘我们关心的数据,并生成统计信息;3. 方便地用来统计数据,比如网站的访问量,访问的 IP 量等;4. 通过各种工具的组合,快速地汇总分析系统的运行信息,让你对系统的运行了如指掌;5. 强大的脚本语言表达能力,支持循环、条件、数组等语法,助你分析更加复杂的数据;awk 比较擅长处理格式化的文本,比如 日志、cs
2022-05-18 21:00:43
1229
原创 【自用代码】yolov5数据预处理代码:python批量修改xml某字段,Coco格式转VOC格式
'''task:改变name字段由WuLongTea-sandeliwww 改为WuLongTea-sandelidate:2022-4-15author:epiphanyref:https://blog.csdn.net/weixin_42384743/article/details/113982063'''import osimport os.pathimport xml.dom.minidompath="H:\\Acolab\\goods\\WuLongTea-sandeli\\an
2022-05-18 17:44:28
806
原创 【数据结构】数据结构基础知识
二叉树是指每个节点最多有两个分支(分支的度小于2)的树结构,可为空树分类:1、完全二叉树在一棵二叉树中,除了最后一层,都是满的,并且最后一层或者是满的,或者是右边缺少连续若干节点,成为完全二叉树。如图所示2、满二叉树一棵深度为k,并且有 个节点的二叉树,成为满二叉树。如图所示:堆(heap)是计算机科学中**一类特殊的数据结构**的统称。堆通常是一个可以被看做**一棵树的数组对象**。其性质:1.堆中某个节点的值总是不大于或不小于其父节点的值。2.堆总是一棵完全二叉树。![在这里插
2022-05-04 23:39:59
885
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1