自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(174)
  • 收藏
  • 关注

原创 基于大模型应用技能的学习路径

通过以上分阶段的学习计划,您可以逐步掌握大模型应用工程师所需的核心技能,并具备实际应用能力。建议每日投入2-3小时系统性学习,配合周末4-6小时实战,可在6个月内达到高级开发工程师水平。重点关注HuggingFace生态和PyTorch Lightning框架,这两个是当前企业的主流技术栈。

2025-04-09 10:49:20 767

原创 Neo4j Python SDK手册

默认情况系统会自动创建一个事务, 一个事务就是一个工作单元一个语句, 不支持在多个查询之间穿插客户端逻辑(事务交叉)创建会话会话不是线程安全的, 每个线程应当创建自己的会话...查询结果的所有记录处理完毕后,服务器会返回执行摘要以结束事务。查询计数器——服务器上触发的查询发生了哪些变化查询执行计划——数据库将如何执行(或已经执行)查询通知— 服务器在运行查询时发出的额外信息时间信息和查询请求摘要普通任务获取摘要。

2026-01-22 14:10:17 723

原创 neo4j安装和使用

想做什么命令模板添加一个人CREATE (:标签 {名字:'张三'})找人MATCH (p:标签 {名字:'张三'}) RETURN p修改信息MATCH (p {名字:'张三'}) SET p.新属性='值'删除人MATCH (p {名字:'张三'}) DELETE p建立关系CREATE (张三)-[:关系]->(李四)删除关系MATCH ()-[r:关系]->() DELETE r图 = ∑(节点 + 节点信息) + ∑(边 + 边信息)社交网络(谁认识谁)推荐系统(买了A的人也买了B)

2026-01-19 22:57:42 601

原创 MySQL/PgSQL设计思想总结

MySQL的设计背景是“为互联网时代打造一个快速、易用的数据库”,强调部署简便和读性能。PostgreSQL的设计背景是“构建一个功能完整、标准兼容、可扩展的关系型数据库”,源于学术研究,注重数据完整性和高级功能。两者如今都在不断演进,功能差距逐渐缩小,但其底层设计理念仍影响着各自的使用场景和用户偏好。功能/组件MySQLPostgreSQL架构模型多线程 + 可插拔存储引擎多进程 + 单一存储系统存储引擎多种(InnoDB、MyISAM 等),可切换仅一种,高度集成并发控制。

2026-01-08 16:47:06 929

原创 Django/Flask/FastAPI简要对比分析

Django 是“全功能老兵”,Flask 是“轻量自由派”,FastAPI 是“高性能新锐”。

2026-01-08 11:47:50 748

原创 FastAPI 设计思想总结

用 Python 的类型系统,以最少的代码,构建高性能、自文档化、类型安全的现代 Web API。组件类型所属项目在 FastAPI 中的角色FastAPI应用类FastAPI主应用容器,协调路由与元数据生成StarletteASGI 框架Starlette提供底层 HTTP/WebSocket/中间件能力Pydantic数据验证库Pydantic请求/响应模型定义、验证、序列化UvicornASGI 服务器Uvicorn运行 FastAPI 应用的生产级服务器APIRouter。

2026-01-07 13:20:40 690

原创 页缓存技术(PageCache/sendfile/mmap)

PageCache:操作系统级缓存,是高性能 I/O 的基石;mmap:让用户态高效写入文件,减少系统调用;sendfile:实现真正的零拷贝网络传输,释放 CPU;💡三者结合 = 最大化利用硬件(DMA)、最小化 CPU 干预 = 极致 I/O 性能。

2026-01-06 13:34:31 924

原创 RocketMQ 设计思想总结

所有消息统一顺序追加写入一个共享的 CommitLog 文件(物理层),再为每个 MessageQueue 异步构建轻量级索引文件 ConsumeQueue(逻辑层),消费者通过 ConsumeQueue 快速定位 CommitLog 中的消息位置。基于这些实际业务痛点,阿里巴巴团队设计并实现了 RocketMQ,最初用于支撑淘宝、天猫等核心业务的消息流转。11. 返回一批消息 ("PullResult", 含消息列表 + nextBeginOffset)

2026-01-05 14:31:26 921

原创 Kafka 设计思想总结

因此,LinkedIn 工程师 Jay Kreps 等人设计了 Kafka,将其作为“分布式提交日志”(distributed commit log)来构建高吞吐、低延迟、可扩展、持久化的消息系统。传统的日志收集系统(如基于数据库或文件的日志聚合)无法高效、可靠地处理如此高吞吐量的数据。LinkedIn 内部有多个系统需要消费相同的数据流(如实时监控、离线分析、推荐系统等),缺乏一个高性能、可重放、持久化的统一发布-订阅平台。(Kafka 不是一个消息队列,而是一个分布式、持久化、可扩展的日志系统。

2026-01-05 13:02:27 1008

原创 标准化的现实意义和哲学

由来看:标准化是人类对抗混沌、实现规模协作的文明工具,从秦朝度量衡到K8s API,一脉相承;边界看:它在可分解、目标明确、环境稳定的领域威力巨大,但在创造、复杂、价值多元、快速变化的领域需谨慎使用。何时用标准化筑牢地基,何时留白让生命生长。正如建筑师路易斯·康所言:“砖想成为什么?”——标准化提供“砖”,但伟大的建筑永远来自对“砖之可能性”的超越。

2026-01-04 18:09:12 656

原创 高并发服务设计思路

的排查原则,从客户端开始逐层深入到基础设施层。中间件层 (Middleware Layer)监控运维层 (Observability)数据存储层 (Storage Layer)边缘网络层 (Edge Network)消息队列 (Message Queue)服务层 (Service Layer)网关层 (Gateway Layer)缓存层 (Cache Layer)客户端层 (Clients):确保所有IO操作都是异步的。1. HTTPS请求。- 灵活Schema。RT异常升高通常遵循。

2026-01-04 13:27:23 708

原创 Ray 设计思想总结

Ray 是为动态、细粒度、高并发的 AI/ML 工作负载量身打造的运行时,其Object Store + 异步 Pull + 去中心化调度架构极具启发性。但在借鉴时,应聚焦其内存模型与调度哲学,而非简单套用序列化方式。同时,明确其边界——不是万能分布式框架,而是 AI 时代的“分布式胶水”。Ray 的异步 pull 模型是其面向动态、细粒度、高并发 AI 任务的核心设计之一。它通过“懒加载 + 按需拉取 + 共享内存 + 异步传输”的组合,在保证易用性的同时,实现了高性能和资源效率的平衡。

2026-01-02 10:37:59 669

原创 REST/gRPC/队列通信模式对比

RISELab 的研究重点是“实时智能与安全”,因此 Ray 被设计为支持低延迟、高吞吐、可扩展且容错的分布式执行引擎,特别适合构建实时 AI 系统。研究人员和工程师希望有一个统一的框架,既能用于分布式训练、也能用于推理服务、自动调参、模拟仿真等场景,而无需为每种任务使用不同的系统。传统的分布式系统(如 Spark)基于批处理模型,任务调度开销大,难以支持细粒度、动态的任务图(task graph)。同时,Ray 的架构(如基于共享内存的对象存储、去中心化的任务调度)使其能够线性扩展到数千节点。

2026-01-01 18:56:34 892

原创 PythonGIL

是 CPython 解释器(即官方 Python 实现)中的一个全局互斥锁(mutex),它确保同一时刻只有一个线程在执行 Python 字节码。注意:GIL 是CPython 特有,不是 Python 语言标准。其他实现如 PyPy、Jython、IronPython没有 GIL。

2025-12-29 10:21:12 604

原创 Web安全之SQL注入-CSRF-XSS

攻击者通过在用户输入中嵌入恶意 SQL 片段,绕过应用逻辑,直接操作数据库。示例(危险代码):→ 可导致:数据泄露、删除表、提权、远程命令执行(如 PostgreSQL 的 COPY TO)攻击者诱导已登录用户访问恶意网站,该网站自动向目标站点(如银行)发起带 Cookie 的请求(如转账),利用用户身份执行非意愿操作。前提:用户已登录目标站 + 请求无二次验证。攻击者将恶意脚本(JavaScript)注入网页,当其他用户浏览时执行,窃取 Cookie、会话、钓鱼等。分类:示例:

2025-12-29 10:06:20 1159

原创 Redis 设计思想总结

事件驱动模型(单线程 + I/O 多路复用): Redis采用单线程(主线程)的事件驱动架构, 通过I/O多路复用(epoll/kqueue/select)同时监听多个客户端的连接, 避免多线程上下文切换和锁竞争, 保证执行的原子性同时高效。客户端与 RESP 协议: Redis自定义的文本协议, 简单, 可读, 高效, 兼容TCP长链接, 是Redis客户端库的基础。例如:我会完善它的认证系统, 支持更多的认证方式和加密策略, 或者基于现有的使用考量Redis内部可以出一个内置的白名单系统。

2025-12-26 18:17:10 558

原创 业务应用系统类型和常用名词

这些术语构成了现代软件工程,尤其是敏捷开发、DevOps 和云原生时代的“通用语言”。掌握它们有助于理解团队协作方式、评估交付效能,并推动高质量软件的快速迭代。是其中最核心的概念之一。下面我将系统地为您解释 CI/CD 的含义,并列举其他常见的相关术语及其意义。在软件开发中,确实存在许多缩写和指标名词,用于描述开发流程、质量保障、交付效率等方面。,而非编程中的“设计模式”。高效能团队通常:部署频繁、前置时间短、MTTR 短、失败率低。:提高软件交付速度、降低发布风险、提升质量。

2025-12-25 00:17:40 729

原创 APM项目分析

项目主要支持语言链路精细度是否收费性能影响(CPU/内存)多语言(含移动端)高(自动+火焰图)是1%~5% / 中等New Relic多语言高(端到端+黄金信号)是2%~7% / 中高Dynatrace多语言(含 C/C++)极高(PurePath 方法级)是<2%~5% / 高(OneAgent)Jaeger所有(通过 OTel)中(需手动埋点)否<1% / 低SkyWalkingJava/.NET/Go/Node.js 等高(自动探针+拓扑)否。

2025-12-25 00:11:39 515

原创 鉴权方式对比

鉴权方式优点缺点适用场景API Key实现简单、轻量、适合机器间通信密钥易泄露、难以撤销、无用户上下文内部微服务、第三方 API 接入Basic Auth标准化、实现简单明文编码(非加密)、必须依赖 HTTPS、无法细粒度控制简单内部工具、CLI 工具(配合 HTTPS)SAML支持企业级 SSO、安全性高、与 AD 集成好复杂、XML 开销大、前端跳转多企业内网系统、B2B SSOJWT无状态、可自包含信息、适合分布式系统令牌一旦签发难撤销(需黑名单)、过期时间管理重要。

2025-12-24 18:26:38 764

原创 Celery 设计思想总结

例如:序列化模式可能有待改进, 比如调用时输入一个数据库连接可能导致失败, 和反序列化攻击, 可以引入类似 Pydantic 的 任务签名验证,支持类型注解 + 序列化边界定义,让开发者清楚知道“什么能传,什么不能传”。强一致性事务场景: Celery 是“至少一次”交付(at-least-once),可能重复执行, 若任务不具备幂等性,会导致数据重复写入, 不适合银行转账等需要“恰好一次”(exactly-once)语义的场景。随着 Web 应用的发展,越来越多的业务逻辑变得复杂且耗时。

2025-12-24 15:39:24 702 1

原创 Python线程进程和事件循环调度文件描述符

特性多线程/多进程模型异步事件循环模型并发单位线程 / 进程协程(轻量级任务)内存开销高(每个线程有独立栈)极低(共享栈上下文)上下文切换由操作系统调度,较重用户态切换,极快I/O 阻塞线程会被挂起协程await时让出控制权并发能力受限于线程数/GIL数千级并发连接典型用途CPU 密集型 / 同步接口高并发 I/O(如 Web API)

2025-12-24 11:39:15 973

原创 Django 设计思想总结

面对紧迫的截止日期和复杂的业务需求(如内容管理、用户交互、多作者协作等),他们发现当时已有的 Web 开发工具效率低下、重复代码多、缺乏统一结构。Context 注入数据\n(render(request, 'tpl.html', ctx))QuerySet 是否被求值?\n(e.g. list(), len(), for loop)调用 as_view() → dispatch() → get/post/...()执行 SQL 查询\n(connection.cursor.execute())

2025-12-24 11:13:30 893

原创 架构设计原则

维度核心问题关键实践可扩展性能否应对增长?水平扩展、无状态、分片可用性故障时能否继续服务?冗余、熔断、降级性能响应快吗?吞吐高吗?缓存、异步、批处理安全性数据和系统是否受保护?零信任、最小权限、加密可维护性能否快速修改?模块化、清晰抽象、文档可测试性能否验证正确性?依赖注入、Mock、确定性成本是否物有所值?成本建模、资源优化演进能力能否适应未来?抽象层、插件化、兼容性设计数据治理数据可信、一致、可追溯吗?主数据管理、数据契约、血缘追踪组织适配。

2025-12-24 11:12:50 717

原创 Flask 设计思想总结

Flask 由 Armin Ronacher 于 2010 年创建,最初是作为 Pocoo 项目的一部分(Pocoo 是一个由 Armin 领导的开源 Python 项目集合)。当时,Python 社区已有像 Django 这样功能全面但“大而全”的 Web 框架,但也存在对更轻量、更灵活工具的需求。Armin Ronacher 受到 Ruby 的 Sinatra 框架启发(一个极简的 Web 框架),希望在 Python 中实现类似的理念:简单、可扩展、不强制开发者遵循特定结构。因此,Flask 应运而生

2025-12-22 16:44:53 1166

原创 Airflow简介和架构

自定义对象传递需要添加和self.x = x")

2025-12-19 16:17:46 1396

原创 认知和思维模式

思维模式核心问题关键优势典型应用场景第一性原理事情最基本的真相是什么?突破创新,打破惯性技术创新、创业、复杂问题求解系统思维各部分如何相互影响?看见全局,避免副作用组织管理、政策制定、生态问题反向思维如何避免失败?防患未然,识别风险决策、风险管理、个人成长概率思维各种结果发生的可能性是多少?应对不确定性,理性决策投资、医疗、战略规划长期主义这个选择在10年后会怎样?利用复利,建立持久优势职业发展、财富积累、教育可证伪性思维什么证据能证明我错了?

2025-12-10 17:16:33 708

原创 生成书评Prompt

请你扮演一位资深书评人、文学教授和热情的知识分享者。你将为我详细介绍一本书,要求整个介绍分为四个逻辑严谨、层层递进的阶段,最终形成一个强有力的总结。介绍需满足:**主题思想突出、内容细节丰富、文笔优美富有感染力、概括精炼且见解独到, 让我可以感同身受, 并以讲故事的方式进行呈现. 不要古板教条式分析, 重点要求不得浮夸语言需要易懂(让人产生共情)!

2025-11-29 23:14:40 202

原创 Peppa Pig - The Tooth Fairy

综上,整句直译是“并且在它原来的位置上,她将留下一枚闪亮的硬币”,但中文讲究简洁流畅,因此调整语序和表达,译为:“她将在那里留下一枚闪亮的硬币。这句话可以翻译为:“她将在那里留下一枚闪亮的硬币。

2025-11-25 19:22:10 529

原创 Peppa Pig - Mummy Pig‘s Birthday

【代码】Peppa Pig - Mummy Pig‘s Birthday。

2025-11-20 10:04:02 407

原创 Peppa Pig - The School Fete

【代码】Peppa Pig - The School Fete。

2025-11-17 18:06:18 318

原创 Peppa Pig - New Shoes

所以,“Peppa is putting on her boots.” 自然要翻译为“佩佩正在穿她的靴子”,而不是“佩佩正穿着她的靴子”。)时,说她“正在穿靴子”,说明她。如果她说“她正穿着靴子”,那只是说明当前状态,不一定和“要去哪里”直接相关。” 这个固定结构中,它并不表示单纯的“喜欢”,而是用来。为什么“putting”可以翻译成“穿她的靴子”,而不用“wear”?并不是指“喜爱某物”的情感,而是与 “would” 搭配构成。的区别,以及为什么在描述“正在穿鞋/靴子”的动作时要用。

2025-11-14 13:36:58 844

原创 人称代词和物主代词

人称代词是用来代替人或事物的词,避免重复说同一个名词(比如不说 “Tom and Mary are here. Tom and Mary are happy.” 而说 “They are happy.”)。人称代词根据人称(第一、第二、第三)单复数和在句中的作用(主格/宾格)分为不同形式。物主代词表示“属于谁”,即“某人的”或“某人的东西”。

2025-11-13 11:06:20 878

原创 Peppa Pig - Dressing Up

Peppa: WoW!All done!George!George!

2025-11-12 16:46:53 885

原创 Peppa Pig - Frogs And Worms And Butterflies

are” 并非“不发音”,而是弱读 + 连读 + 同化导致其音变得模糊甚至融入前后音。这是英语母语者自然语流的一部分,属于语音弱化(reduction)现象。类似现象广泛存在于日常口语中,尤其是功能词(be 动词、助动词、介词、冠词等)。

2025-11-10 19:46:17 430

原创 深度学习-池化层

X代表原始的矩阵, Y代表边缘检测, 需要一定程度的平移不变形, 比如照明, 无题位置和外观等等图像不会因为剧烈的变化导致边缘检测失败。填充和步幅和卷积层类似, 没有可以学习的参数, 在每个输入通道应用池化层以获得相应的输出通道, 输出通道=输入通道。X代表垂直边缘检测, Y代表卷积输出, Z代表(2 * 2)最大池化效果。每次根据窗口滑动作为输入数据, 得到输出, 然后通过。平均池化层: 将最大池化层中的"最大"操作替换为平均。最大池化层: 每个窗口中最强的信号。把最大的值拿出来也称为最大池化层。

2025-11-05 19:47:36 865

原创 卷积层里的多输入和多输出通道

比如这张图片中可以针对这个猫的图片使用不同的卷积核得到不同的通道结果, 然后输出通道核可以组合输入中的模式。无论有多少输入通道, 目前为止我们只用到单输出通道, 我们可以有多个三维卷积核, 每个核生成一个输出通道。彩色图像可能有RGB三个通道, 如果进行转换为灰度会丢失信息。每个通道都有一个卷积核, 结果是所有通道卷积结果的和。在深度神经网络中, 每个通道可以识别特定的模式。代表频道(RGB),, 有多少输入的维度。

2025-10-30 09:30:29 314

原创 Peppa Pig - Musical Instruments

中文虽然没说“那把”,但“这”字已表明是眼前特定的一把琴,上下文清楚,所以“这把”即可,不必强调“那把”。如果说:“这是我过去常常在我小时候演奏的小提琴”,反而显得啰嗦。而“这是我小时候拉的小提琴!在中文中,“小时候拉的”已经隐含了“过去常常做、现在可能不做了”的意思,因此不需要直译“used to”,也能传达原意。所以,“play the accordion” 在中文里最地道的说法就是。“play” 是“演奏”的意思,但中文中对不同乐器会使用不同的动词搭配。= “这是我小时候常常拉的那把小提琴!

2025-10-28 11:55:45 334

原创 卷积层里的填充和步幅

给定(32 * 32)输入图像, 应用(5 * 5)大小的卷积核。更大的卷积核可以更快地减小输出大小, 形状从。, 带入公式后输入和输出的形状不会发生改变。填充减小的输出大小与层数线性相关。如果输出高度和宽度可以被步幅整除。, 那么上面的公式可以简化为。Input: 原始的输入。Output: 新的输出。Kernel: 卷积核。的步幅, 输出形状是。

2025-10-27 19:37:43 866

原创 Peppa Pig - Gardening

Catch!Grrrrr!Yes!Peppa: Oh…Mmmm!Grandpa!Peppa: No!No!George!We’re back!Grandpa!Look!Peppa: Yes!

2025-10-26 21:12:46 785

原创 Peppa Pig - Daddy Loses His Glasses

问题回答为什么用 aren’t?因为主语是they(复数),be 动词要用are,否定就是aren’t。can translate as “但是现在它不在了”?意思接近,但不够准确。应改为“它们不在了”以保持复数一致。为什么用 they 指眼镜?因为glasses在英语中是复数名词,尽管中文视为一个整体。→ 但是它们现在不在那儿了。→ 不过现在它们都不见了。→ 可是现在它们已经不在那里了。→ 现在进行时(present continuous tense)

2025-10-24 17:03:31 979

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除