菲橙-CSDN博客

原创 5.2 MCP服务器

摘要：MCP服务器是一种轻量级能力插件，采用C/S架构，为LLM/Agent提供标准化资源、工具和提示词三类能力，同时安全访问本地/远程数据源。其核心功能包括：Resources（访问本地静态资源）、Prompts（定制AI提示词）和Tools（封装可执行函数）。开发示例展示了如何构建天气查询工具服务，并通过FastMCP框架实现工具注册和异步API调用。测试时可通过CherryStudio等客户端工具进行调用，工作流程包括：模型推理→工具调用编排→结果返回→生成最终回答。该架构实现了AI模型与外部系统的高

2025-10-30 14:31:29 981

原创 2.5 大模型硬件

本文系统介绍了GPU的关键概念与技术特点。首先解析了GPU与显卡的区别，指出GPU是显卡的核心运算部件。通过对比CPU架构，说明GPU擅长并行处理大量简单运算的特点。详细列举了H100、A100等主流GPU的性能参数，并深入分析了PCIe、NVLink和NVSwitch三种通信协议的差异。文章还比较了HBM与GDDR显存的封装技术差异，探讨了FP64到FP8等不同计算精度及其应用场景。最后，阐述了混合精度训练的技术原理及其在大模型训练中的优势。全文全面覆盖了GPU的硬件架构、性能指标和关键技术，为理解GPU

2025-10-29 17:30:52 871

原创 2.4 大模型术语

本文从技术角度解析了大模型工作流程及训练优化方法。文章首先详细介绍了大模型的工作流程，包括提示词处理、分词、嵌入、Transformer计算等环节；然后对比分析了稠密模型、稀疏模型和MoE模型的特点；接着探讨了模型压缩技术（如蒸馏和量化）的原理与应用；最后阐述了训练（预训练与后训练）、微调（全量与参数高效）和推理的技术要点，并对比了单机/多机不同部署模式（TP/EP）的适用场景。全文系统梳理了大模型全流程技术方案，为相关研究和工程实践提供了全面参考。

2025-10-29 17:29:42 871

原创 2.3 大模型架构

Transformer 架构。

2025-10-29 17:27:33 158

原创 2.2 AI应用场景

本文概述了AI在自然语言处理（NLP）、计算机视觉（CV）和语音识别合成（ASR/TTS）三大领域的主要应用场景。NLP涵盖文本生成、对话系统、情感分析等；CV包括图像分类、目标检测、OCR等；语音技术涉及语音转文字、虚拟人配音等。文章还列举了三者融合的应用（如数字人、智能驾驶），并按教育、医疗等行业分类展示了典型AI案例，呈现了AI技术在各领域的深度渗透与多样化发展。

2025-10-29 17:26:25 364

原创 2.1 AI与大模型介绍

人工智能经历了从早期基于规则的符号主义（1950s–1980s），到统计机器学习（1980s–2010s），再到深度学习（2012年至今）和大模型（2020年至今）的发展历程。核心区别在于机器学习依赖人工特征工程，而深度学习可自动提取特征；传统深度学习处理单一任务，大模型则具有通用性，支持多任务和多模态。当前，大模型通过规模化（数十亿至万亿参数）和自监督学习，展现出强大的推理和生成能力，推动AI向AGI（人工通用智能）迈进。同时，基于大模型的AIGC（AI生成内容）正在变革内容创作方式，涵盖文本、图像、音频

2025-10-29 17:24:31 516

原创 1.2 大模型学习资料

该摘要整合了机器学习基础知识和AI应用资源推荐：1）菜鸟教程(ML/Ollama教程)提供入门学习路径；2）李开复著作《AI未来进行时》探讨行业前景；3）Ollama/ComfyUI两款AI工具的技术文档；4）精选学习社区（赋范）及教程（彬彬侠CSDN专栏/LangChain指南、图灵课堂加密资料）。涵盖理论到实践的完整资源链，适合不同层次学习者。注：图灵课堂资料需密码"ghkq"访问。

2025-10-29 11:55:54 247

原创 1.1 学习路线图

2025-10-29 11:51:12 103

原创如何利用JAVA自定义一个线程池

先来一张图主线程往阻塞队列中PUT 任务（TASK,这里我们可以认为是一个RUNNABLE）线程池冲阻塞队列中获取任务，如果线程池中的线程满了就需要等待某个线程任务执行完成并释放后再从队列中获取数据我们自定义的线程池分为以下几个步骤自定义阻塞队列自定义拒绝策略自定义工作者线程自定义线程池修改线程池参数，并进行测试1 自定义一个阻塞队列/**...

2020-03-29 13:43:39 608

原创 Flink 整合 Nacos实现动态服务配置功能Demo

1 前言当我们开发Flink程序的时候一些配置或一些规则可能需要根据系统要求或需求发生变更，一般常见的做法我们可以开启通过将配置或规则存储到数据库（如MYSQL,REDIS），然后通过在程序中我们自己通过JDBC连接的方式去读取规则。这样做比较麻烦，我们可以通过阿里开源的NACOS来协助我们实现这样的功能，NACOS 官网是如下定义的:Nacos 致力于帮助您发现、配置和管理微服务。Na...

2020-02-26 21:54:18 3373

原创 Flink SQL快速构建实时计算平台

1 描述利用FLINK SQL 构建一个数据实时分析平台,主要包含以下两个需要实现的需求点1 FLINK SQL 从KAFKA消费数据，并将数据写入到ES 通过KIBANA查询2 FLINK SQL 从KAFKA消费数据，计算每十分钟用户独立数据（UV）2 系统版本1 Java 8+2 flink 1.10 +3 elasticsearch 6+4 kibana 6...

2020-02-25 13:58:09 2168 1

原创解析SparkStreaming和Kafka集成的两种方式

spark streaming是基于微批处理的流式计算引擎，通常是利用spark core或者spark core与spark sql一起来处理数据。在企业实时处理架构中，通常将spark streaming和kafka集成作为整个大数据处理架构的核心环节之一。针对不同的spark、kafka版本，集成处理数据的方式分为两种：Receiver based Approach和Direct App...

2020-02-22 22:24:14 377

原创利用Flink迁移MYSQL数据Demo

环境1 Flink 1.4.12 java 1.8+3 mysql 5.7+Demo需求利用Flink从MYSQL数据库迁移数据并对数据进行处理后将数据迁移到另一个MYSQL库案例代码package com.bigdata.flink.java.demo;import com.bigdata.flink.scala.Constants;import ...

2020-02-22 12:01:01 1398 1

转载 Spark消费kafka的方式和区别

https://blog.csdn.net/woloqun/article/details/80635304

2019-11-08 23:10:05 277

原创利用JAVA代码获得各操作系统内存

各系统获取系统内存的指令系统命令 window wmic memorychip get capacity linux cat/proc/meminfo mac sysctl hw.memsize FreeBSD sysctl hw.physmem Java 获取系统内存package com.bigdata.sampler;...

2019-08-29 22:56:21 857

原创成为一个卓越JAVA开发者的10个步骤

1 基础好和理解OOP原理对于java开发者来说，必须要很好的理解面向对象编程。如果对面向对象编程理解不到位,就不能理解类似于java这样面向对象编程语言的优美之处。如果你不能理解OOP的好处，即使你目前使用OOP编程，也是在使用过程的方式进行编码。仅学习面向对象的原理并没有多大的帮助。我们应该知道如何运用面向对象原理设计一个解决方案。因此我们需要对设计模式，继承，多态，封装等有较好的理解...

2019-08-26 17:37:58 220

原创一文搞懂 Flink 的 Exactly Once 和 At Least Once【总结】

一文搞懂 Flink 的 Exactly Once 和 At Least Oncehttps://mp.weixin.qq.com/s/ZbDzxDgd9phmNIVhNhXImwBarrir总结1 Source会自动的插入一个Barrir 跟随Kafka消息一同发送到下游Operator算子2 当Operator1接收到Barrair（b1）后将触发checkpoint触发器...

2019-08-09 16:43:25 2499

原创 Yammer Metrics的使用

Yammer Metrics简介最近用到的某个框架，其官网提到利用Yammer Metrics来测量系统运行状态，需要对其统计的具体参数有个基本的了解，OK，那就需要弄清几个简单的问题：Yammer Metrics是什么？ Yammer Metrics收集哪些数据？ Yammer Metrics收集数据的基本过程、原理？Yammer Metrics的官网上述列了几个问...

2018-12-22 10:31:45 2947

翻译 Neo4j Cypher -> 介绍

本章包含了完整的，权威的Cypher查询语言文档简介简短的介绍可以查阅Section 3.1.1, “What is Cypher?，查看Section 2.2, “Get started with Cypher”.获得Cypher初始了解，更多术语查阅 Appendix B, Terminology.什么是Cypher graph更新和查询事物 Uniqueness(独特性...

2018-11-27 22:27:03 867

原创 Neo4J 图形数据库安装

下载Neo4j：neo4j-community-3.4.10-unix.tar.gz下载地址：https://neo4j.com/download-center/#releases 解压 neo4j-community-3.4.10-unix.tar.gztar -xvf neo4j-community-3.4.10-unix.tar.gz 创建软连接ln -s neo...

2018-11-27 20:54:18 260

原创 SHELL编程笔记

1 普通变量略2 系统专用变量shell在初始化的时候会在执行profile等初始化脚本，脚本中定义了一些环境变量，这些变量会在创建子进程时传递给子进程。用env命令可以查看当前的环境变量。常用的系统环境变量如下：_(下划线) 上一条命令的最后一个参数变量名称描述 $UID 展开为当前用...

2018-09-20 14:13:29 665

翻译 Streaming(DataStream API): 概念介绍

Streaming(DataStream API)原文参考:https://ci.apache.org/projects/flink/flink-docs-release-1.6/dev/datastream_api.html#collection-data-sources Overview Flink DataStream Api 编程指南在Flink中的DataSt...

2018-09-20 00:11:09 3451

转载分布式系统的事务处理

当我们在生产线上用一台服务器来提供数据服务的时候，我会遇到如下的两个问题：1）一台服务器的性能不足以提供足够的能力服务于所有的网络请求。2）我们总是害怕我们的这台服务器停机，造成服务不可用或是数据丢失。于是我们不得不对我们的服务器进行扩展，加入更多的机器来分担性能上的问题，以及来解决单点故障问题。通常，我们会通过两种手段来扩展我们的数据服务：1）数据分区：就是把数据分块放在不同的...

2018-09-10 22:39:53 179

转载 Flink 原理与实现：内存管理

如今，大数据领域的开源框架（Hadoop，Spark，Storm）都使用的 JVM，当然也包括 Flink。基于 JVM 的数据分析引擎都需要面对将大量数据存到内存中，这就不得不面对 JVM 存在的几个问题：Java 对象存储密度低。一个只包含 boolean 属性的对象占用了16个字节内存：对象头占了8个，boolean 属性占了1个，对齐填充占了7个。而实际上只需要一个bit（1/8字节）...

2018-09-06 16:49:53 1904

转载 Flink 原理与实现：如何处理反压问题

流处理系统需要能优雅地处理反压（backpressure）问题。反压通常产生于这样的场景：短时负载高峰导致系统接收数据的速率远高于它处理数据的速率。许多日常问题都会导致反压，例如，垃圾回收停顿可能会导致流入的数据快速堆积，或者遇到大促或秒杀活动导致流量陡增。反压如果不能得到正确的处理，可能会导致资源耗尽甚至系统崩溃。目前主流的流处理系统 Storm/JStorm/Spark Streaming...

2018-09-06 10:19:39 3963 1

转载 Flink 原理与实现：Window 机制

Flink 认为 Batch 是 Streaming 的一个特例，所以 Flink 底层引擎是一个流式引擎，在上面实现了流处理和批处理。而窗口（window）就是从 Streaming 到 Batch 的一个桥梁。Flink 提供了非常完善的窗口机制，这是我认为的 Flink 最大的亮点之一（其他的亮点包括消息乱序处理，和 checkpoint 机制）。本文我们将介绍流式处理中的窗口概念，介绍 F...

2018-09-04 23:35:54 808

转载 Flink 原理与实现：理解 Flink 中的计算资源

本文所讨论的计算资源是指用来执行 Task 的资源，是一个逻辑概念。本文会介绍 Flink 计算资源相关的一些核心概念，如：Slot、SlotSharingGroup、CoLocationGroup、Chain等。并会着重讨论 Flink 如何对计算资源进行管理和隔离，如何将计算资源利用率最大化等等。理解 Flink 中的计算资源对于理解 Job 如何在集群中运行的有很大的帮助，也有利于我们更透彻...

2018-09-03 22:24:02 1078

转载 Flink 原理与实现：如何生成 StreamGraph

继上文Flink 原理与实现：架构和拓扑概览中介绍了Flink的四层执行图模型，本文将主要介绍 Flink 是如何根据用户用Stream API编写的程序，构造出一个代表拓扑结构的StreamGraph的。 StreamGraph 相关的代码主要在 org.apache.flink.streaming.api.graph 包中。构造StreamGraph的入口函数是 StreamGraph...

2018-09-02 17:33:11 2092

转载 Flink 原理与实现：架构和拓扑概览

架构要了解一个系统，一般都是从架构开始。我们关心的问题是：系统部署成功后各个节点都启动了哪些服务，各个服务之间又是怎么交互和协调的。下方是 Flink 集群启动后架构图。当 Flink 集群启动后，首先会启动一个 JobManger 和一个或多个的 TaskManager。由 Client 提交任务给 JobManager，JobManager 再调度任务到各个 TaskManager...

2018-09-02 00:44:42 951

u013343882的博客