Shockang-CSDN博客

原创大模型赋能金融行业：从理念到落地实践

深度揭秘金融AI三阶段演进，首创"大模型金融应用五要素公式"，基于领先金融科技实践，详解AI金融管家背后的技术架构。从能力边界分析到组织变革，为金融机构数字化转型提供系统化方法论，兼具理论深度与实战指导。解锁AI如何重塑金融未来！

2025-03-08 21:32:49 2112

原创从神经元到大语言模型及其应用

一场跨越AI历史长河的视觉盛宴！本博客以丰富图片详解大语言模型完整发展历程，从最早神经元理论到现代智能体技术，深入浅出讲解核心原理。无论你是AI新手还是专业人士，都能在这里找到从理论到应用的全景视角，见证人工智能的惊人蜕变。💡🧠🚀

2025-03-02 17:38:33 2049 1

原创机器学习数学通关指南

作为一名拥有十余年编程经验的开发者，深感AI时代数学基础的重要性。本专栏从程序员视角出发，构建机器学习所需的数学知识体系，涵盖微积分、线性代数、概率统计三大核心领域。通过系统化的知识梳理、丰富的实战案例和详实的链接资源，为每位想要掌握AI技术的程序员打造一份实用的数学进阶指南。

2025-03-01 10:36:10 1275

原创 Agent 技术原理和前沿进展

从“文科型”LLM到具备规划与行动力的自治Agent：课程梳理AGI五级路线、推理增强(o1/DeepSeek)、ReAct+MCP+代码解释器+记忆的核心栈，揭示Workflow+局部自治混合落地范式，并总结规划/工具/记忆评估方法与多Agent协作、研究型DeepResearch前沿。深度洞察力

2025-09-10 16:20:24 1517

原创高级 RAG 技术原理和前沿进展

探索RAG技术如何将95%企业私有数据转化为即时生产力！本文揭秘检索增强生成的完整链路：从数据处理、混合检索、父子结构到多模态扩展。掌握必备"组合拳"策略：高质量文本规整、语义友好切块、混合检索、Query改写、引用可视化等。从零搭建到深度拓展，避开常见陷阱，让你的RAG系统达到90%+检索准确率，彻底告别AI幻觉！

2025-09-09 19:27:27 1389

原创 RAG 数据工程

本文深度拆解企业级RAG数据工程：从多源文档采集、Pipeline+VLM混合转换、Markdown规范化、跨页无边框表格与标题层级治理，到递归切块+父子检索策略，配合业务评测集、难负例挖掘、向量与大模型微调，实现高召回低幻觉的可迭代知识系统，强调数据为先结构优于堆模型构建长期可维护优势提升ROI。

2025-09-09 14:37:07 1094

原创面向生产环境的大模型应用开发

大模型应用开发已从“写功能”转向“评估驱动的机器学习工程”。课程梳理：范式演进、四层生产架构（数据/模型/编排/可观测）、模型生态位与量化选型、推理性能指标（TTFT/Tokens/s）、Prompt 资产化、评估闭环、数据合成与 RAG、多场景金融实践、全生命周期与常见踩坑。核心：先评估→再迭代→持续数据回流形成自增强。

2025-09-08 23:24:02 1354

原创大模型应用介绍和典型范式

大模型应用介绍和典型范式：厘清LLM与“泛大模型”边界，揭示其本质是下一个token概率预测；系统梳理幻觉、缺规划、记忆短板及RAG、CoT、Workflow、Tool/Agent、Memory、微调组合补救路径；强调评测与数据工程驱动ROI。助你高效打造可靠AI应用。全链提效升级快

2025-09-08 23:08:23 1482

原创机器学习的一百个概念（13）布里尔分数

📊《全面解析布里尔分数：从基础理论到跨领域实战》深度剖析概率预测核心评估指标，涵盖金融风控、医疗预测、推荐系统等真实案例，独家提供代码实现+优化策略+多指标对比，揭秘模型校准技巧与未来AI融合趋势！

2025-04-27 11:31:29 1925

原创机器学习的一百个概念（12）学习率

🔍【深度解析学习率奥秘】从梯度下降到自适应算法，揭秘最新优化策略！涵盖金融风控、医疗影像、推荐系统等跨领域实战案例，详解Adam优化器原理与认知陷阱，更有贝叶斯调参、量子启发算法等前沿趋势。附梯度裁剪/预热等实用技巧，助你掌握模型训练核心参数！🚀

2025-04-13 19:03:36 1409 1

原创机器学习的一百个概念（11）闵可夫斯基距离

🔥【深度解析闵可夫斯基距离】从数学本质到多领域实战：揭秘参数p的魔力！涵盖金融风控/医疗诊断/智能推荐场景，手把手Python实现KNN分类实验，独家优化策略+高频问题解决方案，附前沿技术演进预测。一篇文章打通距离度量任督二脉！

2025-04-13 18:52:12 1200

原创机器学习的一百个概念（10）假阳性率

深度解析机器学习核心指标假阳性率(FPR)，涵盖医疗诊断到金融风控等真实场景应用，提供Python代码实战、阈值优化技巧及业务成本分析方法，独创自适应阈值技术与多模态融合策略，助数据科学家精准平衡模型性能与业务需求。

2025-04-06 22:56:42 2200

原创 COZE通关指南：工作流与插件开发

【COZE通关指南】一站式AI应用构建平台详解！🌟深度解析工作流配置与插件开发，揭秘API集成核心技巧，提供模块化设计原则与性能优化方案。涵盖资源库、知识库等核心功能，内置丰富开发工具，助你快速打造智能应用，附实战案例与最佳实践开发指南！

2025-04-06 22:35:56 2278

原创机器学习的一百个概念（9）学习曲线

深入解析学习曲线如何揭示模型的真实状态！本文带你掌握诊断过拟合、欠拟合的可视化利器，通过Python实现对比分析不同算法的学习特性。从数学原理到实战案例，助你科学决策数据收集策略、优化模型复杂度，彻底告别盲目调参。让每一行代码都发挥最大价值的必备技能！

2025-04-03 23:15:15 2327

原创 LangChain核心解析：掌握AI开发的“链“式思维

探索LangChain的核心概念"Chain"，这把AI开发瑞士军刀让复杂应用构建变得简单！从四大基础链到高级文档处理，从记忆功能到自定义扩展，全方位剖析伴有实用代码示例。无论你是AI初学者还是经验开发者，这篇指南都能帮你快速掌握链式开发，构建智能应用的必读教程！

2025-04-03 22:59:13 1868

原创机器学习的一百个概念（8）插补法

📚 深入解析机器学习中的插补法：从理论到实践的全方位指南！本文系统讲解数据缺失处理的各种策略，涵盖MCAR、MAR、MNAR三大缺失机制，详细对比简单插补到高级模型插补的优劣。配合Python实战案例，手把手教你选择最佳插补策略。无论你是数据科学新手还是老手，都能从这篇文章中获得实用价值！🔍 #机器学习 #数据预处理

2025-04-02 23:31:37 1928 1

原创机器学习的一百个概念（7）独热编码

📚 独热编码：机器学习中的特征转换利器！本文深入剖析独热编码的原理与实践，从数学本质到工程应用，全方位解读这一关键技术。通过生动示例和实战代码，帮你攻克类别特征处理难题。无论你是机器学习新手还是资深工程师，都能从中获得独特见解。从理论到实践，从基础到进阶，一文掌握独热编码的精髓！🔥 #机器学习 #特征工程 #数据预处理

2025-04-02 23:30:26 1407

原创机器学习的一百个概念（6）最小最大缩放

📚 深入解析最小最大缩放：从理论到实战的完整指南！本文系统讲解这一机器学习必备技能，涵盖数学原理、代码实现、实战案例，特别提供异常值处理、零方差特征等疑难解决方案。配套详细代码示例与性能对比，助你快速掌握特征工程核心技巧。无论你是AI初学者还是资深工程师，都能收获满满！🚀 #机器学习 #特征工程 #数据预处理

2025-03-31 22:56:46 1481

原创机器学习的一百个概念（5）数据增强

📚 深入解析数据增强技术：从入门到精通！本文全面剖析数据增强在机器学习中的关键应用，涵盖基础变换到前沿生成式方法。结合TensorFlow、PyTorch实战代码，深入浅出讲解各类增强策略。无论您是AI初学者还是资深工程师，都能从这篇集理论与实践于一体的技术指南中获益。让我们一起探索如何用数据增强提升模型性能！🚀

2025-03-31 22:50:36 1338

原创机器学习的一百个概念（4）下采样

📚 深入解析机器学习中的下采样技术：从理论到实战！本文全方位剖析下采样在类别不平衡和深度学习中的应用，提供详实的代码示例和最佳实践指南。独特的自适应采样策略和高级技巧让您的模型性能提升一个档次。无论您是数据科学新手还是资深工程师，都能从这篇技术博客中获得实用价值！🚀 #机器学习 #深度学习 #数据科学

2025-03-30 22:38:14 1475

原创机器学习的一百个概念（3）上采样

📚 深入解析机器学习中的上采样技术！从SMOTE到GAN，全方位剖析主流方法的原理与实践。结合信用卡欺诈检测真实案例，提供可复现的Python代码实现。独家揭秘数据不平衡处理的陷阱与解决方案，助你避开采样技术实践中的致命误区。无论是机器学习初学者还是算法工程师，都能从这篇技术博客中获得实用价值！ #机器学习 #数据科学

2025-03-30 22:34:39 1510

原创机器学习的一百个概念（2）Tomek 链接

深入解析Tomek链接如何优化分类边界，提高机器学习模型性能。从基础理论到Python实现，从医疗诊断到金融欺诈检测，本文全面剖析这一强大技术及其与SMOTE的黄金组合。一篇文章，掌握不平衡数据分类的高级解决方案，让您的模型准确率与召回率同步提升！

2025-03-29 18:54:45 1303

原创机器学习的一百个概念（1）单位归一化

「数据决定模型上限，预处理拯救下限」——本文深度剖析单位归一化技术，从数学原理到实战应用一网打尽！对比7种归一化方法，揭秘L2归一化与余弦相似度的关系，提供NLP、深度学习等高级应用案例和Python实现代码。避开6大常见陷阱，掌握这份归一化方法选择指南，让模型性能立刻提升！#机器学习必备技能

2025-03-29 18:39:14 1830

原创 langchain核心解析：使用RAG技术增强大模型能力，实现与各种文档的对话

想让AI助手读懂你的专业文档？本文详解RAG技术如何突破大模型知识局限，提供从原理到实战的全套解决方案。包含LangChain实现代码、ChatDoc项目实战和三大优化策略，轻松实现与PDF、Excel等文档的智能对话。掌握RAG，让你的AI应用更专业、更智能！

2025-03-24 23:39:39 1445

原创 AI Agent通关指南：4.5万字长文详解LangChain框架

本文以45000字全面解析LangChain框架核心技术与实践，从基础模块到Agent高级应用，涵盖RAG技术、多智能体系统、实战案例与最佳实践。提供完整代码示例与架构图解，助你快速掌握AI Agent开发。不论你是初学者还是资深开发者，这份4.5万字的深度指南都将成为你构建LLM应用的得力助手！

2025-03-23 16:06:04 2688

原创 Apache Flink技术原理深入解析：任务执行流程全景图

深入剖析Flink从StreamGraph到物理执行的全流程转换机制，揭秘算子链优化、调度策略与Slot分配的内部原理。通过源码级解析与可视化图表，帮您理解Flink性能背后的核心机制，提供实用优化建议，让您的Flink应用性能提升数倍！

2025-03-22 23:25:48 1512

原创 Flink CEP：复杂事件处理详解

深入剖析Flink CEP核心原理与工作机制，配合精美流程图与完整代码示例，从模式定义到实战应用全方位讲解。无论是风控监测、行为分析还是异常检测，本文助您快速掌握这一高性能实时处理利器，让复杂事件识别变得简单高效！

2025-03-21 22:10:43 1432

原创定积分与不定积分在概率统计中的应用

本文深入剖析定积分与不定积分在概率统计中的核心应用，从基础概念到典型分布计算，再到机器学习实践。通过清晰的数学推导、直观图表和Python实现，搭建起从理论到实践的桥梁。无论你是数学爱好者还是机器学习工程师，这篇全景式技术指南将助你掌握概率模型的积分本质，提升算法理解与应用能力。

2025-03-21 21:55:48 1404

原创 Flink SQL 技术原理详解

深入解析Flink SQL执行全过程！本文通过精美流程图详解SQL从解析到执行的五大核心阶段，揭秘Calcite优化引擎如何提升查询性能，剖析批流一体处理的技术原理。无论你是Flink新手还是老手，都能从这份完整技术指南中获取实用知识，提升你的流处理应用开发能力！

2025-03-18 22:48:17 1216

原创 Hessian矩阵详解与应用

揭秘机器学习背后的数学利器！本文深入浅出地剖析Hessian矩阵如何判定临界点、加速优化算法、分析深度神经网络。从直观几何解释到实用代码实现，帮你轻松掌握二阶优化精髓。无论你是算法工程师还是AI研究者，这份通关指南都能助你突破优化瓶颈，提升模型性能！

2025-03-18 22:21:51 2288

原创谱分析方法

🔍 从时域到频域的完美跨越！本文深入解析自相关函数与功率谱密度的数学原理，配合Python实战代码，揭示谱分析在机器学习中的关键应用。无论是信号处理还是时间序列预测，这份通俗易懂的谱分析指南将助你驾驭频域特征工程，提升模型性能！👨‍💻📊

2025-03-18 22:15:50 1790

原创从被动响应到主动预见：智能可观测性技术的变革与实践

探索智能可观测性如何彻底变革IT运维！从告警风暴到精准预测，从小时级故障诊断到分钟级自动修复，AI正在重塑运维模式。本文深入剖析关键技术、实战案例和实施路径，助您构建从"被动响应"到"主动预见"的智能化运维体系，降低76%运维成本，提升99.99%系统可用性。未来已来，您准备好了吗？🚀

2025-03-16 23:11:41 2616

原创理解ARIMA模型的数学基础

揭秘ARIMA模型背后的数学原理！本文深入浅出地解析差分方程与特征多项式如何支撑时间序列预测，从平稳性条件到参数估计，既有严谨的数学推导，又有实用的Python代码实现。无论你是数据科学初学者还是算法工程师，这份通关指南都能助你精准把握ARIMA模型的核心精髓，提升时间序列分析能力！

2025-03-15 11:55:36 1987

原创时间序列中的平稳性概念

📊 从数学本源到实战应用，一文掌握时间序列分析的关键概念——平稳性！本文深入浅出地解析严平稳与宽平稳的数学本质，配合Python实战代码与直观案例，帮你构建理论与实践的桥梁。无论是ARIMA建模、信号处理还是深度学习预处理，这份通关指南都能让你在机器学习项目中游刃有余！

2025-03-15 11:34:28 1418

原创约束优化技术：KKT条件的完整推导与应用

📚 深度解析KKT条件：从数学推导到机器学习实战！本文完整推导KKT四大条件，结合SVM、SVR等经典算法，深入浅出讲解约束优化原理。配套Python代码示例，手把手教你实现SMO算法。一篇文章掌握机器学习优化核心技术，理论与实践的完美结合！🔥 #机器学习 #优化算法 #数学基础

2025-03-14 23:51:54 2779

原创二阶优化方法详解

📊 二阶优化方法是机器学习加速训练的秘密武器！本文深入剖析牛顿法、L-BFGS和共轭梯度法的原理与实现，通过对比表格和实战代码帮你轻松掌握。无论你是优化算法新手还是寻求性能突破的资深工程师，这份集理论与实践的完整指南都能让你的模型训练效率提升10倍！🚀

2025-03-14 23:40:18 1621

原创梯度下降法及其变体详解

📚 从数学原理到代码实现，一文掌握梯度下降法全家桶！本文深入浅出地剖析BGD、SGD到Adam等8种优化算法的原理与公式推导，配合Python实例与直观图表，帮你理解参数更新背后的数学逻辑。无论你是算法小白还是寻求进阶，这份"通关指南"都能助你在实战中灵活选择最佳优化器。🚀

2025-03-12 21:18:36 1752

原创凸优化详解

📚 从数学基础到实战应用，一文掌握凸优化精髓！探索凸函数与凸集的几何意义，梳理监督学习模型的优化理论，配合Python代码实例直观理解。既有理论深度，又有实战指导，让你轻松突破机器学习算法设计与优化的数学难关，构建更高效、更可靠的AI模型！🚀

2025-03-12 21:07:55 2807 1

原创向量空间与范数

深入浅出解析向量空间与范数在机器学习中的核心应用！本文从基础定义到高级概念，配合Python实例与可视化讲解，帮你构建数学直觉。覆盖L1/L2正则化、核方法、流形学习等热门技术，提供完整学习路径，让抽象数学变得实用有趣。无论你是入门者还是从业者，这份通关指南都能提升你的算法理解力！

2025-03-11 21:12:57 1420

原创互信息详解

📊 互信息：机器学习特征选择的隐藏利器！本文深入浅出剖析互信息的数学本质，从熵与KL散度双重视角诠释核心原理，配合Python实现代码与实际应用案例，助你摆脱线性相关局限，发掘数据间真正的非线性关联。无论是特征工程还是模型评估，这篇通关指南都能让你的ML技能更上一层楼！

2025-03-11 20:56:09 2204 1

CDH 5.14.2 安装包第一部分

CDH5.14.2 安装包第一部分，建议配合我的博客——《CDH 5.14.2 安装部署指南》一同使用。

2022-10-31

CDH5.14.2 安装包第二部分

CDH5.14.2 安装包第二部分，建议配合我的博客——《CDH 5.14.2 安装部署指南》一同使用。

2022-10-31

CDH 5.14.2 安装包第三部分

CDH 5.14.2 安装包第三部分，建议配合我的博客——《CDH 5.14.2 安装部署指南》一同使用。

2022-10-31

Apache Kylin 4.0.2 安装包

2022-10-17

Apache Doris 1.1.2 FE 安装包

Apache Doris 1.1.2 FE 安装包，建议配合我的博客——《Apache Doris 安装部署指南》一起使用

2022-10-02

Apache Doris 1.1.2 BE 安装包

Apache Doris 1.1.2 BE 安装包，建议配合我的博客——《Apache Doris 安装部署指南》一起使用

2022-10-02

Apache Doris 技术调研

Apache Doris 技术调研，建议配合我的同名博客来一同研究学习。

2022-09-26

mysql-5.7.36-el7-x86_64.tar.gz

mysql 5.7.36 linux 安装包

2022-08-08

cloudera-manager-centos7-cm5.14.2_x86_64.tar.gz

cloudera-manager-centos7-cm5.14.2_x86_64.tar.gz 建议配合我的博客一起使用——《Cloudera 平台搭建》

2022-08-01

大数据从0到1 .pptx

大数据入门知识，面向纯大数据新手。主要关于为什么学习大数据、什么是大数据、大数据有哪些职业方向、大数据是如何发展起来的以及大数据该如何学习。

2021-11-01

Spark 线性回归测试数据集 lpsa.data

参考个人博客《Spark RDD 论文详解（三）Spark 编程接口》了解详情

2021-12-26

elasticsearch-head-compile-after.tar.gz

编译后的 elasticsearch-head 源码包，建议配合安装教程《如何安装 elasticsearch-head 插件？》一同使用

2021-08-22

Hive3.1.2安装包

建议配合我的博客一同使用——[Hive 3.x 安装部署教程](https://blog.csdn.net/Shockang/article/details/118062872)

2021-06-19

flink-1.8.1_after_compile.tar.gz

Flink 1.8.1 编译后的源码包

2021-08-22

spark-2.3.3.zip

Spark 2.3.3 安装包，配合本人博客《Spark 2.3 安装部署》一同使用

2021-10-16

logstash-7.14.1-darwin-x86_64.tar

logstash Mac

2021-09-12

kibana-7.14.1-darwin-x86_64.tar

kibana

2021-09-12

elasticsearch-7.14.1-darwin-x86_64.tar

elasticsearch Mac

2021-09-12