- 博客(528)
- 收藏
- 关注
原创 Claude Sonnet 4工程化接入:协议栈设计与四大生产场景实战
大语言模型(LLM)在真实业务中常因提示词泛化、上下文失控和输入噪声导致输出不可靠,本质是缺乏工程化接入范式。Claude Sonnet 4引入推理路径显式化与双级安全扫描机制,对输入结构高度敏感,要求从‘自由提问’转向‘可验证协议驱动’。其核心价值在于支持高精度结构化输出(如Swagger YAML、带锚点的会议纪要、跨页财务表格解析),适用于API文档自动生成、合规报表处理、长文本关键信息抽取及状态感知对话等强确定性场景。本文基于日均50万次调用验证,详解协议栈三层架构(物理层预处理、会话层锚点分片、应
2026-06-23 14:36:39
254
原创 Excel减法不是运算而是数据治理:从单元格到跨表的防错实践
Excel减法表面是基础四则运算,实则是数据关系建模的关键入口——它直连数据类型校验、引用稳定性与计算链路可靠性。其底层原理涉及数值隐式转换、空值/文本容错机制及相对/绝对引用的动态行为,技术价值在于支撑预算差异分析、跨表对账与实时KPI追踪等高敏业务场景。当面对#VALUE!报错、拖拽失准或结果‘看似正确实则偏差’等典型问题时,本质是缺乏对数据结构约束(如格式一致性、区域动态性、表间依赖)的系统认知。本文聚焦Excel中单元格级、行列级与跨表级减法的工程化实现,融合TRIM/CLEAN/VALUE清洗链、
2026-06-23 14:24:09
405
原创 模板驱动文档自动化:零代码实现确定性文档生成
文档自动化是企业提升运营效率的基础能力,其核心在于解耦内容与形式,确保输出结果的确定性与合规性。相比AI生成易出错、代码定制维护成本高,模板驱动方案通过可视化占位符(如{{client_name}})、条件逻辑和循环区块,在Word/PDF等标准格式中实现结构化装配。该技术具备强可控性、高复用性和天然审计友好性,广泛适用于合同、报价单、对账单、行业报告等高频文档场景,尤其契合金融、法律、医疗等强监管行业及无IT支持的中小团队。Sqribble正是这一范式的典型实践。
2026-06-23 14:05:06
330
原创 使用.env.vault安全部署:加密环境变量与自动化配置管理实践
在软件开发和部署中,环境变量管理是连接应用与基础设施的关键环节,它承载了数据库连接串、API密钥等敏感配置信息。传统基于.env文件的明文管理方式在传输、存储和团队协作中存在显著安全风险与运维复杂度。通过加密与密钥分离原理,现代配置管理方案实现了敏感信息的端到端保护,其技术价值在于将配置部署从手工操作转变为可版本化、可审计的自动化流程。这一实践特别适用于CI/CD流水线、Docker容器化部署以及Serverless架构等云原生应用场景。本文以dotenv-vault工具为例,深入解析如何通过.env.va
2026-06-23 12:52:47
251
原创 Command R+本地部署与LangChain多跳代理实战指南
大语言模型(LLM)的本地化部署与工具链编排是当前企业级AI应用的核心能力。理解模型加载机制、API调用原理及框架协同逻辑,是突破Hugging Face一键部署局限的关键。Command R+作为支持128K上下文的企业级RAG模型,其GGUF量化格式兼容性、Cohere Python SDK参数校验规则、以及LangChain React Multi-Hop代理的指令对齐机制,共同构成稳定落地的技术三角。本文聚焦真实环境中的内存溢出、400错误定位、streaming乱码、documents格式陷阱等高
2026-06-23 11:10:58
414
原创 SimElectronics:连接电路级仿真与系统级设计的桥梁
在电子系统开发中,电路仿真与系统仿真之间常存在断层,导致后期集成问题频发、成本高昂。SimElectronics作为一款全新的工具,旨在原生地、高保真地在Simulink环境中复现SPICE级的电路仿真能力,从而填补这一鸿沟。其核心价值在于实现了与Simulink/Stateflow的无缝深度集成,使得电路模块能够像普通Simulink模块一样即插即用,让工程师在系统仿真中便捷地考虑电路的非理想特性。该工具支持混合信号仿真与联合仿真,并提供了面向电子工程师习惯的丰富元件库,如半导体器件和模拟集成电路库,显著
2026-06-22 16:52:37
479
原创 奇安信天擎rptsvr接口任意文件上传漏洞分析与实战复现
文件上传漏洞是Web安全领域的经典风险,其核心在于服务器对用户提交的文件数据未实施充分的安全校验。攻击者通过构造恶意请求,可绕过前端检查,将WebShell等恶意文件上传至服务器,进而获取系统权限。从技术原理看,此类漏洞常源于对文件扩展名、保存路径或客户端可控参数的校验缺失,例如未过滤目录遍历符或未采用白名单机制。在终端安全与管理平台这类复杂系统中,此类漏洞的危害尤为严重,因其通常部署于内网核心区域,可能成为攻击者横向移动的跳板。本文以奇安信天擎终端安全平台为例,深入剖析其rptsvr服务接口中存在的文件上
2026-06-22 16:34:37
493
原创 GPT-4o多模态能力解析与企业级AI编程辅助实践
大语言模型(LLM)作为当前人工智能基础设施的核心组件,其多模态理解与生成能力正从研究走向规模化工程落地。GPT-4o作为OpenAI于2024年发布的旗舰级实时多模态模型,在语音、图像、文本联合推理方面展现出低延迟、高保真与强上下文感知特性,技术价值体现在端到端交互效率提升与开发流程重构。在AI编程辅助场景中,它可深度集成IDE环境,实现自然语言驱动的代码生成、跨文件逻辑补全与错误语义诊断,显著降低重复性编码成本。本文基于GPT-4o官方API与合规调用规范,结合真实项目案例,详解其在智能编程助手中的接口
2026-06-22 15:23:33
421
原创 多模态全栈开发:MasterGo AI+Cursor打通设计到代码的语义闭环
多模态开发指视觉(UI稿)、文本(需求)、代码(TS/Python)、数据(JSON Schema)四类信息在软件工程中实时互证与双向驱动的技术范式。其核心原理是将模糊的设计意图转化为可编程的设计契约,再通过AI工具链完成结构化约束到可执行逻辑的精准编译。该模式显著提升跨职能协同效率、降低语义损耗,并支撑AI原生应用快速落地。典型应用场景包括AI图像分类SaaS后台、低代码平台集成、设计系统驱动的前端自动化生成等。本文聚焦MasterGo AI与Cursor协同构建的多模态工作流,深入解析视觉语义解析、设计
2026-06-22 10:05:25
398
原创 MPC8309通信处理器架构解析与DDR2/QUICC Engine实战指南
在嵌入式系统与通信设备开发领域,系统级芯片(SoC)的架构设计与外设驱动是核心技术基础。其核心原理在于通过高度集成的硬件模块(如处理器核心、内存控制器、通信协处理器)协同工作,以硬件加速方式分担CPU负载,从而提升系统实时性与数据吞吐量。这项技术的核心价值在于为网关、工控设备及网络接入设备提供了高可靠、高性能的单芯片解决方案。典型的应用场景包括多协议转换、工业控制与防火墙等。本文聚焦于恩智浦经典的MPC8309通信处理器,深入剖析其以Power Architecture e300c3核心、QUICC Eng
2026-06-22 09:55:49
508
原创 Prettier与VS Code协同原理:格式化优先级、ESLint共存与Vue/TS适配
代码格式化是现代前端工程中保障协作一致性的基础能力,其核心在于将主观编码偏好转化为可复现的机器规则。Prettier作为确定性代码打印机,不分析语义而专注AST到字符串的稳定输出,其价值在于Git差异最小化、Code Review提效与CI流程可信。然而真实落地常受阻于VS Code四层格式化调度机制(语言内置→扩展注册→编辑器策略→项目配置)的优先级冲突,典型表现为保存后ESLint报prettier/prettier错误、Vue SFC中v-if被错误压缩、TypeScript类型注解空格异常等。本文深
2026-06-21 16:24:25
513
原创 Ubuntu 14.04 上 Mesosphere 生产集群部署与 ZooKeeper 强一致性配置
ZooKeeper 是分布式系统中实现强一致性的核心协调服务,其原理基于 ZAB 协议,通过法定票数(quorum)机制保障容错与高可用。在遗留系统运维场景中,ZooKeeper 常作为 Mesosphere DC/OS 的元数据中枢,承担服务发现、Leader 选举与状态同步等关键职能。其技术价值在于提供低延迟、可验证的分布式共识能力,广泛应用于政务云、金融核心、电信网管等对稳定性要求严苛的生产环境。本文聚焦 Ubuntu 14.04 这一长期服役的操作系统基线,深入解析 ZooKeeper 集群的节点规
2026-06-21 12:28:01
433
原创 深入解析MCF5373 SSI模块:FIFO控制、工作模式与实战配置
同步串行接口(SSI)是一种专为时序敏感型应用设计的高效串行通信协议,其核心原理在于通过共享位时钟和帧同步信号,实现发送与接收设备的严格同步,从而避免异步通信中的时序误差。在嵌入式音频、数据采集等场景中,SSI的技术价值在于提供了高带宽、低延迟、多通道的可靠数据传输能力。以飞思卡尔MCF5373处理器的SSI模块为例,其FIFO(先进先出队列)控制机制与多种工作模式(如正常模式、网络模式、I2S模式)的灵活配置,是实现高质量数据交换的关键。通过深入理解FIFO水印阈值、时间槽复用等核心概念,工程师可以优化数
2026-06-21 11:01:18
462
原创 Sinatra轻量Web框架实战:RVM环境搭建与Rack协议部署
Sinatra是一个基于Ruby的轻量级Web框架,其核心遵循Rack协议,以极简设计实现HTTP请求响应。它不强制MVC结构或内置ORM,而是通过DSL快速定义路由,显著降低启动开销与内存占用。技术价值在于高度可组合的中间件机制、单文件可部署特性,以及与RVM等环境管理工具的天然协同。典型应用场景包括微服务网关、CLI内嵌控制台、IoT设备管理页及CI/CD状态面板。本文围绕RVM环境隔离、rackup标准启动流程、生产级Puma+Nginx部署展开,深入解析Sinatra如何在保持2000行代码体量的同
2026-06-21 09:00:02
409
原创 4B模型+GGUF+llama.cpp:消费级硬件上的自动化编码实践
自动化编码并非单纯依赖大参数模型,而是由轻量级模型、高效格式与专用推理引擎共同构建的技术闭环。GGUF格式通过分块存储与原生量化支持,显著降低内存占用与加载延迟;llama.cpp则针对CPU/ARM设备优化内存映射与KV缓存管理,使4B级模型在树莓派、Windows台式机等消费级硬件上实现亚秒级首token响应和稳定吞吐。这种组合让开发者无需纠结CUDA驱动兼容性、显存碎片或环境配置,真正聚焦于需求描述本身。qwen2.5-4b作为典型代表,在代码生成质量、PEP8合规性、type hints完整性等方面
2026-06-20 13:31:33
523
原创 实战解析:如何绕过Safedog WAF的文件上传防护策略
文件上传漏洞是Web安全中的高危风险点,攻击者利用此漏洞可直接上传恶意文件获取服务器控制权。其原理在于应用程序未对用户上传的文件进行充分校验,导致恶意文件被存储并执行。为防御此类攻击,Web应用防火墙(WAF)应运而生,它通过检测请求内容、文件特征等规则来拦截恶意上传。Safedog WAF作为国内广泛使用的产品,其防护逻辑具有代表性。理解WAF的规则与后端服务器(如Apache/PHP)在解析HTTP请求时存在的细微差异,是技术对抗的关键。这种解析差异常出现在对`multipart/form-data`格
2026-06-19 16:47:49
488
原创 NXP UJA116xA SBC芯片SPI寄存器配置:FlexGUI图形化调试工具实战指南
在嵌入式系统开发中,SPI(串行外设接口)是一种广泛应用的同步串行通信协议,用于微控制器与外设芯片之间的高速数据交换。其工作原理基于主从模式,通过时钟线、数据线和片选线实现全双工通信,具有配置灵活、引脚占用少的优点。这项技术的核心价值在于能够高效、可靠地配置和管理复杂外设芯片的内部寄存器,从而实现对芯片工作模式、电源管理和通信参数等关键功能的精准控制。在汽车电子和工业控制领域,SPI常用于配置系统基础芯片(SBC)、传感器和通信控制器等。本文聚焦于NXP UJA116xA系列CAN系统基础芯片(SBC),深
2026-06-19 15:56:47
411
原创 嵌入式GUI多语言显示实战:从Unicode/UTF-8到emWin复杂脚本处理
字符编码是计算机处理文本信息的基础,它定义了字符与二进制数据的映射关系。Unicode作为全球统一的字符集标准,为每种字符分配了唯一码点,解决了多语言字符共存的问题。在此基础上,UTF-8编码凭借其兼容ASCII、变长高效的特点,成为网络传输和存储的首选方案,尤其适合资源受限的嵌入式环境。其技术价值在于能以统一方式处理全球任意语言文本,极大简化了国际化软件的开发。在嵌入式GUI开发中,这一技术广泛应用于智能家居、工业HMI、医疗设备等需要多语言动态切换的界面。本文聚焦emWin库,深入探讨如何利用其底层Un
2026-06-19 15:36:11
463
原创 P89LPC90x嵌入式开发实战:RTC、电源监控与UART配置详解
在嵌入式系统开发中,实时时钟(RTC)、电源监控和串口通信(UART)是保障系统稳定可靠运行的核心基础模块。RTC为设备提供精准的时间基准,其原理基于可配置时钟源的定时计数器,通过中断机制实现周期性任务调度与低功耗唤醒,在数据记录和事件同步场景中价值显著。电源监控,特别是掉电检测,通过电压阈值比较与中断/复位响应机制,在电压异常时保护系统防止数据损坏,是工业控制设备的关键安全屏障。UART作为最通用的异步串行通信接口,其波特率生成、数据帧格式与错误检测机制,直接决定了设备间数据交换的可靠性与效率。本文聚焦N
2026-06-19 13:28:11
386
原创 Ubuntu换源避坑指南:仓库结构、组件匹配与同步校验
APT源是Ubuntu软件管理的核心基础设施,其本质是一套基于发行版代号(如noble/jammy)、组件划分(main/universe)和GPG签名验证的元数据分发协议。理解`dists/`目录结构、`InRelease`文件作用及`sources.list`语法逻辑,是避免404错误、签名失效和依赖中断的前提。阿里云等国内镜像源虽加速下载,但存在同步延迟、组件裁剪(如无-backports)和架构路径差异(如ubuntu-ports)等工程约束。真实可用的换源方案必须完成三重校验:URL可达性、Rel
2026-06-19 12:53:48
464
原创 Windows Server部署Nessus:构建企业级漏洞扫描与主动防御环境
漏洞管理是企业网络安全防御体系的基础环节,其核心原理在于通过自动化工具持续识别、评估和修复系统弱点,从而将安全风险从被动响应转向主动管控。在众多技术方案中,基于插件的漏洞扫描技术能够精准识别CVE公开漏洞、配置错误及合规性偏差,为企业提供深度的风险洞察。对于Windows Server环境,部署Nessus这类企业级扫描器,可实现无缝域集成与无代理深度检测,大幅提升内网资产的安全可见性。通过配置认证扫描、制定定期扫描策略并与自动化运维流程结合,企业能够建立起可持续运营的漏洞管理闭环,有效满足等保2.0等合规
2026-06-18 15:01:44
563
原创 GPT-4o原生多模态架构解析:语音视觉文本端到端融合
多模态AI是指能同时理解与生成文本、图像、语音等多种信息形式的智能系统,其核心在于跨模态表征对齐与联合推理。传统方案依赖独立编码器(如CLIP、Whisper)将不同信号转为文本再输入语言模型,导致模态失真与高延迟;而原生多模态架构通过共享Transformer主干、统一tokenization层和跨模态注意力机制,实现原始信号直通处理,显著提升信息保真度与实时性。该技术带来三大价值:降低70%端到端延迟、支持流式听-思-说原子操作、重构AI成本结构。典型应用场景包括实时会议分析、AR工业巡检、全息教学教练
2026-06-17 15:56:33
315
原创 Embedding工程实战:从语义标尺到多模态融合的5级能力链
Embedding 是现代AI系统中统一表征语义的核心技术,其本质是将文本、图像、颜色、价格等异构信号映射到同一向量空间,实现跨模态可比性与可计算性。原理上依赖预训练编码器(如DistilBERT、ResNet、CLIP)提取特征,并通过归一化、距离度量、动态加权等工程手段校准业务语义。技术价值在于突破关键词匹配局限,支撑精准推荐、智能搜索与客服聚类等高价值场景。尤其在电商、内容平台等真实业务中,embedding 不仅需兼顾精度与延迟,更需解决背景污染、模态失配、权重崩塌等落地陷阱。本文聚焦 embedd
2026-06-17 13:53:40
458
原创 从DOUBLEPULSAR检测脚本看网络协议逆向与自动化威胁狩猎
网络协议是计算机通信的基石,其安全机制直接关系到数据传输的完整性与机密性。通过协议逆向工程,安全研究人员可以深入理解数据包的结构与交互逻辑,从而识别异常行为。这项技术的核心价值在于将复杂的攻击特征转化为可编程的检测规则,实现自动化威胁狩猎,极大提升安全运营效率。在高级持续性威胁(APT)攻防场景中,攻击者常利用SMB等标准协议的漏洞或后门进行隐蔽通信,例如DOUBLEPULSAR这类内存后门。掌握基于协议逆向的检测方法,能够帮助防御者主动发现网络中潜伏的恶意植入,这正是理解DOUBLEPULSAR检测脚本源
2026-06-17 12:47:11
491
原创 国产AI芯片大模型训练实战:降本增效与软硬协同全解析
大模型训练正从依赖高端GPU转向国产AI芯片自主可控路径。其核心原理在于突破CUDA生态束缚,通过MLIR编译器重构、INT16混合精度优化、KV Cache动态分片及定制化通信库(如C3L)实现算力真实吞吐提升。技术价值体现在显著降低千卡时成本(¥/kWh)、提升tokens/sec/W能效比,并满足金融等高合规场景对ECC、长时稳定性和中文长文本处理的严苛要求。典型应用场景包括3B级LLM日均高频训练、领域微调(如金融术语理解)、万字文档推理等。本文聚焦寒武纪思元590与壁仞BR100双平台实测经验,覆
2026-06-17 11:43:11
481
原创 合成数据实战指南:从物理建模到工业级数据服务
合成数据正成为AI工程中应对数据稀缺、标注昂贵与合规高压的核心基础设施。其本质并非简单图像生成,而是基于物理规律、统计分布或程序规则的可控建模,实现高保真、可审计、零隐私风险的数据量产。技术价值在于重构数据单位经济模型——从CAPEX采购转向OPEX按需服务,显著压缩长尾场景覆盖周期与GDPR/CCPA合规成本。典型应用场景涵盖医疗影像病灶生成、自动驾驶极端工况模拟、工业质检微缺陷仿真等。本文聚焦落地闭环,详解场景建模、噪声可控生成、三重质量验证及Data-as-a-Service集成四大关键环节,直击‘照
2026-06-16 10:50:16
632
转载 吴恩达深度学习笔记(十一)—— dropout正则化
主要内容:一、dropout正则化的思想二、dropout算法流程三、dropout的优缺点一、dropout正则化的思想在神经网络中,dropout是一种“玄学”的正则化方法,以减少过拟合的现象。它的主要思想就是:在训练神经网络的每一轮迭代中,随机地关闭一些神经元,以此降低神经网络的复杂程度:二、dropout算法流程1)...
2019-01-10 22:17:00
1163
转载 《统计学习方法》笔记第二章 —— 感知机
主要内容:一、感知机模型二、感知机学习策略(线性可分)三、感知机学习算法(疑问:对偶形式比原始形式更优吗?但为何从”判断误分类点“这一步骤对比,对偶形式的时间复杂度似乎更高呢?)一、感知机模型1.所谓感知机,其实就是一个在n维空间内的超平面(n-1维),这个超平面将整个空间分为两部分。2.该超平面S被定义为:w*x + b = 0。其中,w*x +...
2018-12-07 21:14:00
415
转载 《机器学习基石》第一周 —— When Can Machine Learn?
(注:由于之前进行了吴恩达机器学习课程的学习,其中有部分内容与机器学习基石的内容重叠,所以以下该系列的笔记只记录新的知识)《机器学习基石》课程围绕着下面这四个问题而展开:主要内容:一、什么时候适合用机器学习?二、该课程所采用的一套符号表示三、机器学习的流程四、感知机算法五、学习的类型六、机器学习的无效性七、机器学习的可行性(在无效...
2018-12-05 00:38:00
461
转载 吴恩达深度学习笔记(十) —— 神经风格迁移
主要内容:一.神经风格迁移简介二.计算content cost三.计算style cost一.神经风格迁移简介1.神经风格迁移(Neural Style Transfer),简称为NST,就是以一张图为内容基础,以另一张图为风格基础,生成一张新的图:2.NST使用一张已经训练好的神经网络VGG network作为算法的基础。可知神经网络的浅层...
2018-10-08 21:07:00
602
转载 吴恩达深度学习笔记(九) —— FaceNet
主要内容:一.FaceNet人脸识别简介二.使用神经网络对人脸进行编码三.代价函数triple loss四.人脸库五.人脸认证与人脸识别一.FaceNet简介1.FaceNet是一个深层神经网络,它将人脸编码成一个含有128个数的向量。通过比较两张人脸编码后的向量,可以判定两张人脸是否属于同一个人。2.FaceNet的代价函数叫做“tri...
2018-10-08 19:50:00
382
转载 吴恩达深度学习笔记(八) —— ResNets残差网络
(很好的博客:残差网络ResNet笔记)主要内容:一.深层神经网络的优点和缺陷二.残差网络的引入三.残差网络的可行性四.identity block 和 convolutional block一.深层神经网络的优点和缺陷1.深度神经网络很大的一个优点就是能够表示一个复杂的功能。网络的层数越多,意味着能够提取到不同level的特征越丰富。并且,...
2018-10-07 22:12:00
789
转载 吴恩达深度学习笔记(七) —— Batch Normalization
主要内容:一.Batch Norm简介二.归一化网络的激活函数三.Batch Norm拟合进神经网络四.测试时的Batch Norm一.Batch Norm简介1.在机器学习中,我们一般会对输入数据进行归一化处理,使得各个特征的数值规模处于同一个量级,有助于加速梯度下降的收敛过程。2.在深层神经网络中,容易出现梯度小时或者梯度爆炸的情况,导致...
2018-10-07 21:01:00
321
转载 吴恩达深度学习笔记(六) —— 卷积神经网络
主要内容:一.卷积神经网络简介二.卷积神经网络之前向传播简介三.padding填充四.stride步长五.信道(channel)个数与过滤器(filter)个数的区别六.卷积的一步七.一次完整的卷积八.池化层九.1 * 1 filter一.卷积神经网络介绍1.何为卷积神经网络?顾名思义,就是在神经网络上引入了卷积思想,以...
2018-10-04 21:14:00
411
转载 吴恩达深度学习笔记(五) —— 优化算法:Mini-Batch GD、Momentum、RMSprop、Adam、学习率衰减...
主要内容:一.Mini-Batch Gradient descent二.Momentum四.RMSprop五.Adam六.优化算法性能比较七.学习率衰减一.Mini-Batch Gradient descent1.一般地,有三种梯度下降算法:1)(Batch)Gradient Descent,即我们平常所用的。它在每次求梯度的时候用...
2018-10-03 20:50:00
1491
转载 吴恩达深度学习笔记(四)—— 正则化
有关正则化的详细内容:吴恩达机器学习笔记(三) —— Regularization正则化《机器学习实战》学习笔记第五章 —— Logistic回归主要内容:一.无正则化二.L2正则化三.Dropout正则化一.无正则化深度学习的训练模型如下(可接受“无正则化”、“L2正则化”、“Dropout正则化”三种方式):def mod...
2018-10-02 16:03:00
325
转载 吴恩达深度学习笔记(三)—— 初始化
主要内容:一.初始化问题二.全0初始化三.随机初始化四.“He initialization”初始化一.初始化问题1.在深度学习中,参数的初始化对模型有着重要的影响,而需要初始化的参数有两类:参数b的初始化对模型的影响较小,所以一般都是直接初始化为0,所以下面讨论的都是对参数W的初始化。 有三种不同的初始化方式:以下代码是深度学习...
2018-10-02 16:00:00
395
转载 吴恩达深度学习笔记(二)—— 深层神经网络的训练过程
主要内容:一.初始化参数二.前向传播三.计算代价函数四.反向传播五.更新参数(梯度下降)一.初始化参数1.由于将参数W初始化为0会导致神经网络失效,因而需要对W进行随机初始化。一般的做法是用np.random.np()生成一个高斯分布的数,然后再乘上一个很小的数比如0.01,以限制它的范围。所以可知W的初始值是一个很小的数(绝对值小),那为什么...
2018-10-02 09:36:00
577
转载 吴恩达深度学习笔记(一) —— 神经网络简介
相关博客:吴恩达机器学习笔记(四) —— BP神经网络(里面出现的内容,下面将不再重复)主要内容:一.单个样本向量化二.多个样本向量化三.激活函数及其导数四.随机初始化五.深层神经网络的前向与反向传播六.参数和超参数一.单个样本向量化如下神经网络,对于第一层的神经元,每个神经元的输出,即a的计算如下:但是这种每个...
2018-09-22 21:03:00
271
转载 bagging与boosting集成学习、随机森林
主要内容:一.bagging、boosting集成学习二.随机森林一.bagging、boosting集成学习1.bagging:从原始样本集中独立地进行k轮抽取,生成训练集。每轮从原始样本集中使用Bootstraping方法抽取(即又放回地抽取)n个样本点(样本集与训练集的大小同为n。在一个训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽...
2018-09-10 20:03:00
413
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅