微学AI-CSDN博客

原创人工智能深度学习100种网络模型，精心整理，全网最全，PyTorch框架逐一搭建

大家好，我是微学AI，今天给大家介绍一下人工智能深度学习100种网络模型，这些模型可以用PyTorch深度学习框架搭建。模型按照个人学习顺序进行排序。

2023-06-03 08:44:01 53418 22

原创手把手教你本地CPU环境部署清华大模型ChatGLM-6B，利用量化模型，本地即可开始智能聊天，达到ChatGPT的80%

大家好，我是微学AI，今天教你们本地CPU环境部署清华大ChatGLM-6B模型，利用量化模型，每个人都能跑动大模型。ChatGLM-6B是一款出色的中英双语对话模型，拥有超过62亿个参数，可高效地处理日常对话场景。与GLM-130B模型相比，ChatGLM-6B在对话场景处理能力方面表现更加卓越。此外，在使用体验方面，ChatGLM-6B采用了模型量化技术和本地部署技术，为用户提供更加便利和灵活的使用方式。值得一提的是，该模型还能够在单张消费级显卡上顺畅运行，速度较快，是一款非常实用的对话模型。

2023-04-28 17:07:02 30285 40

原创人工智能实战项目(python)+多领域实战练手项目

人工智能实战项目目录一、机器学习实战项目1.机器学习实战1-四种算法对比对客户信用卡还款情况进行预测2.机器学习实战2-聚类算法分析亚洲足球梯队（待更新）...(待更新)二、深度学习实战项目1.深度学习实战1-(keras框架)企业数据分析与预测2.深度学习实战2-(keras框架)企业信用评级与预测3.深度学习实战3-文本卷积神经网络（TextCNN）新闻文本分类4.深度学习实战4-卷积神经网络（DenseNet）数学图形识别+题目模式识别5.深度学习实战5-卷积神经...

2022-05-14 17:31:53 26798 64

原创深度学习实战6-卷积神经网络(Pytorch)+聚类分析实现空气质量与天气预测

大家好，我是微学AI，今天给大家带来一个利用卷积神经网络(pytorch版)实现空气质量的识别与预测。我们知道雾霾天气是一种大气污染状态，PM2.5被认为是造成雾霾天气的“元凶”，PM2.5日均值越小，空气质量越好．空气质量评价的主要污染物为细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)等六项。

2022-05-12 16:58:37 20304 75

原创内网穿透的应用-把Ollama从命令行搬进浏览器：搭建可远程访问的私人AI工作台

OpenWebUI：本地大模型的终极可视化控制台 OpenWebUI是一个开源的Web界面，为Ollama等本地大模型提供接近主流AI产品的交互体验。它能统一管理多种来源的模型，支持对话历史、Markdown渲染、知识库等功能，解决了命令行工具体验不足的问题。核心优势包括：媲美ChatGPT的交互界面多模型统一管理（本地Ollama/云端API）内置RAG知识库和工具调用能力完全离线运行保障数据隐私支持多用户协作管理部署仅需Python 3.11环境，通过pip安装即可快速搭建。本文还介绍了如

2026-07-02 14:01:21 10102 5

原创 Hermes Agent 架构在智能问数系统中的改造方案：记忆增强+自进化闭环

智能问数系统升级方案摘要中国移动智能问数系统通过整合Hermes Agent技术实现四大能力跃升：①四层记忆系统实现业务知识跨会话复用，包括数据仓库元数据、分析经验库和用户偏好；②自进化闭环机制使系统能自动沉淀分析模板（如"退订率归因"技能），实现越用越准；③基于RL轨迹学习优化NL2SQL转化准确率，形成数据飞轮效应；④上下文压缩技术支撑长链路分析任务。系统覆盖自然语言取数→多维分析→根因定位→报告生成全流程，通过记忆注入机制在各个环节调用历史经验，显著提升分析效率与决策质量。

2026-07-01 13:55:11 2499 1

原创魔珐星云 SDK 实战：用国产大模型搭建展厅具身讲解 Agent

本文探讨了如何利用国产大模型（如Qwen、DeepSeek）结合魔珐星云SDK搭建企业展厅AI讲解系统。作者指出，虽然国产大模型在文本生成、推理等方面表现优异，但缺乏具身表达能力，导致数字人讲解效果不佳。通过对比拼接路线和云端视频流方案的缺陷，提出采用魔珐星云的参数流架构，大幅降低带宽和算力成本。文章详细记录了开发过程，包括SDK接入、状态封装等关键节点，展示了国产技术栈在具身交互场景下的可行性，为低成本、高质量的AI讲解系统提供了实践方案。

2026-06-30 17:32:27 2884

原创 Hermes Agent 架构在运维根因分析系统中的改造方案应用、以及系统架构详细介绍

本文提出了一种基于Hermes Agent核心机制的运维根因分析系统改造方案。通过集成四层记忆系统、自进化闭环、Skill自动生成和RL轨迹学习等机制，构建了具备持续学习能力的智能运维框架。关键创新点包括：1）将六阶段故障分析工作流与分层记忆系统深度耦合，实现经验知识的动态复用；2）设计冻结快模式保障记忆系统稳定性；3）建立故障自愈闭环实现自动化经验沉淀。该方案显著提升了复杂故障的分析效率和准确性，同时降低了运维知识管理成本。

2026-06-30 11:48:08 3419 1

原创内网穿透的应用-把雨声和篝火装进NAS：Moodist环境音服务部署实践

本文介绍了如何在群晖NAS上部署Moodist环境音工具，并通过cpolar实现公网访问。主要内容包括：1）通过Docker在群晖上安装Moodist，支持自由组合雨声、海浪等环境音；2）安装cpolar套件配置Web-UI界面；3）创建HTTP隧道生成随机公网地址；4）配置固定二级子域名实现稳定访问。该方案让用户能在任何设备通过网页访问统一的环境音界面，无需安装多个客户端，适合学习、工作和放松时使用。

2026-06-29 14:12:00 10822 5

原创一个模型，三家供应商，两个月折腾——我的大模型API选型手记

大模型API选型实战：从成本陷阱到工程指标的重认知团队在搭建智能客服系统时，原以为只需选择低价大模型API即可满足需求（延迟<2秒，月成本<5000元），结果经历了三轮选型认知迭代：1）首轮测试发现不同供应商的同模型延迟差异达5倍；2）次轮72小时压测揭示吞吐量、P90延迟和波动系数才是核心指标，蓝耘元生代的吞吐量（110.92 tokens/s）比竞品高41%，延迟稳定性（波动系数1.23×）显著优于行业；3）成本核算发现隐性成本（重试、超时）占比最高达45%，而蓝耘仅7%。最终系统迁移后实现平均响应2

2026-06-26 15:14:50 528

原创蓝耘元生代全能攻略：从API调不通到批量推理跑全量，我把踩过的坑都记下来了

团队接了个数据标注的活，12万条文本，每条要做情感分类、实体抽取、关键词提取。一开始想用本地开源模型跑，一张A100跑了三天，进度条没走完一半，电费先飙了。用AI大模型搜到了蓝耘元生代MaaS，说模型多、API兼容OpenAI格式、有批量推理。注册了个号试了试，结果发现之前对"云上调大模型"的理解跟实际差挺远。我实际用到的几个东西：批量推理、智能路由、统一网关，以及怎么把蓝耘API接到OpenClaw和Hermes这两个Agent框架里。数据指标都标了来源，你可以自己去核实。

2026-06-24 10:54:31 5594 53

原创内网穿透的应用-飞牛NAS装上Pansou后，我终于不用到处求网盘资源了

摘要本文介绍了如何在飞牛NAS上部署Pansou网盘资源搜索工具，并通过cpolar实现远程访问。Pansou是一款高性能的网盘资源搜索引擎，支持多种主流网盘类型，能够帮助用户快速找到电影、电子书等资源。文章详细讲解了从飞牛OS环境准备、Docker部署Pansou到使用cpolar进行内网穿透的全过程，使NAS用户可以随时随地访问自己的私人资源库。这套方案解决了资源获取难的问题，同时提供了便捷的远程访问能力，是NAS用户优化资源管理的高效解决方案。

2026-06-22 16:07:59 12109 6

原创金仓时序数据库：从监控指标到核心业务决策

时序数据正从简单的监控指标升级为工业、交通等领域的核心业务数据，推动时序数据库向高基数写入、复杂查询和融合分析方向发展。金仓时序数据库在大规模写入、复杂查询和分布式扩展上表现优异，尤其在轨道交通等场景中实现10倍性能提升。其核心价值在于将时序能力融入多模数据融合架构，使时间数据能与GIS、关系型等数据联合分析，从孤立存储转向业务决策支持，真正释放时序数据的业务价值。

2026-06-21 11:00:00 10626

原创广州燃气国产化的升级：7×24小时守护千家万户

广州燃气客服系统通过国产化升级，采用金仓数据库和KFS异构数据同步软件，构建四层高可用保障体系，实现核心业务7×24小时不间断运行。系统平滑迁移保障百万用户无感切换，同时具备性能储备以适应未来智慧燃气发展需求。该项目为公用事业领域国产化转型提供了可复制的样板，推动国产数据库在民生场景的应用，提升市民服务体验。

2026-06-20 11:00:00 11087

原创智慧水利的应用：电科金仓——硬核数据底座

从人工巡查到全域数字监测，从分散决策到流域智慧调度，省级智慧水利建设正步入攻坚期。**河北省水利数字孪生平台及水土保持应用系统，作为全省水利数字化转型的核心工程，近期完成验收并平稳运行。**背后，金仓数据库以全栈式数据解决方案，完成了这场高要求、大规模的国产化落地实践。

2026-06-19 21:15:05 12816

原创 KES 数据库 PDML 并行技术实操：从单核瓶颈到多核跑批

摘要：电科金仓的KingbaseES（KES）通过DML并行（PDML）技术解决金融和政务系统大规模数据处理时的性能瓶颈。传统数据库在亿级数据跑批时仅能利用单核，KES采用GMQ计划模型实现查询和写入的并行化，使多核CPU资源充分利用。测试显示，8并行下2.6亿行数据插入时间从8分钟降至2分钟，性能提升74%。通过配置并行参数和优化WAL设置，KES在保证事务一致性的同时显著提升处理效率，特别适合高负载跑批场景。

2026-06-18 15:31:23 13774

原创递阶式智能体开发范式(HADP)：从超级Agent到智能体应用的层级架构理论与工程实践

*递阶式智能体开发范式**（Hierarchical Agent Development Paradigm, HADP），构建了从超级智能体（Super-Agent）到最终智能体应用的五层递阶架构，将智能体开发过程本身形式化为一棵由上层智能体驱动的能力分解树。我们给出了每一层的严格形式化定义，引入能力分解算子与约束传播机制，并从元学习、分层强化学习中的Options框架、以及软件工程的抽象分层理论三个维度建立了HADP的理论基础。

2026-06-15 16:04:47 1081 4

原创内网穿透的应用-每台服务器都手动装mysql_exporter？我用一个Shell脚本全搞定了

MySQL Exporter一键部署脚本该Shell脚本实现了MySQL Exporter(mysqld_exporter)的自动化部署，主要功能包括：自动下载并安装指定版本(v0.18.0)的mysqld_exporter到/app/mysqld_exporter目录自动创建MySQL监控用户(mysqld_exporter)并授予必要权限(REPLICATION CLIENT, PROCESS, SELECT) 生成安全的数据库连接配置文件(localhost_db.cnf)，权限设为600 创建

2026-06-15 11:55:18 15320 3

原创时序大模型 TimechoAI 赋能工业时序数据底层技术优势与实操

工业时序大模型TimechoAI以83亿参数Timer-3.5为核心，解决工业物联网"数据沉睡"痛点，通过TimeMoE和TimeSTP创新架构实现20倍推理速度提升。平台提供预测、异常检测等四大核心能力，已在能源、制造等领域落地，获多项权威认证，重塑"存储→分析→决策"全链路智能范式。

2026-06-11 17:32:30 3500

原创大模型与量子纠缠：一场关于“关联“的范式对话与深度研究

本文探讨了大语言模型（LLM）与量子纠缠理论在数学结构、信息机制和工程架构三个层面的深刻共鸣。研究发现，LLM通过注意力机制构建的token关联网络与量子纠缠态的多粒子关联具有数学同构性。2025—2026年的前沿研究显示：1）LoRA微调中的参数更新呈现"纠缠谷"现象，遵循量子态的低秩分解规律；2）量子增强注意力机制利用纠缠感知核函数，能产生更全局连贯的语义关联；3）多智能体系统通过共享纠缠态可实现超越经典方法的协调能力。这些发现表明，"纠缠"不仅是量子物理概念，更可能成为理解与改进深度学习的基础数学框架

2026-06-10 19:16:45 637 1

原创内网穿透的应用-照片明明很清晰，发出去却变糊了？我试了试Pic Smaller

Pic Smaller是一款免费开源的图片压缩工具，支持JPG、PNG、WebP等多种格式，能在保留画质的同时大幅减小文件体积。本文介绍了如何在本地部署Pic Smaller，并通过Node.js环境运行项目。此外，还推荐使用cpolar内网穿透工具，将本地服务映射到公网，实现随时随地的安全访问。通过简单配置，用户可以获得固定公网地址，方便异地使用自己的私有图片压缩服务。该方案兼顾了隐私保护和使用便利性，适合经常处理图片的用户。

2026-06-08 16:19:07 11758 5

原创内网穿透的应用-不想把代码放第三方平台？CentOS7搭建私有GitLab并实现远程访问

本文介绍了在CentOS7环境下安装GitLab社区版并实现公网访问的方案。通过自建GitLab，开发者可以获得代码托管的完全控制权，同时结合内网穿透工具cpolar，解决内网环境下的远程访问问题。文章详细讲解了GitLab的安装配置步骤，包括添加软件仓库、设置访问端口、防火墙配置等。还演示了如何创建GitLab项目并进行代码管理。相比GitHub和Gitee等第三方平台，自建GitLab具有更好的数据自主性和安全性，特别适合企业内网项目或商业代码的托管需求。这套方案既保留了私有化部署的优势，又提供了类似

2026-06-01 11:36:32 12273 6

原创内网穿透的应用-数据库告别SQL：飞牛NAS上用NocoDB打造团队协作工作台

文章摘要： NocoDB是一款开源低代码数据库平台，可将MySQL等传统数据库转换为可视化多维表格界面，支持表格、看板、日历等多种视图，适合非技术人员直接操作数据库而无需编写SQL。本文详细介绍了在飞牛NAS上通过Docker部署NocoDB的步骤，包括环境准备、镜像下载、容器创建和初始化设置。此外，还讲解了如何通过cpolar内网穿透工具实现公网访问，使团队成员能远程协作管理数据。NocoDB的部署大大提升了数据库操作的便捷性，解决了非技术人员依赖开发人员操作数据库的痛点。

2026-05-29 08:26:47 14815 7

原创内网穿透的应用-灵感在外头，电脑在家里？用cpolar把Stable Diffusion WebUI暴露到公网

摘要：远程访问Stable Diffusion WebUI的完整解决方案本文介绍了如何通过内网穿透工具cpolar实现远程访问本地Stable Diffusion WebUI的方法。主要内容包括：系统环境准备（Python、git安装） Stable Diffusion WebUI的安装部署流程基础使用教程（提示词设置、图片生成）中文界面配置方法关键解决方案：使用cpolar工具将本地7860端口暴露到公网，实现随时随地访问该方案解决了传统方法需要云服务器或复杂网络配置的问题。

2026-05-21 19:28:31 12169 8

原创多Agent龙虾(创新架构)：一句话组建AI打工团队的分工执行深度解析

本文介绍了一种创新的多智能体协作系统——龙虾团队架构。该系统通过角色分工明确的Agent流水线协作，解决了单体大语言模型在复杂任务中的局限性。系统采用三层架构设计：交互层负责可视化呈现，调度层处理任务编排，技能层定义各Agent的专业能力。核心创新在于5阶段顺序流水线机制，每个Agent（如总经理、项目经理、工程师）依次处理任务并传递上下文，模拟真实团队协作流程。该系统已实现落地应用，相比传统单体模型，在复杂任务处理深度和专业化程度上展现出显著优势。

2026-05-20 14:53:08 1000

原创 OpenAI Codex：下一代 Coding Agent 全面解析

2026年编程智能体Codex标志着软件开发范式的革命性转变。文章深度解析了Codex的四层架构体系：用户界面层提供多入口交互，工作流编排层实现智能任务分解，执行引擎层确保安全操作，模型层整合多种AI能力。该系统支持从代码理解到复杂任务执行的完整生命周期，通过沙箱隔离、审批策略和并行处理机制，实现了安全与效率的平衡。特别值得注意的是，Codex不仅能完成代码补全，更能像人类工程师一样处理数万行代码库的完整开发任务，其云端并行执行能力可同时管理多个独立开发任务，预示着"异步软件工程师团队"时代的到来。文章还提

2026-05-20 10:04:57 1756

原创 Hermes Agent 实战指南：什么场景下必须用它？

文章摘要： Hermes Agent 是一套可编排的智能体协作系统，通过多模型协同、动态技能加载和三层记忆架构，解决复杂任务中的效率与安全问题。其核心模块包括统一模型入口 Gateway、技能管理 Curator 和按需加载机制，支持金融分析、跨会话记忆等高阶场景。相比传统方案，Hermes 具备自动路由、渐进式资源分配和双轨防护等优势，适合需要透明化、协作化AI流程的企业与开发者。用户可通过简单代码快速组建AI团队，实现“专业分工+自动协作”。（150字）

2026-05-19 14:03:06 959 1

原创 Hermes Agent 最详细的教程：通过Hermes Agent 构建完整的AI团队

2026 年的 AI Agent 赛道早已过了"能聊天就行"的阶段。当我们还在纠结 prompt 怎么写的时候，Nous Research已经悄悄把一个会自我进化、能组建团队、支持 200+ 大模型的开源 Agent 框架做到了 15.6 万 Star。

2026-05-18 19:52:47 1456

原创 Hermes Agent vs Claude Code 架构对比与创新分析

Claude Code 是一个"优秀的编码 agent"，而 Hermes 是一个"通用的 agent 操作系统"——它不局限于编码，覆盖了从开发、运维、研究到智能家居的全场景，并且通过Skills/Memory/Cron/Kanban 这些持久化基础设施实现了真正的 self-improving autonomous agent。

2026-05-18 16:31:12 928 2

原创内网穿透的应用-数据库不想人人能连？用 NocoDB 把表转成多维表格，运营和产品自己就能改

做开发的可能都遇到过这种场景：数据库搭好了，后台系统也跑起来了，运营和产品天天来找你说"帮我查个数"、"帮我改条记录"。给后台账号？权限不好控，数据改乱了都不知道。让运维帮忙操作？来回沟通成本高，改个小数据要走半天流程。

2026-05-14 14:54:40 52128 15

原创 Apache IoTDB从大数据视角的深度分析与实操——最新时序数据库选型指导

进入2026年，时序数据已成为企业数字化转型中最具价值的核心资产之一。全球时序数据库（Time-Series Database, TSDB）市场持续蓬勃发展，预计到2031年，市场规模将达到7.76亿美元。面对全球已知的超过41款时序数据库产品，如何进行科学、高效、前瞻性的技术选型，已成为企业首席技术官（CTO）、架构师和数据工程师面临的关键挑战。

2026-05-13 09:55:40 12479 1

原创内网穿透的应用-家里那台吃灰的小主机，我拿来搭了一套 ESXi + 飞牛 NAS。你也试试吧！

摘要本文详细介绍了在N5105小主机上搭建All-in-One云服务器的完整流程：从制作ESXi 7.0启动盘（使用Ventoy工具）、关闭BIOS安全引导，到安装ESXi系统并配置飞牛NAS虚拟机。重点解决了远程访问难题，通过cpolar实现公网穿透，使ESXi管理界面和NAS文件系统可在外部访问。文章特别强调了安装过程中的关键注意事项：关闭Security Boot、正确配置虚拟机安全引导设置等易错点，为读者提供了一套完整的家庭云服务器解决方案。

2026-05-07 10:37:44 12695 8

原创 Claude-Code-python 前端改造项目工作流程详解

本文深入解析了claude-code-python项目架构，这是一个基于Python的AI编程助手系统。文章重点剖析了用户输入到输出的完整处理流程：从命令行初始化、用户输入解析，到查询执行和LLM交互。系统采用模块化设计，包含交互式TUI界面、工具化交互、计划模式、记忆系统和成本追踪等核心功能。关键技术点包括prompt_toolkit构建的REPL界面、多阶段提示词组装逻辑、工具执行机制以及Anthropic/OpenAI双模型支持。项目特别优化了token使用效率，解决了传统对话系统资源消耗过高的问题。

2026-04-27 12:09:58 1140

原创手动做视频花一天，用MoneyPrinterTurbo半小时能出几条

本文介绍了开源工具MoneyPrinterTurbo的完整部署流程，它能通过AI一键生成短视频。主要内容包括：1)下载Windows一键启动包并配置环境；2)获取Pexels API密钥用于视频素材；3)申请阿里云千问大模型的免费API；4)演示从主题输入到视频生成的全过程。该工具整合了文案生成、素材匹配、语音合成、字幕添加等功能，支持横竖屏输出，大幅降低了视频创作门槛。部署后用户只需输入主题，即可快速生成专业级短视频内容。

2026-04-23 16:16:53 44358 1

原创搭 QQ 机器人被各种门槛劝退？用 Docker 几步搞定 AstrBot + NapCat + DeepSeek

想给 QQ 配个 AI 机器人帮忙处理消息、整理群聊、自动回复，结果一查资料就懵了——协议不稳定、运行环境互相冲突、依赖装不上、连登录 QQ 都能整出一堆问题。折腾了几天环境，最后发现事情本身还没开始做，时间全耗在填坑上了。找现成的方案也不省心，要么是已经停止维护的老项目，要么是配置复杂到看都不想看，实际上就想找个稳定、能跑起来、不用天天修的组合。

2026-04-16 16:53:31 44465 14

原创 Rokid AI眼镜的运用：基于 Rokid 灵珠平台，几步搭建专属城市规划评估AR智能体

Rokid灵珠平台为城市规划评估提供了创新解决方案。该AI开发平台基于多模态大模型，支持零代码可视化编排和一站式部署，深度适配Rokid智能眼镜硬件。通过高空影像分析，智能体可评估空间布局、交通系统、生态环境等维度，输出结构化报告并给出优化建议。开发过程包含配置基本信息、设置专业角色prompt、调试优化等步骤，最终实现AR眼镜端的实时城市规划评估功能。平台降低了AI应用开发门槛，让规划师无需编程即可快速创建专业级评估工具，拓展了AI在城市规划领域的应用边界。

2026-04-16 11:33:35 3745

原创我把Claude Code泄露的代码改造成python程序了，其中的大模型记忆模块与上下文工程分析

本文分析了Claude Code开源AI助手的记忆模块与上下文工程实现。记忆模块采用基于文件的持久化系统，支持4种记忆类型（用户、反馈、项目和引用记忆），通过自动梦境整合机制定期将临时日志转为持久化主题文件。上下文工程采用分块组装方式构建系统提示，包含静态规则和动态环境信息，并实现自动压缩机制处理长对话历史。系统通过模块化设计实现了跨会话记忆存储与智能上下文管理。

2026-04-14 17:14:28 3105 1

原创 2026年时序数据库选型指南：Apache IoTDB从大数据与物联网视角深度剖析

时序数据库选型指南：关键维度与主流产品分析 2026年，时序数据成为企业数字化转型的核心资产，全球时序数据库（TSDB）市场预计2031年达7.76亿美元。面对41款产品（中国占17款），科学选型需聚焦五大维度：数据模型：能否直观映射设备层级关系；压缩能力：针对时序特性的专属算法（如Apache IoTDB压缩比达10:1以上）；性能：写入吞吐（如InfluxDB达百万点/秒）、查询延迟（毫秒级响应）；扩展性：水平扩展与边缘协同能力；生态与成本：SQL兼容性、运维复杂度及开源生态。主流产品中.

2026-04-09 18:38:52 14951 1

原创 code-server 体验：一行命令把 VS Code 跑在服务器上，随时用浏览器写代码

摘要本文介绍了如何通过Docker快速部署code-server，搭建基于浏览器的VS Code开发环境。code-server将VS Code运行在服务器上，用户可通过浏览器访问完整IDE功能，适用于远程开发、统一团队环境等场景。文章详细讲解了Docker安装、code-server部署步骤，包括密码设置、中文版安装等配置，并演示了基本使用方式。此外，还介绍了如何通过内网穿透工具cpolar实现外部访问，使开发环境可随时随地使用。整个部署过程简单高效，只需几分钟即可拥有安全的在线IDE。

2026-04-09 09:10:09 15829 5

原创跨设备文件秒传神器 PairDrop：Windows、iPhone 也能轻松实现 “隔空投送”

PairDrop是一款开源跨平台文件传输工具，基于WebRTC技术实现本地网络点对点高速传输。支持Windows、iPhone、Linux等全平台，具备端到端加密、批量传输、离线可用等优势。部署简单，通过Docker即可快速搭建，配合cpolar内网穿透还能实现异地访问。适用于职场办公、学习资料传输、照片分享等场景，操作仅需连接同一WiFi即可完成文件秒传，彻底解决跨设备传输难题。

2026-04-03 09:00:18 21286 7

计算机二级通关宝典(10合一)经典汇总

计算机二级通关宝典(10合一)经典汇总内容如下： 00-计算机二级通关宝典-总览与复习计划：计算机二级考试全景概览（MS Office/C语言/Python三科），含考试方式、题型分值分布、四周冲刺每日复习计划、三科选择建议与答题时间分配策略。 01-MS Office高级应用-高频考点精讲：Office科目三大模块（Word/Excel/PPT）31个核心考点逐项拆解，每个考点标注真题频率与分值权重，附操作要点速记与避坑指南。 02-操作题实战：Word长文档排版：真题级Word操作案例教学，覆盖样式与目录自动生成、多级列表、页眉页脚奇偶页设置、邮件合并、题注与交叉引用、分节符应用等6大高频操作。 03-操作题实战：Excel函数综合应用：Excel核心函数实战（VLOOKUP/INDEX+MATCH/IF嵌套/SUMIFS/COUNTIFS/RANK），数据透视表创建与筛选、图表制作与美化，附真题级综合案例。 04-操作题实战：PPT动画设计：PPT操作题满分指南，涵盖母版与版式设计、SmartArt图形、动画效果（进入/强调/退出/路径）、幻灯片切换与触发动画、演示文稿分节管理。 05-C语言-高频考点与真题精讲：C语言全部考点梳理（数据类型/运算符/控制结构/数组/函数/指针/结构体/文件），每章附真题级选择题+程序填空题+程序修改题精讲。 06-C语言-编程题调试技巧：VC++ 2010调试环境实操指南，断点设置/单步执行/变量监视完整流程，填空/修改/设计三类编程题的解题策略与答题模板。 07-Python-高频考点与真题精讲：Python全部考点详解（基础语法/字符串/列表字典集合/函数/文件/turtle/jieba/random），每章附真题示例，必考第三方库专项突破。 08-公共基础知识-高频考点精讲：......

2026-05-27

SQL实战进阶：从优化到面试的全链路通关指南

一套覆盖「语句优化 → 项目实战 → 面试认证」三阶段的 SQL 进阶资源。内含 EXPLAIN 执行计划深度解读、索引最左前缀与覆盖索引实战、窗口函数 6 大经典案例、慢查询诊断 Checklist；电商 GMV 分析、用户行为漏斗、金融风控与盈亏 P&L 等完整业务场景 SQL 方案；以及 11 道高频面试题精讲（含面试官追问思路）、MySQL 8.0 OCP 与 Oracle 1Z0-071 认证真题。全部 SQL 可直接执行，适合 1-5 年经验的开发者、DBA 及备考求职者。

2026-05-26

【计算机编程期末作业】包括：前端、后端、系统编程、移动应用（C、C++、python、Java）的作业与代码、解答

计算机编程期末作业资源说明本资源包涵盖了计算机编程相关的多个方向，包括前端开发、后端开发、系统编程、移动应用开发、数据结构与算法、数据分析等。每个方向均提供了具有代表性的期末作业题目、详细解答思路、完整源码及注释，适合用于课程学习、复习、参考和自我提升。资源结构 - `responsive_blog_homepage.md`：前端方向，响应式个人博客主页设计与实现。 - `flask_message_board.md`：后端方向，基于Python Flask的留言板Web应用。 - `c_multi_process_copy.md`：系统编程方向，C语言多进程文件拷贝工具。 - `android_todo_app.md`：移动应用方向，Java Android待办事项管理App。 - `cpp_linked_list.md`：C++数据结构，支持增删查的链表类实现。 - `python_pandas_analysis.md`：Python数据分析，Pandas分析CSV数据并生成统计报告。使用建议 1. 学习参考：每个作业均包含题目、解答思路、详细代码和注释，适合自学和查阅。 2. 课程作业：可根据实际课程要求，适当修改和扩展作业内容。 3. 代码实践：建议亲自运行和调试代码，深入理解实现原理。 4. 知识拓展：可在此基础上增加新功能或优化代码，提升编程能力。特色与深度 - 题目均为实用型、综合性强，贴合实际开发需求。 - 解答思路清晰，便于理解和举一反三。 - 代码风格规范，注释详细，便于扩展和维护。 - 涵盖多种主流编程语言和开发方向，适合不同学习阶段的同学。

2025-06-12

多模态语音识别API接口（可直接运行）本项目基于 Flask 框架，结合大模型 API，实现了文本与语音的互转功能，输入语音或者文本，可同时生成文本与语音

多模态语音识别API接代码说明项目简介本项目基于 Flask 框架，结合大模型（Qwen） API，实现了文本与语音的互转功能。用户可以通过 API 接口提交文本或音频，获得语音合成或语音识别的结果，并支持音频文件的下载。主要文件结构 - `main.py`：Flask Web 服务主入口，定义了 API 路由和请求处理逻辑。 - `service.py`：封装了与大模型 API 的交互、音频文件的处理与保存等核心业务逻辑。 - `config.yaml`：项目配置文件（需自行提供），包含大模型 API 地址、服务端口等信息。 - `audio_outputs/`：音频文件输出目录，自动创建。主要功能说明 1. 文本转语音/语音识别接口 `/text2audio` 请求方式：POST 参数： text（可选）：要合成语音的文本。 audio（可选）：要识别的音频文件（wav 格式）。返回： text：识别或合成的文本内容。 download_url：生成的音频文件下载链接。说明： `text` 和 `audio` 二选一，优先处理 `text`。内部调用 `get_omni_response` 实现大模型推理。 2. 音频下载接口 `/download_audio` 请求方式：GET 参数： `filename`：音频文件名。返回：音频文件（wav 格式）。说明：防止路径穿越，文件仅限于 `audio_outputs` 目录下。 3. 健康检查接口 `/health` 请求方式：GET 返回：`{"status": "ok"}`

2025-05-27

基于Qwen大模型结合Gradio可视化操作的教学评价系统实现个性化教学辅导

大家好，我是微学AI，今天给大家介绍一下基于Qwen大模型结合Gradio可视化操作的教学评价系统实现个性化教学辅导。传统的教学评价方式主要依赖于教师的经验和主观判断，存在诸多局限性。例如，在知识检测方面，教师通常通过设计试卷来评估学生的学习情况，但这种方式无法精准地了解学生对知识点的掌握程度。对于错题的处理，往往只是简单地给出正确答案，而无法根据学生的错选情况提供针对性的辅导。此外，教师需要花费大量的时间和精力来批改试卷和分析数据，这使得教学评价的效率较低，难以及时反馈给学生和调整教学策略。根据一项对某地区中小学教师的调查，有70%的教师表示在教学评价过程中存在时间紧张和难以精准分析学生问题的情况，这严重影响了教学评价的质量和效果。

2025-04-11

Deepseek中的MoE架构的改造：动态可变参数激活的MoE混合专家架构(DVPA-MoE)的考虑

文章目录背景介绍 1. 核心设计目标 2. 架构设计总览 3. 核心模块详解 3.1 连续难度评估模块 3.2 动态路由控制器 3.3 分层参数共享的专家组 4. 动态计算流程 5. 关键技术细节 5.1 难度-参数档位映射优化 5.2 门控网络设计 5.3 渐进式训练策略 6. 性能优化设计 6.1 计算加速 6.2 内存优化 7. 评估与调优 7.1 核心指标 7.2 调优策略 8. 部署架构 9. 异常处理机制

2025-04-10

《最完整的大模型LLM底层技术原理入门指南》，本书包括：多层感知器、卷积神经网络、循环神经网络、强化学习等，并重点介绍了Transformer、GPT、BERT等现代语言模型的核心机制

《最完整的大模型LLM底层技术原理入门指南》：目录结构： 1. Introduction：人工智能概述人智能概念与分支 2. 基础模型多层感知器（MLP）卷积神经网络（CNN） 3. 序列数据处理循环神经网络（RNN）及其变体（LSTM、GRU） RNN总结 LSTM模型梯度消失带来的问题 LSTM中的门结构 LSTM中门控机制的具体实现 GRU模型 4. 强化学习（Reinforcement Learning, RL）强化学习的三层结构基本元素：Environment, Agent & Goal 主要元素：State & Action 核心元素：Policy & Value 5. 语言模型与Transformer Transformer的整体结构 ELMo模型字符嵌入层双向LSTM层上下文相关词向量层输出层 GPT模型目标工程(Objective Engineering) 自回归架构 BERT模型预训练任务为MLM（Masked Language Model）基于上下文猜测被挖掉的词是什么

2025-04-09

人工智能算法工程师(中级)课程，包括20多个课程文件

人工智能算法工程师(中级)课程1-opencv视觉处理之基本操作与代码详解人工智能算法工程师(中级)课程2-opencv视觉处理之高级操作与代码详解人工智能算法工程师(中级)课程3-sklearn机器学习之数据处理与代码详解人工智能算法工程师(中级)课程4-sklearn机器学习之回归问题与代码详解人工智能算法工程师(中级)课程5-sklearn机器学习之分类问题与代码详解人工智能算法工程师(中级)课程6-sklearn机器学习之聚类问题与代码详解人工智能算法工程师(中级)课程7-PyTorch神经网络之深度学习框架与代码详解人工智能算法工程师(中级)课程8-PyTorch神经网络之神经网络基础与代码详解人工智能算法工程师(中级)课程9-PyTorch神经网络之全连接神经网络实战与代码详解人工智能算法工程师(中级)课程10-PyTorch神经网络之卷积神经网络与代码详解 ...

2025-02-26

深度学习实战41-基于LSTM-GRU模型搭建对糖尿病数据的预测与应用

深度学习实战41-基于LSTM-GRU模型搭建对糖尿病数据的预测与应用，本文将向大家介绍一种基于LSTM-GRU的糖尿病预测模型，包括模型的原理、中文糖尿病csv数据样例、利用PyTorch框架进行模型训练与预测的实现、以及训练过程中准确率和损失值的打印的全流程。 1. 介绍随着糖尿病患者数量的上升，对糖尿病的预测和控制变得越来越重要。近年来，深度学习方法在时间序列数据的分析上取得了显著的进展，其中基于长短时记忆网络（LSTM）和门控循环单元（GRU）的模型在许多应用中表现优异。本文将介绍一种基于LSTM-GRU的糖尿病预测模型，通过对中文糖尿病csv数据进行分析，利用PyTorch框架进行模型的训练与预测。 2. LSTM与GRU的原理 2.1 LSTM 长短时记忆网络（LSTM）是一种特殊的循环神经网络（RNN），能够学习长序列数据中的依赖关系。LSTM通过引入门控机制解决了传统RNN在处理长序列时梯度消失和梯度爆炸的问题。

2024-06-25

深度学习实战31-开发基于机器学习的在线图像识别工具

深度学习实战31-开发基于机器学习的在线图像识别工具，本文开发一个基于机器学习的在线图像识别工具，用户可以上传一张图片，并得到对应的标签或分类信息。该工具应该支持多种图像类型，例如自然风景、动物、物品等，并且在处理复杂图像时具有良好的准确性和鲁棒性。本系统支持：用户能够通过上传图片的方式使用工具，并且工具应该支持常见的图片格式（例如JPEG、PNG等）。工具应该具有较高的准确率和鲁棒性，能够对复杂图像进行准确的分类或标签识别。工具支持多种类型的图像分类，例如自然风景、动物、物品等；工具具有较快的处理速度，对于小型图像可以在数秒内完成处理，而对于大型图像也不会出现过长的等待时间。工具界面整洁、易于使用，同时支持在桌面端和移动端上正常运行。工具用gradio简单部署实现，实现上传一张图片，并得到对应的标签或分类信息。

2024-06-25

知识图谱实战应用(30篇)代码全套，代码直接运行

知识图谱实战应用1-知识图谱的构建与可视化应用知识图谱实战应用2-基于知识图谱的创建语义搜索功能知识图谱实战应用3-知识推理的应用知识图谱实战应用4-cypher查询语句知识图谱实战应用5-从文本关系抽取到知识图谱关系构建流程贯通知识图谱实战应用10-电影推理的应用知识图谱实战应用12-食谱领域智能问答系统，实现菜谱问答知识图谱实战应用12-使用Py2neo构建基于知识图谱的问答系统知识图谱实战应用13-医疗疾病领域智能问答系统，实现症状问答，支持数据扩展知识图谱实战应用14-企业相关文件管理领域的应用知识图谱实战应用15-知识图谱在生物基因学上的应用知识图谱实战应用16-化学结构领域的应用知识图谱实战应用17-推荐系统在婚恋交友项目上的实际应用知识图谱实战应用18-知识图谱结合图神经网络GNN的实战应用，模型搭建与训练知识图谱实战应用19-基于Py2neo的英语单词关联记忆知识图谱项目知识图谱实战应用20-中文图书的查询与推荐系统构建知识图谱实战应用21-华语音乐的推荐系统知识图谱实战应用22-基于py2neo的金融领域的应用 ...

2024-06-17

深度学习实战34-基于paddle关键信息抽取模型训练的全流程(代码直接运行)

深度学习实战34-基于paddle关键信息抽取模型训练的全流程，我们在文档应用场景中，存在抽取关键信息的任务，比如身份证里的姓名和地址，快递单里的姓名和联系方式等等。传统的方法需要设计模板，但是这太繁琐了，也不够强健。因此，我们使用了飞桨提供的PaddleOCR工具箱中的关键信息抽取方案，可以快速地抽取增值税发票中的关键信息。下面我会手把手教大家训练paddle关键信息抽取模型。下面我将介绍基于paddle关键信息抽取模型训练的全流程，我们按照步骤进行：一、标注数据 1.安装软件包 pip install PPOCRLabel 2.安装后使用如下命令启动 PPOCRLabel --lang=ch --kie=True（启动【KIE 模式】，用于打【检测+识别+关键字提取】场景的标签） ....

2024-01-18

计算机视觉的应用1-OCR分栏识别：两栏识别三栏识别都可以，本地部署完美拼接

OCR的分栏识别功能（直接运行）：在OCR识别过程中，遇到文字是两个分栏的情况确实是一个比较常见的问题。通常情况下，OCR引擎会将文本按照从左到右，从上到下的顺序一行一行地识别。这种方式对于单栏或者少量分栏的文本来说是有效的，但是对于两个或者更多分栏的文本来说就有些棘手了。在这种情况下，OCR引擎往往会将整个文本当作一行来处理，这就导致了分栏信息的丢失。如果直接将整个文本传递给OCR引擎，那么它会试图将所有的文字一起识别，而没有办法分辨哪些文字属于哪个栏目。为了解决这个问题，我们需要首先将文本分成两个栏目，然后再分别进行OCR识别。这个过程可以手动完成，也可以借助一些自动化工具。例如，可以使用图像处理算法来检测出文本中的分栏线，然后将文本按照这些线进行分割。

2024-01-18

深度学习实战16(进阶版)-虚拟截图识别文字-可以做纸质合同和表格识别

大家好，我是微学AI，今天给大家带来一个关于虚拟截图识别文字的应用，可以运用在多个领域。案例主要结合Mediapipe手势识别模型，识别出手势的21个关键点的坐标，计算机的摄像头根据食指的坐标信息获取用户想要截取的图片高度与宽度进行截取图形，截取后的图片我们可以通过OCR识别出里面的文字信息，或者进行图像的识别得到图片中的内容信息。虚拟截图的运用：通过虚拟截图与OCR结合NLP技术做下游任务，可以用于纸质文件的实体识别，阅读理解，情感分析，机器翻译等。多领域的应用场景包括：企业管理领域：可应用于纸质文件中的文字和表格的提取、公司纸质章程完备性识别，纸质合同文件信息提取，实时反馈合同风险信息、企业报表信息提取与分析、重要文件图片截取连接打印机进行局部打印等操作，教育领域：纸质试卷的批改识别，以及英文论文或书籍的实时翻译等任务。医学领域：影响报告风险识别、线上视频问诊的药物信息识别采集。

2023-05-04

深度学习实战14(进阶版)-手写文字OCR识别，手写笔记也可以识别了

大家好，我是微学AI，今天给大家带来手写OCR识别的项目。手写的文稿在日常生活中较为常见，比如笔记、会议记录，合同签名、手写书信等，手写体的文字到处都有，所以针对手写体识别也是有较大的需求。目前手写体的识别相比印刷体识别率不是太高，主要有以下几个难点：中文汉字字符级别的类别较多；手写体字符的书写随意性较大, 比如连笔字、草书、行书字体每个人的书写风格不一样

2023-05-04

深度学习实战12(进阶版)-利用Dewarp实现文本扭曲矫正

大家好，我是微学AI, 今天给大家介绍一下深度学习实战12(进阶版)-利用Dewarp实现文本扭曲矫正，我们在生活中会看到一些拍摄扭曲的图片，我们在通过OCR识别的时候，因为扭曲的厉害，而无法识别，我们需要对图片进行处理。文件图像的变形有扭曲、折叠、褶皱、透视等多种情况，解决方案可以分为参数化方法和非参数化方法。参数化方法构建只能处理简单场景的低维度的数学模型。在非参数方法中，通常需要创建一对数据集。

2023-05-04

深度学习实战13(进阶版)-文本纠错功能，经常写错别字的小伙伴的福星

大家好，我是微学AI，我们在日常生活中，经常会写一些文稿，比如：会议纪要，周报，日报，汇报材料，这些文稿里我们会发现有时候出现拼写、语法、标点等错误；其中拼写错误的错别字占大部分。经过初步统计：在微博等新媒体领域中，文本敏感和出错概率在2%左右；怎样才能快速解决这个错误问题呢，让机器帮我们找错别字，因为有时候自己写的文章，比较不容易找出错误，如果找出来需要反复通读全文，这也是很费时的一件事情。资料中用NLP中的文本纠错功能来初步解决这个问题，文本纠错作为自然语言处理最基础的模块，是实现中文语句自动检查、自动纠错的一项重要的自然语言处理技术。

2023-05-04

深度学习实战8-生活照片转化漫画照片应用

今天给大家带来一个生活照片转化漫画照片实战案例让大家不要花钱去找人设计漫画照片了，这个是设计头像神器，很赶时髦，输入人物的图片就可生成漫画图片。图像生成的过程就是利用对抗神经网络原理构建。本模型是利用CartonRenderer自动编码器，模型网络将输入图像映射到特征空间。与Adain 6和MUNIT 7中使用的传统编码器不同，我们的建模网络将输入图像映射到多尺度特征空间，是单个固定比例要素空间的。CartonRenderer的参数优化部分是由四个S-AdaIN块组成，对应于特征模型。每个S-AdaIN块用于对齐相应的刻度。其过程还是相对复杂的。

2023-03-23

深度学习实战9-文本生成图像-本地电脑实现text2img

今天给大家带来一个文本生成图像的案例。让大家都成为艺术家，自己电脑也能生成图片，该模型它能让数十亿人在几秒钟内创建出精美的艺术。 Stable Diffusion模型包括两个步骤：前向扩散——通过逐渐扰动输入数据将数据映射到噪声。这是通过一个简单的随机过程正式实现的，该过程从数据样本开始，并使用简单的高斯扩散核迭代地生成噪声样本。此过程仅在训练期间使用，而不用于推理。参数化反向——撤消前向扩散并执行迭代去噪。这个过程代表数据合成，并被训练通过将随机噪声转换为真实数据来生成数据。

2023-03-23

深度学习实战5-卷积神经网络（CNN）中文OCR识别项目，代码+数据集，可直接运行

资源给大家带来一个利用卷积神经网络（CNN）进行中文OCR识别，实现自己的一个OCR识别工具。一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，这样可节省人力打字的时间。

2023-02-23

【SQL实战进阶】相关内容的资源

01 SQL执行计划解读与索引优化实战语句优化 EXPLAIN字段速查表、type/Extra详解、索引失效6大场景、3个慢查询优化案例 02 窗口函数从入门到精通语句优化 RANK三兄弟区别、ROWS vs RANGE、连续登录/复购率/会话切分4个实战案例 03 复杂多表连接查询技巧语句优化七种JOIN图解、递归CTE、LEFT JOIN陷阱、自连接思维练习 04 电商订单分析完整SQL方案项目实战完整建表语句、GMV漏斗、RFM分层、购物篮关联、大宽表构建 05 用户行为日志查询实战项目实战分区表设计、漏斗转化、异常检测、DAU/MAU粘性、性能优化 SQL示例：80+条完整可运行代码覆盖技术栈：MySQL 8.0+（窗口函数、CTE递归、JSON、分区表、索引优化）交付格式：SQL实战进阶资源包.zip（约20KB）

2026-06-30

基于机器学习的大豆分类分析

2026-06-10

材料科学基于集成学习的超导体临界温度预测：多模型回归分析与性能评估

内容概要：本文围绕超导体材料的临界温度预测展开，结合机器学习方法对超导体实验数据进行建模与分析。文章首先介绍了室温超导的概念及其科学意义，回顾了超导体研究的发展历程，包括BCS理论与高温超导体的发现。随后详细说明了用于预测的数据集特征，涵盖元素的原子质量、电离能、原子半径、密度、电子亲和能、熔化热、热导率、价电子数等多个物理属性及其统计量。通过主成分分析（PCA）降维可视化数据分布，并采用线性回归、决策树回归、梯度提升回归、随机森林回归和Bagging回归等多种机器学习模型对临界温度进行预测，比较各模型性能，并尝试集成方法提升预测精度。实验结果显示非线性集成模型在预测任务中表现更优。; 适合人群：具备一定机器学习基础，对材料科学或物理信息学感兴趣的高校学生、科研人员及数据科学从业者；熟悉Python编程与常用机器学习库（如scikit-learn、pandas、matplotlib）的技术人员；从事新材料预测与高通量数据分析的相关研究人员。; 使用场景及目标：①学习如何利用机器学习模型预测复杂物理系统的性质，特别是超导材料的临界温度；②掌握多维物理特征工程、数据标准化、PCA可视化及多种回归模型的应用与对比；③为新材料发现提供数据驱动的研究思路和技术路径。; 阅读建议：建议读者结合文中提供的代码实践操作，深入理解特征构建逻辑与模型调优策略，同时关注当前室温超导研究进展，理性看待实验验证与模型预测之间的关系。

2026-06-10

气象预测基于机器学习的历史台风数据分析：路径预测与强度评估模型在防灾减灾中的应用研究

内容概要：本文介绍了基于历史数据的台风预测与分析方法，利用1951-2022年亚洲地区台风数据（typhoon_data.csv 和 typhoon_info.csv），通过Python进行数据加载、清洗与可视化分析，重点研究台风路径、强度变化及其影响因素。文章以2023年第5号台风“杜苏芮”为例，选取生成位置相近的历史台风（如2019年台风“白鹿”）进行路径对比，运用轨迹图、散点图、地图风圈和热力图等多种方式展示台风的移动规律与气象特征，并分析中心气压、风速等变量随时间的变化趋势，揭示台风发展的动态过程。; 适合人群：具备一定Python编程和数据分析基础，从事气象研究、灾害预警或机器学习应用的相关技术人员及科研人员。; 使用场景及目标：① 学习如何使用机器学习与数据可视化技术对台风路径进行历史回溯与预测分析；② 掌握基于真实气象数据的数据处理流程与可视化方法，提升对极端天气事件的理解与应对能力。; 阅读建议：建议结合文中提供的数据集与代码实践操作，重点关注数据预处理、地理坐标处理及多维度可视化技巧，同时可扩展模型用于其他气象灾害的分析预测。

2026-06-10

【大数据处理】基于Spark与Python的机器学习应用：医疗数据GDM预测模型构建实战

内容概要：本文介绍了基于Spark大数据技术与机器学习相结合的应用实战，重点讲解了Spark作为快速、通用的分布式计算框架的核心优势及其在机器学习中的应用。文章从大数据技术背景出发，阐述了Spark的高性能内存计算、对批处理、流处理、机器学习等多种数据处理模型的支持，并对比了Spark与Pandas在数据处理能力、分布式计算、语言支持和扩展性方面的差异。通过Python结合PySpark的实际案例，演示了如何使用Spark加载CSV数据、进行数据预处理、构建逻辑回归模型、划分训练测试集、模型预测及使用AUC指标评估模型性能的完整流程。适合人群：具备一定Python编程基础，对大数据处理和机器学习有兴趣的初学者及工作1-3年的数据工程师、数据分析师。使用场景及目标：①掌握Spark在大数据环境下进行机器学习任务的基本开发流程；②理解Spark相较于传统工具（如Pandas）在处理大规模数据时的优势；③应用于实际项目中构建分布式机器学习 pipeline。阅读建议：建议读者在本地或云端配置Spark环境，结合Jupyter Notebook动手实践文中代码，重点关注数据加载、特征向量组装、模型训练与评估等关键步骤，加深对Spark MLlib应用的理解。

2026-06-10

【移动通信数据分析】基于基站定位数据的商圈聚类模型构建：人流特征挖掘与促销区域选择

内容概要：本文介绍了一种基于基站定位数据的商圈分析方法，利用通信运营商提供的用户定位数据，通过数据挖掘技术对基站覆盖区域进行聚类分析，进而识别不同类型商圈并评估其特征。文章以时间序列的基站小区编号数据为基础，结合用户在各基站的停留时间和人流量两个关键指标，完成数据获取、探索、预处理（包括数据规约与离差标准化）及建模全过程。采用层次聚类算法构建商圈聚类模型，并通过谱系图确定最优聚类数k=3，最终得出三类商圈的特征分布。分析结果显示，其中一类商圈具有高人流量、短停留时间等特点，符合商业区行为模式，适合作为运营商促销活动的重点区域。; 适合人群：具备一定数据分析与机器学习基础，从事数据挖掘、城市计算或商业智能相关工作的技术人员，尤其是工作1-3年的中初级数据分析师或研发人员。; 使用场景及目标：①应用于基于移动定位数据的城市功能区识别；②支持运营商精准营销决策，识别高价值商圈开展促销活动；③学习如何使用层次聚类和数据标准化方法处理时空轨迹数据。; 阅读建议：此资源结合实际案例讲解完整的数据挖掘流程，建议读者结合GitHub提供的代码进行实操练习，重点关注数据预处理与聚类结果解读环节，深入理解人流特征提取与商圈分类逻辑。

2026-06-10

机器学习基于K-Means聚类的航空客户价值分析与流失预测模型构建

内容概要：本文以航空公司客户价值分析为背景，介绍如何利用机器学习技术进行客户价值识别与流失分析。通过构建包含客户关系长度（L）、消费时间间隔（R）、消费频率（F）、飞行里程（M）和折扣系数平均值（C）的五维指标体系，替代传统RFM模型中的消费金额，提升客户价值评估的合理性。针对传统分箱法导致的细分群体过多问题，采用K-Means聚类算法实现客户分群，进而对各类别客户进行特征分析，识别高价值客户群体，并据此制定差异化营销策略。文中还涵盖了数据探索、异常值处理、属性规约、数据标准化等预处理流程，完整展示了从数据到建模的全过程。; 适合人群：具备一定数据分析基础，从事运营、市场营销或数据科学相关工作的1-3年经验从业者；对客户细分、用户价值建模感兴趣的初学者。; 使用场景及目标：①应用于航空、电商、金融等行业的客户价值评估与精准营销；②掌握K-Means聚类在实际业务中的落地方法；③学习如何基于业务逻辑优化经典模型（如RFM）并完成端到端的数据挖掘项目。; 阅读建议：此资源结合业务场景讲解数据挖掘全流程，建议读者结合Python工具动手实践数据清洗、特征构造与聚类建模过程，深入理解各步骤对最终客户分群效果的影响。

2026-06-10

电子商务基于协同过滤的用户行为分析与个性化服务推荐系统构建

内容概要：本文以一家大型法律资讯网站为研究对象，针对用户在海量信息中难以高效获取所需内容的问题，提出基于协同过滤算法的个性化推荐系统解决方案。通过分析广州地区83万余条用户访问日志，对用户行为进行多维度探索，包括网页类型分布、点击频次、访问习惯等，发现用户主要集中于咨询内容页和知识内容页的浏览。在此基础上，进行数据清洗、变换与规约等预处理，并构建并行组合的推荐模型，重点运用协同过滤算法实现个性化服务推荐，旨在提升用户体验、增强用户粘性并减少用户流失。; 适合人群：具备一定Python编程基础和数据分析能力，熟悉pandas、SQL及基本机器学习算法的数据分析师或研发人员，尤其是从事推荐系统相关工作的从业者；使用场景及目标：①应用于电子商务类网站的用户行为分析与个性化推荐系统建设；②解决信息过载问题，挖掘用户潜在兴趣，提升推荐精准度与系统智能化水平；阅读建议：建议结合GitHub提供的完整代码实践操作，重点关注数据分块处理、协同过滤算法实现及模型评估过程，同时注意高内存消耗下的大数据处理技巧。

2026-06-10

机器学习基于时间序列的异常用水行为检测：家用热水器用户洗浴事件自动识别与模型优化

内容概要：本文围绕家用电器用户行为分析，重点研究热水器用户的用水事件识别问题。通过时间序列数据，依据水流量和停顿时间间隔划分出完整的用水事件，并在此基础上识别洗浴事件。文章详细介绍了数据获取、探索与预处理过程，包括属性规约、数值规约、缺失值处理及特征构造；提出了基于阈值的用水事件划分模型，并通过阈值寻优模型动态确定最优停顿时间阈值（最终为4分钟）；采用BP神经网络构建洗浴事件识别模型，利用Keras实现，选取11个关键特征进行训练，输出为是否为洗浴事件。同时对原书中存在的代码问题进行了修正，适配新版Keras框架。; 适合人群：具备一定Python编程基础和机器学习理论知识，从事数据分析、数据挖掘或智能家电相关工作的技术人员，尤其是工作1-3年的研发人员；; 使用场景及目标：①应用于智能家居系统中自动识别用户洗浴行为，支持节能控制与个性化服务推荐；②学习如何从原始时序数据中提取有效特征、构建事件划分模型与分类模型，掌握完整的数据挖掘流程；③了解Keras框架在实际项目中的应用及常见版本兼容性问题的解决方案；阅读建议：建议结合代码实践操作，重点关注阈值寻优模型的设计思路与神经网络建模过程，注意处理Keras版本升级带来的API变更问题，深入理解特征工程与业务逻辑的结合方式。

2026-06-10

机器学习基于四种算法的信用卡还款预测模型对比：客户行为分析与风险评估系统设计

内容概要：本文介绍了如何利用机器学习模型与算法对销售数据进行归因分析，重点阐述了归因分析的基本概念、实现步骤及Python代码实践。文章通过构建线性回归模型，计算广告费用、折扣率和节假日等因素对销售额的贡献度，并采用IQR方法检测各指标的异常波动，进而解释各因素对销售结果的影响。此外，还推荐了多个可用于归因分析的Python库，如PyMC、Gensim、Orange等，拓展了分析工具的选择范围。; 适合人群：具备一定数据分析基础，熟悉Python编程，从事市场分析、运营或数据科学相关工作的从业者及学习者；使用场景及目标：①识别影响销售额的关键驱动因素，量化各营销手段的贡献程度；②检测业务指标中的异常波动，辅助制定精细化运营策略；③掌握用机器学习方法实现归因分析的技术路径，提升数据驱动决策能力；阅读建议：建议结合文中代码实例动手实践，深入理解线性回归在归因中的应用，并尝试使用推荐的第三方库扩展分析维度，提升实战能力。

2026-06-10

【大数据技术】基于PySpark的机器学习流程：CSV数据预处理与逻辑回归模型预测系统实现

内容概要：本文介绍了如何使用Python和Apache Spark（PySpark）开发一个简化的大数据应用，涵盖从环境搭建到模型评估的完整流程。文章以CSV文件为数据源，演示了数据加载、清洗、类型转换等预处理操作，并基于Spark MLlib实现逻辑回归模型进行数据预测，最后通过二元分类评估器计算AUC指标来评价模型性能。整个过程在Jupyter Notebook环境中完成，结构清晰，适合作为大数据与机器学习的入门实践案例。; 适合人群：具备基本Python编程能力和数据分析兴趣的初学者，以及希望了解Spark在机器学习中应用的1-3年经验开发者。; 使用场景及目标：①学习PySpark在大数据处理与机器学习中的集成应用；②掌握使用Spark进行数据清洗、特征工程、模型训练与评估的核心流程；③为后续处理更复杂的大规模数据任务打下基础。; 阅读建议：建议读者结合代码动手实践，在本地或云端配置Spark环境并运行示例代码，重点关注数据格式转换、VectorAssembler的使用及模型评估方法，以深入理解Spark处理大数据的整体机制。

2026-06-10

C++高性能计算、系统开发实战资料集合

本资源包围绕三个核心方向展开：Unreal Engine C++ 模块开发、OpenGL 图形渲染管线以及操作系统原理与 C++ 实现，覆盖从应用层到系统层的完整技术栈。第一篇概述 C++ 在高性能计算领域的核心优势（零成本抽象、SIMD 向量化、编译期计算），并建立数据导向设计的思维框架。第二篇深入 UE5 的模块系统架构，详细讲解 Build.cs 配置、UHT 反射机制、Gameplay 框架核心类以及插件开发全流程。第三篇从 OpenGL 4.6 可编程管线出发，逐阶段剖析顶点着色器 MVP 变换、片元着色器 PBR（Cook-Torrance BRDF）光照模型、延迟渲染 G-Buffer 架构及 GPU 驱动优化策略。第四篇自底向上实现操作系统的三大核心机制——CFS 进程调度器（红黑树 + vruntime）、伙伴系统物理页分配器、四级页表虚拟地址转换。第五篇系统总结性能分析工具链（perf/Tracy/VTune）、自定义池化分配器、无锁 MPMC 队列、工作窃取线程池及编译器 PGO 优化。

2026-06-09

SQL实战进阶（优化实战 + 项目案例两大方向）

主题：SQL实战进阶（优化实战 + 项目案例两大方向）文件数量：5 个 Markdown 文件 | ZIP 大小：14.9 KB（原始 32.1 KB）资源文件说明文件名主题核心内容 01_复杂查询编写与多表连接优化.md JOIN 与窗口函数多表 JOIN 类型对比、驱动表选择、窗口函数 ROW_NUMBER/LAG/LEAD 实战、CTE 拆解技巧 02_执行计划解读与索引设计原则.md 执行计划 + 索引 EXPLAIN 字段逐一解读、type 性能等级表、索引七原则、失效场景汇总、慢查询日志分析 03_电商订单分析SQL完整实战.md 电商业务 SQL GMV 环比计算、RFM 用户分层、新老用户对比、品类帕累托、协同购买分析、取消漏斗 04_用户行为日志与金融交易统计实战.md 日志 + 金融行为漏斗转化、Session 路径分析、连续活跃用户、账户余额流水、异常交易检测 05_SQL进阶最佳实践与学习路径.md 综合最佳实践 COUNT/分页/批量更新优化、树形结构查询、时序连续分析、代码规范、面试高频考点、工具推荐

2026-06-09

Java微服务架构-resources

主题：Java微服务架构 — Spring Cloud Alibaba 全家桶（Nacos + Sentinel + Seata）与分布式事务解决方案文件数量：5 个 Markdown 文件资源文件说明文件名主题核心内容 01_Spring Cloud Alibaba 生态概述.md 全家桶全景组件矩阵、版本选型表、架构拓扑、生态对比 02_Nacos 注册中心与配置中心实战.md Nacos 数据模型、CAP切换、配置动态刷新、集群部署 03_Sentinel 流量治理与熔断降级.md Sentinel 流控模式、热点参数限流、熔断状态机、Dashboard 04_Seata 分布式事务解决方案.md Seata AT/TCC/Saga/XA 四种模式详解、代码示例、对比表 05_微服务最佳实践与生产落地.md 生产实践选型决策树、代码规范、容器化部署、可观测性、灰度发布

2026-06-08

移动应用开发项目实战资源

资源包概述 **主题**：移动应用开发项目实战 — 跨平台方向（Flutter 电商 + React Native 社交 + UI 组件库 + 状态管理） **文件数量**：5 个 Markdown 文件，总大小 29.2 KB 资源文件清单文件名主题核心内容 01_跨平台技术选型与项目启动.md 技术选型 Flutter/RN/KMP 三维对比、决策树框架、项目启动清单、工程化实践、性能基线 02_Flutter电商APP架构与核心实现.md Flutter 电商四层分层架构、商品列表无限滚动、购物车离线优先、支付状态机、性能优化清单 03_ReactNative社交应用开发实战.md RN 社交 FlashList 虚拟化、图片渐进加载、IM WebSocket 重连机制、富文本编辑器、推送体系 04_完整UI组件库设计与实现.md UI 组件库设计 Token 规范、16+ 核心组件清单、Flutter 按钮/Toast 完整实现、发布策略 05_跨平台状态管理方案深度对比.md 状态管理 Flutter(Riverpod/Bloc) vs RN(Zustand/react-query) 完整代码示例、乐观更新、反模式避坑

2026-06-08

Go语言高并发与云原生项目实战

本资源包《Go语言高并发与云原生项目实战》共包含5个专题文档，系统覆盖现代Go工程师在生产环境中最核心的技术栈。第一篇深入讲解基于Gin框架的RESTful API开发，涵盖分层架构设计、JWT鉴权、令牌桶限流与连接池调优等工程级实践；第二篇以高并发WebSocket聊天室为案例，详解goroutine与channel驱动的Hub模型、心跳检测机制及Redis Pub/Sub横向扩展方案；第三篇聚焦gRPC微服务通信，从proto文件定义到四种RPC调用模式，配合认证、限流、熔断拦截器链，构建可观测的微服务体系；第四篇系统梳理Go并发编程核心，深入解析GMP调度模型原理、channel六大经典并发模式、sync原语选型策略及pprof性能剖析实战，帮助开发者彻底告别并发陷阱；第五篇直击云原生部署全链路，涵盖Docker多阶段镜像构建、Kubernetes Deployment/HPA/Ingress配置、Prometheus+Alertmanager告警体系搭建以及GitHub Actions CI/CD自动化流水线落地，让服务从代码到上线实现全程自动化。五个专题由浅入深、相互呼应，兼顾原理讲解与可落地的代码示例，适合有一定Go基础、希望向高并发与云原生方向进阶的工程师系统学习与实践参考。

2026-06-05

JavaScript全栈工程化与性能调优

本资源包聚焦 JavaScript 全栈工程化与性能调优，涵盖五大核心方向：Vue3 + Pinia 状态管理项目实战，以电商后台管理系统为案例，深入 Composition API、Setup Store、跨 Store 通信、路由守卫与 Vitest 测试策略；React + Redux Toolkit 企业级应用，基于数据分析平台场景，覆盖 createAsyncThunk、EntityAdapter、RTK Query 缓存策略与乐观更新机制；Next.js 服务端渲染全场景实战，以技术博客平台为载体，系统对比 SSG、SSR、ISR、Streaming 四种渲染策略，并包含 Server Actions 与 Docker 生产部署方案；JavaScript 全栈工程化实践，从 Monorepo（pnpm + Turborepo）架构设计到 ESLint 共享配置、GitHub Actions CI/CD 流水线、Docker 多阶段构建，构建完整工程化体系；前端性能调优指南，围绕 Core Web Vitals（LCP/INP/CLS）指标，覆盖 Bundle 分包、Tree Shaking、渲染优化、Web Worker 卸载计算、Service Worker 离线缓存及 RUM 监控体系建设，每份文档均附可运行的代码示例与避坑建议，适合中高级前端开发者系统学习。

2026-06-04

AI深度学习资源包.zip

这套资源包不讲废话，直接给你5份可以跑起来的完整工程方案，覆盖深度学习从环境搭建到模型上线的全链路，每一份都附有完整可运行代码、参数配置说明和实测性能数据。包含5大核心资源： ① ResNet图像分类实战 — 手撕残差块 + CIFAR-10 全流程 + ONNX/TorchScript双格式导出，附 Mixup/EMA 涨点技巧对比表 ② YOLOv8目标检测实战 — 从 LabelImg 标注到 TensorRT INT8 量化部署，含 ByteTrack 多目标跟踪扩展代码，生产级工程模板 ③ BERT微调NLP实战 — 文本分类 × 命名实体识别 × 细粒度情感分析三合一，LoRA 仅训 0.58% 参数接近全量效果，附 FastAPI 异步推理服务 ④ 深度学习环境配置完全指南 — CUDA 11.8/12.x 版本速查表 + 三平台一键配置 + Docker镜像 + 多GPU分布式环境，踩坑总结全在里面 ⑤ 模型部署与优化实战手册 — INT8量化 × 结构化剪枝 × 知识蒸馏 × TorchServe × Triton，TensorRT INT8 实测 4.7x 加速，七种部署方案延迟/吞吐横评

2026-06-02

Python全栈开发-数据分析与可视化.zip

这份资源包聚焦 Python 数据分析与可视化，共5个实战导向的 Markdown 文件。内容从 Pandas 数据清洗、分组聚合到时序处理；Matplotlib 高级图表涵盖双Y轴、热力图、动画与高清导出；Plotly 交互可视化覆盖桑基图、3D图、地图及 Dash 仪表盘；Prophet 时间序列预测深入节假日效应、交叉验证与参数调优；综合案例以电商用户行为分析为主线，串联 RFM 分层、转化漏斗、购物篮关联规则、协同过滤推荐及购买预测模型，并附带 SHAP 解释与 PPT 报告自动生成。所有文件均含完整可运行代码与业务实战场景，适合数据分析师、BI 工程师及 Python 全栈开发者系统学习与项目参考。

2026-06-01

C语言系统编程与数据结构实战

面向C语言进阶学习者与系统编程开发者，涵盖算法数据结构与Linux系统编程两大核心方向。数据结构部分提供单链表、双向链表、BST二叉搜索树、图（邻接表）的完整.h+.c+测试驱动代码，附带复杂度速查表；排序部分覆盖插入/希尔/快排三路划分/归并/堆排/计数六大算法，含10万级随机数据实测基准对比；系统编程部分深入Linux文件IO（read/write/mmap/pread）、进程管理（fork/exec/守护进程/管道IPC）、多线程同步（互斥锁+条件变量生产者消费者/读写锁/信号处理）；网络编程部分实现TCP/UDP回声服务器、select与epoll(LT+ET)多路复用模型对比；构建部分提供多文件Makefile企业级模板，含自动依赖生成、静态/动态库、调试/发布切换、安装卸载等完整工程化流程。所有代码基于POSIX标准与C11，可直接编译运行。

2026-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人