坐望云起-CSDN博客

原创有趣的数学 Replicator equation

摘要：复制子方程通过数学公式描述"适者生存"的群体演化规律，适用于博弈论、分布式系统等领域。其核心公式为$\dot{x}_i = x_i \cdot (f_i - \bar{f})$，表示策略占比变化由其收益与群体平均收益的差值驱动。以奶茶店竞争为例，高收益策略占比会增长，低收益策略被淘汰，最终系统趋于稳定。实现只需4步：定义策略、构建收益矩阵、Python代码迭代（如Scipy求解）、仿真分析结果。该模型在资源调度、攻防推演中高效实用，但需注意其假设群体规模大且策略固定的局限性。通过简单代码即可模拟复杂

2026-07-02 11:23:53 314

原创招投标AI落地实战：基于RAG大模型的智能标书生成与合规审查完整方案

摘要：针对招投标行业文档量大、合规风险高、人工效率低等痛点，本文提出基于大模型+RAG检索增强的技术方案。通过多模态文档解析、双知识库架构（企业私有库+公共法规库）、多路检索重排等技术，实现标书内容精准生成与合规审查。系统可显著提升标书撰写效率80%以上，降低废标风险，并支持内容溯源。文章详细阐述了技术架构、核心流程及工程优化方案，为招投标智能化提供可落地的解决方案。关键词：RAG、智能标书、多模态解析、合规审查、向量数据库。

2026-06-25 11:00:15 419

原创 webView2 监听webgl崩溃及其原因深度分析

摘要： WebView2基于Chromium内核，通过多进程架构（如独立的GPU进程处理WebGL渲染）保障稳定性，但WebGL内容仍可能因GPU进程崩溃而失效。崩溃诱因包括：显卡驱动/硬件兼容性问题（最高发）、内存/显存溢出、WebGL上下文丢失、进程架构冲突及系统级策略限制。解决方案需结合控件层（监听ProcessFailed事件捕获GPU进程崩溃）和页面层（监听webglcontextlost事件感知上下文丢失）的双重监听，实现自动恢复。优化手段包括调整启动参数（如--use-gl=egl）、规范We

2026-06-23 08:28:05 210

原创有趣的数学插值法

本文介绍了基于Catmull-Rom三次样条的插值技术及其应用。主要内容包括：一维信号插值：使用三次多项式在相邻采样点间构建平滑曲线，通过四个连续采样点计算多项式系数。边界段采用二次多项式处理。二维数据插值：通过两次一维插值（先水平后垂直）实现图像等二维数据的重采样。二维路径拟合：将坐标分量独立插值后组合，可生成通过控制点的平滑曲线。高效实现方法：利用Catmull-Rom脉冲响应与原始信号卷积，避免重复计算系数。脉冲响应在[-2,2]区间外为零，简化计算。该技术在计算复杂度和插值质量间取得良好平

2026-06-22 17:42:27 334

原创发现量子力学的基本机制

本文通过双缝实验和偏振实验探讨量子力学中的波粒二象性。当激光通过双缝时，光子会形成明暗相间的干涉条纹，即使单个光子发射也会产生类似波的干涉图案，证明粒子同时具有波动性。通过偏振透镜实验进一步说明，光子的偏振状态可以用量子态（ket）描述，其行为具有概率性——光子要么完整通过透镜，要么被完全阻挡，通过概率取决于偏振方向与透镜的夹角。实验还揭示量子操作顺序的重要性：两个偏振透镜的不同排列会导致完全不同的观测结果。这些现象表明，微观粒子的行为无法用经典物理解释，必须用量子态等概念才能准确描述。

2026-06-20 09:44:29 224

原创 DAMO-YOLO-S 实时人体检测模型

DAMO-YOLO-S是阿里巴巴达摩院专为工业边缘计算设计的轻量级人体检测模型，通过神经架构搜索（MAE-NAS）和重参数化特征融合（RepGFPN）技术，在保持高精度的同时降低30%推理延迟。该模型采用两阶段训练策略（通用预训练+垂类微调），显著提升复杂工业场景的适应性，支持从云端到边缘设备的灵活部署。提供ModelScope Pipeline和RESTful API等多种调用方式，具备低算力消耗、高吞吐量等优势，适用于安防监控、生产安全等实时检测场景，在遮挡、低光照等恶劣条件下仍保持稳定性能。

2026-06-19 16:34:30 36

原创用于自动化建筑投标书准备的生成式人工智能模型

本研究针对建筑投标文件编制工作高度依赖人工、效率低下的行业痛点，开发了一套基于生成式人工智能的自动化框架。通过两家大型工程咨询企业的案例研究，识别出技术方案撰写等高价值自动化环节，并构建了融合大语言模型（GPT-4o）、向量语义检索和标准化知识库的系统原型。测试显示，该系统在招标需求信息提取环节达到96.25%的平均F1分值，生成的技术方案章节经专家评审获得81.4%的认可度，接近人工撰写质量（88.6%），但耗时从数小时缩短至30分钟内。研究证实该框架能显著提升投标效率、保障文件一致性并降低知识流失风险，

2026-06-17 22:23:05 418

原创 NFC 与 RFID 有什么区别？

摘要：本文系统分析了射频识别（RFID）与近场通信（NFC）的技术关系与核心差异。RFID作为广义非接触式识别技术，涵盖低频（125 kHz）、高频（13.56 MHz）和超高频（860-960 MHz）三类，而NFC是工作于13.56 MHz高频段的标准化子集，具备双向通信、三模式切换（读写器/卡模拟/点对点）和严格距离限制（≤4 cm）等特性。文章从技术谱系、系统架构、频段划分、应用场景等维度对比二者的本质区别。

2026-06-01 18:20:45 601

原创 Zebra ZD421CN 打印机对接教程

### 1.3 打印机型号- **型号**：Zebra ZD421CN-300dpi ZPL- **连接方式**：USB- **分辨率**：300 DPI（12 dots/mm）- **内存**：RAM 8176KB，FLASH 65536KB

2026-05-28 21:02:51 334

翻译芯片设计与流片：关键流程解析

从设计到成品芯片的关键阶段包括：设计、流片、封装和测试，但成本分布各不相同：大致为工程人力 20%、流片 40%、封装 35%、测试 5%。流片风险较高。失败率因团队和芯片类型而异，通常在 15%–35% 之间。部分模拟传感器企业，即便拥有完整团队和清晰设计理念，也需要多次迭代：某案例耗时八年、经历 18 次流片，才完成模拟传感器知识产权（IP）验证，并交付超低功耗、近传感器处理芯片。

2026-05-23 17:03:34 171

原创术语表：生成式人工智能基础

本文介绍了人工智能领域的核心术语，涵盖生成式AI、大型语言模型、神经网络等关键技术概念。重点解析了拟人化、智能体、偏见、思维链提示等专业术语，阐述了上下文窗口、涌现行为、幻觉等模型特性，并说明了提示词工程、检索增强生成等实用技术方法。文章旨在帮助读者构建AI基础知识框架，理解技术原理与应用场景，同时强调AI系统虽能模拟人类特质，但本质仍是工具。这些概念认知有助于把握技术发展趋势，促进AI伦理讨论和创新应用。

2026-05-16 12:24:10 455

原创机器学习笔记 - 基于C++的深度学习四、实现梯度下降

在本文中，我们学习了如何利用梯度从数据中拟合卷积核，实现了简单、高效、且是反向传播等高级算法基础的梯度下降，并通过实战实验，用梯度下降从数据中还原了 Sobel 算子。下一篇文章，我们将讲解激活函数：分类、原理、代码实现以及导数实现。

2026-05-13 15:02:23 704

翻译使用 Ultralytics 平台导出 Ultralytics YOLO 模型

本文详细介绍了如何通过Ultralytics平台导出YOLO系列模型，实现跨平台部署。Ultralytics平台整合了YOLOv5至YOLOv10全系列模型，支持一键导出为TensorRT、ONNX、CoreML等多种格式，适配不同硬件设备。文章涵盖导出前的准备工作、可视化界面和API两种导出方式的操作步骤，以及主流导出格式的适用场景。同时提供了常见问题的解决方法，帮助开发者高效完成模型转换。该平台通过简化流程、优化性能，显著降低了YOLO模型从训练到部署的工程化门槛。

2026-05-13 14:34:09 81

原创从H.264到AV1：视频编码的迭代博弈与技术演进深度解析

视频编码技术演进经历了H.264普及、H.265效率跃升、AV1免费突围和H.266专业深耕四个阶段。核心矛盾始终围绕压缩效率、编码复杂度和成本生态展开：H.264通过灵活预测和变换编码奠定基础；H.265引入CTU和增强预测实现效率翻倍，但陷入专利困局；AV1以免费模式突破，采用超级块和多模式分割技术，效率超越H.26525-35%；H.266面向8K/VR专业场景，通过更复杂划分实现极致压缩。未来趋势呈现免费化（AV1主导民用）、硬件化和场景细分（H.266专注高端），AI编码虽具潜力但短期难落地。技术

2026-04-26 16:02:01 743

原创视觉模型在生产环境中失败的主要原因

计算机视觉系统在生产环境中表现不佳的五大关键原因：1）训练数据与真实场景存在显著差距，导致模型泛化能力不足；2）过拟合问题使模型仅记忆有限模式而缺乏适应性；3）现实中的边缘案例超出训练数据覆盖范围；4）部署后缺乏持续监控机制，难以及时发现性能衰减；5）基础设施限制导致实时响应能力下降。解决方案包括采用分阶段部署策略、建立反馈循环机制、记录模型局限性边界，以及针对环境可变性进行专项设计。成功的关键在于将模型开发视为持续优化过程，而非一次性工程。

2026-04-16 22:15:47 82

原创 Muse Spark是Meta一年多来的首个重大新AI模型，真的有优势吗？

经过多年的研发投入与外界不断猜测，Meta 旗下备受瞩目的全新 AI 模型终于正式发布。

2026-04-14 09:54:35 97

原创网页端小工具 - 图像像素化（HTML5 + CSS3 + JavaScript + Canvas）

这篇文章介绍了一个基于HTML5 Canvas的头像像素化工具实现方案。核心功能包括：1)通过文件上传控件读取用户图片；2)使用滑块实时调节像素块大小；3)利用Canvas API将图片分解为小方块并计算平均颜色值；4)通过fillRect绘制像素化效果。技术要点涉及FileReader读取本地文件、ImageData处理像素信息、toBlob生成下载文件，以及async/await确保异步操作顺序执行。该方案纯前端实现，无需服务器支持，并采用防抖优化提升交互流畅度。

2026-04-12 06:00:00 123

原创轻松上手 Fabric.js：前端 Canvas 绘图神器

Fabric.js是一个简化HTML5 Canvas操作的JavaScript库，提供高级API封装基础功能，支持图形创建、交互操作和动画效果。通过对象化方式管理画布元素，开发者可以轻松实现图片加载、变换、裁剪等复杂操作。示例代码展示了如何加载图片并添加圆形裁剪路径动画，通过animate方法实现半径变化的动态效果，最终将处理后的图片添加到画布中。Fabric.js大幅降低了Canvas开发门槛，适合需要丰富交互的网页图形应用开发。

2026-04-11 20:20:44 137

翻译谷歌十年豪赌定制芯片，成为其在 AI 竞赛中的秘密武器

谷歌十余年芯片研发迎来AI红利，TPU需求激增推动云业务增长34%。第七代TPU Ironwood性能提升4倍，获Anthropic百万颗订单。谷歌成为唯一大规模部署专用AI芯片的云厂商，建立差异化优势。虽然仍大量采购英伟达GPU，但TPU已成为谷歌云151亿美元季度营收的重要引擎。分析师估算TPU业务估值达9000亿美元，并建议对外销售芯片系统。随着与Meta、Anthropic等企业签订百亿美元级合同，谷歌计划2026年部署超1吉瓦AI算力，同时将年度资本支出上调至930亿美元。

2026-04-11 20:08:26 104

原创有趣的数学乌拉姆螺旋

摘要： 1963年，数学家乌拉姆发现，将自然数以螺旋形式排列并标记素数时，素数会聚集在某些对角线上，形成明显的规律性模式。这一现象被称为“乌拉姆螺旋”，揭示了素数分布并非完全随机，而是与二次多项式密切相关。某些多项式（如欧拉的n²-n+41）能高密度生成素数，对应螺旋中的“强对角线”，而其他多项式则几乎不生成素数。这一发现挑战了素数完全无序的传统认知，为研究素数分布提供了新的可视化工具，但其深层数学原理（如哈代-李特尔伍德猜想）仍未完全破解。乌拉姆螺旋不仅启发了计算数论的发展，也成为探索黎曼假设等难题的桥梁

2026-04-08 20:31:47 702

原创为 AI 助手注入“超能力”：一文掌握 OpenCode Skill 加载与使用

摘要： OpenCode Agent Skill是一种模块化技能系统，允许AI助手按特定规范执行任务。技能以Markdown文件形式存在，包含元数据和详细指令，可放置在全局或项目目录中。通过加载如"chinese-novelist"等技能，AI能获得结构化创作能力，遵循专业写作流程产出高质量内容。该系统支持自定义开发规范、代码检查等场景，用户只需将技能文件放入指定路径并重启应用即可生效。典型应用包括标准化Git提交、小说创作等工作流，使AI从通用助手转变为专业化工具。

2026-04-08 18:52:28 1009

原创不用写代码，也能成为 AI 公司的核心人才

摘要：在AI行业立足并非必须精通编程，关键在于掌握核心AI素养：1）基础层：理解LLM、RAG、微调等核心概念，避免技术沟通障碍；2）领域层：结合岗位需求，将AI知识转化为业务能力（如产品经理需精准定义技术需求）；3）实践层：通过工具测试、工程师交流培养AI直觉。AI行业的竞争力源于“懂AI价值”而非写代码，非技术人员通过系统学习与实战，同样能成为团队关键角色。

2026-03-22 13:43:13 98

原创 Qwen3核心技术解读

Qwen3系列开源大模型通过混合专家架构(MoE)实现技术突破，提供6亿至2350亿参数的多规格模型。其创新设计包括细粒度专家分割、四阶段训练流程和双思考模式，在代码生成和数学推理等任务中超越GPT-4。该模型采用36万亿Token的多模态预训练数据，支持119种语言，并通过8位量化技术显著提升部署效率。Qwen3的开源生态已催生10万+衍生模型，推动AI在医疗、教育等领域的应用。作为首个万亿级开源MoE模型，Qwen3重新定义了开源大模型的能力边界。

2026-03-08 22:44:32 455

原创华为openEuler安装clickhoue集群

三台服务器，openEuler系统，都是100g系统，1t数据。

2025-12-07 12:33:35 888

原创基于Python/TripoSR实现PNG图像到STL的转换

最后可以查看选然后的模型。

2025-11-22 11:14:41 197

原创华为openEuler 22.03 (LTS-SP3) 手动安装单点clickhouse

至此安装完成，后续我是使用java微服务进行连接，mysql是主数据源，clickhouse是第二个数据库，经过测试连接也是成功的，可以写入数据。然后查看是否安装成功，安装server的时候会问我们要密码，想输就输入一个，不想就空着，但是回头远程连接的时候还是需要的，所以最好配置一个。common-static安装成功，但是安装server的时候，报了非法指令，查询之后觉得是客户的arm机器有点老，某些指令不支持。首先是listen_host改成0.0.0.0，允许远程连接，然后我关闭了ipv6。

2025-11-03 14:15:37 695

原创有趣的数学贝塞尔曲线和毕加索

本文探讨了毕加索的极简主义线条画与贝塞尔曲线的数学关联。作者以毕加索的《狗》为例，分析其看似简单的线条本质上是经过高度提炼的数学表达。通过介绍贝塞尔曲线的定义和递归特性，详细阐述了如何用控制点构建参数化曲线，并给出JavaScript实现算法。文章揭示了艺术创作与数学原理的深层联系：毕加索通过多幅公牛素描提炼出十根线条的本质，恰如贝塞尔曲线通过控制点递归逼近复杂形状的过程。最终，作者用九段贝塞尔曲线成功复现了毕加索的《狗》，验证了极简艺术背后的数学精确性。

2025-09-09 19:35:50 1401

原创机器学习笔记 - K均值聚类背后的数学和代码

K均值聚类是一种简单高效的机器学习算法，用于将未标记数据分组。算法通过随机初始化质心，计算数据点与质心的欧氏距离来分配簇，并迭代更新质心位置直至收敛。选择合适的K值至关重要，可通过肘部法（WCSS）或轮廓系数评估。K-Means++改进了初始质心选择策略，通过概率化分散质心位置，提升聚类效果和收敛速度。该算法适用于各类数据分类场景，但需注意初始质心选择对结果的影响。

2025-09-06 22:57:16 194

原创 Hyper-V + Centos stream 9 搭建K8s集群（二）

本文介绍了Kubernetes集群的安装和配置步骤：1)在主节点安装bash自动补全功能；2)部署Calico网络插件，包括修改镜像源和验证运行状态；3)通过Helm或kubectl两种方式安装Kubernetes Dashboard，详细说明了创建服务账号、获取访问令牌和修改NodePort的方法；4)提供了Nginx测试应用的部署示例，包含Pod和Service的定义。文中还包含了常见问题的解决方案，如镜像拉取失败时的处理方法。所有操作都配有具体的命令和配置示例，适合Kubernetes初学者参考。

2025-08-03 19:14:52 1062

原创 Hyper-V + Centos stream 9 搭建K8s集群（一）

本文详细记录了在CentOS Stream 9虚拟机上搭建Kubernetes集群的全过程。首先创建三台虚拟机并完成网络配置，然后进行系统初始化（关闭防火墙、SELinux和交换分区）。接着在所有节点安装containerd容器运行时，配置国内镜像源，并安装kubeadm、kubelet和kubectl组件。最后在主节点初始化Kubernetes控制平面，并生成子节点加入集群的命令。文档特别强调了配置过程中的关键点和常见问题解决方案，如镜像源修改、containerd配置调整等，为后续Kubernetes集

2025-08-02 11:27:38 1419

原创 ASP.NET Web API + VUE3 整合阿里云OSS，后端API生成预签名上传Url，前端VUE进行上传

4、图片可以上传了之后，发现在浏览器里面访问图片的时候不是预览而是下载，而vue里面访问直接就是403，我把防盗链的白名单加上了，因为是本地的测试，加的是localhost，图片在vue内可以显示了，在浏览器里还是下载，这个就先不管了。下面是后端生成上传Url的参考代码，主意request.ContentType，如果这里要是设置了，那么前端也要设置成一样的，如果前端是获取文件的contentType，可以传到后端来使用，我这里就没有进行设置，我目前只传图片。2、Content-Type的设置。

2025-03-25 16:58:40 1377

原创 ASP.NET Web的 Razor Pages应用，ajax调用记录以及Cookie配置

一是配置AddAntiforgery自定义的HeaderName，因为这是.net corede的默认的预防跨网站请求伪造 (XSRF/CSRF) 攻击的手段，关闭了也不太好，所以添加自定义的头。二是Cookie认证的配置，如果不喜欢用Cookie，可以自己改成jwt之类的。下面是页面部分代码，核心在于@Html.AntiForgeryToken()。以及ajax请求的部分：重要的一是url，而是header的部分。url不能错，网页的命名空间也不能错，错了就会返回html。

2025-03-25 13:37:36 605

原创 ASP.NET Web的 Razor Pages应用，配置热重载，解决.NET Core MVC 页面在更改后不刷新

Razor Pages应用，修改页面查看修改效果，如果没有热重载，改一句话跑一次，这个活就没法干了。

2025-03-22 14:45:28 752

原创若依spring框架升级到JDK17 + spring boot3 + spring framework6的趟坑记录

1、jakarta.servlet-api升级之后，需要把所有的controller或其它类相关的HttpServletResponse、HttpServletRequest，都用jakarta.servlet.http.HttpServletResponse;（2）/**/*.css要改成/*/*.css，/druid/**改成/druid/*，总之不能有两个**4、maven-compiler-plugin要加上这个。主要配置如下，出现的问题也都是版本原因。5、下面是版本的主要记录。

2025-02-26 11:50:45 1308

原创 windows怎么查看进程运行时的参数？

在Windows中，可以使用命令行工具tasklist查看运行的进程列表。

2025-01-30 22:54:16 1959

原创计算机视觉模型的未来：视觉语言模型

人工智能已经从识别数据中的简单模式跃升为理解复杂的多模态数据。该领域的发展之一是视觉语言模型（VLM）的兴起。这类模型将视觉和文本之间联系起来，改变了我们理解视觉数据并与之交互的方式。随着VLM的不断发展，它们正在为计算机视觉设定一个新的水平，能够以更有效且更像人类的方式理解和交互。从技术角度来看，VLM的出现是由于当前计算机视觉和语言模型的限制。传统的计算机视觉模型在寻找对象方面表现出色，但在理解情况、语义违规以及图像中对象的后果和连接方面存在很大困难。

2025-01-17 21:02:18 1034

原创机器学习笔记 - 单幅图像深度估计的最新技术

单眼深度估计是一项计算机视觉任务，AI 模型从单个图像中预测场景的深度信息。模型估计场景中对象从一个照相机视点的距离。单目深度估计已广泛用于自动驾驶、机器人等领域。深度估计被认为是最困难的计算机视觉任务之一，因为它要求模型理解对象及其深度信息之间的复杂关系。但在估计场景的深度时，许多因素都会产生巨大干扰，比如光照条件、遮挡和纹理会极大地影响结果。深度估计是从 2D 图像中了解场景几何结构的关键步骤。单目深度估计的目标是预测每个像素的深度值。这称为推断深度信息，仅使用一个 RGB 输入图像。

2025-01-03 21:58:40 919

原创 Protocol Buffer

Protocol Buffers （protobuf）是一种序列化结构化数据的方法，由 Google 开发。它们提供了一种与语言无关、与平台无关且可扩展的机制，用于高效序列化结构化数据。Protocol Buffers 中的数据结构是在架构文件（.proto 文件）中使用简单的与语言无关的接口定义语言（IDL）定义的。Protocol Buffers 将数据序列化为二进制格式。这种二进制格式可通过网络高效传输，并且与基于文本的格式（如 XML 或 JSON）相比，序列化和反序列化速度更快。

2025-01-01 17:40:43 1561

原创什么是WebAssembly？怎么使用？

WebAssembly，也称为Wasm，是基于堆栈的虚拟机的二进制指令格式。它被设计为一个可移植的目标，用于编译C、C++和Rust等高级编程语言，允许代码以接近本机速度在web浏览器中运行。WebAssembly于2015年由包括谷歌、微软、Mozilla和苹果在内的所有主要浏览器供应商首次宣布，作为web开发的新标准。对WebAssembly的需求源于JavaScript的局限性，JavaScript是用于web开发的传统语言。

2024-12-24 19:48:22 1472

原创机器学习笔记 - 基于Ubuntu + OnnxRuntime + C#进行Yolov5模型批量推理

项目需求，需要Ubuntu20.04系统 + OnnxRuntime中进行推理，前面的文章记录了驱动安装、CUDA安装等。Ubuntu20.04 更新Nvidia驱动 + 安装CUDA12.1 + cudnn8.9.7-CSDN博客。

2024-10-27 20:45:07 702 4

基于华为P9实现视觉SLAM的低成本方案

关注 SLAM 算法在 HUAWEI P9 上的可能性。目标是在 Android 平台上开发移动应用程序。该应用程序应该能够使用手机中嵌入的传感器（例如摄像头、陀螺仪和加速度计）来绘制、建模和定位周围环境，同时将手机随身携带。我们系统的核心是视觉 SLAM 算法。基于精度和手机存储容量，我们选择ORB-SLAM作为框架。华为 P9 上的一个摄像头、一个加速度计和一个陀螺仪作为输入设备。应用紧密耦合的视觉惯性传感器融合算法来获得基于视觉和惯性输入的相机位姿估计，从而能够在慢动作和拥挤场景中稳健地工作。我们还在计算机上离线应用 3D 地图重建来可视化 SLAM 结果。总的来说，我们的应用可以在华为P9上实现SLAM，离线3D地图重建系统可以可视化。峰值 CPU 使用率超出我们的预期 1%。所有其他规范，包括本地化错误、本地化时间、内存使用峰值、互联网带宽使用、用户学习时间和成本均已满足。该项目预示着基于智能手机的自动驾驶汽车的可能。

2022-03-30

顶级资源，布法罗大学深度学习超详细讲义英文版共20章，三大部分：应用数学和机器学习基础、深度网络：现代实践、深度学习研究

概述深度学习简介(19MB) 深度学习概述(15MB) 深度学习深度(2MB) 深度学习的历史趋势(9.9MB) 应用数学和机器学习基础知识线性代数机器学习的线性代数(2.1MB) 概率与信息论概率与信息论(2.1MB) 数值计算和基于梯度的优化数值计算(228KB) 基于梯度的优化(6.6MB) 机器学习基础知识学习的定义(5.3MB) 容量：欠拟合、过拟合(1.7MB) 超参数和验证集(490KB) 估计量、偏差和方差(741KB) 最大似然估计(367KB) 贝叶斯统计(431KB) 监督学习算法(350KB) 无监督学习算法(299KB) 随机梯度下降(366KB) 构建机器学习算法(259KB) 激励深度学习的挑战(2.4MB) 深度学习软件库 Python 库(130KB) 张量流 Tensorflow 中的 Fizzbuzz (130KB) 深度网络：现代实践深度前馈网络前馈网络(2.1MB) 基于梯度的学习(2.3MB) 隐藏单元(1MB) 架构设计(3.2MB) 反向传播和微分前向/后向传播(2.3MB) .............. ......

2023-09-10

分别基于C#、C++的WinUI 3的demo体验项目

显示如何从图片库中检索照片，然后使用各种照片效果编辑所选图像。用于查看和编辑图像文件的迷你应用程序，演示Windows应用程序SDK应用程序的XAML布局、数据绑定和UI自定义功能。照片编辑器向您展示如何从**图片**库中检索照片，然后使用各种照片效果编辑所选图像。在示例的源代码中，您将看到许多常见的做法，如[数据绑定]和[异步编程]。此示例针对Windows应用程序SDK进行测试以及Visual Studio 2022。

2023-06-07

Android开发 8.0及以上调用相机/相册，并根据Uri获取图像绝对路径，并进行文件上传

参考链接：https://skydance.blog.csdn.net/article/details/129745348 一、权限问题二、调用相机 1、声明provider 首先，我们需要在主配置文件中声明provider，与activity同级别。之所以要用到provider，是因为从Android7.0开始，就不允许在 App 间，使用 file:// 的方式，传递一个 File ，否则就会抛出异常，而provider的作用恰好就是用过 content://的模式替换掉 file://，看上去只是换了个前缀，但其实是有真实路径转为了虚拟路径。 2、调用相机首先创建一个文件，用于保存拍照图像，然后根据不同系统版本获取Uri，传递给Intent，然后调起相机（可以考虑将outputImage、imageUri设置为全局变量）。 3、处理回调使用BitmapFactory读取imageUri，得到bitmap，然后进行一些压缩，然后显示。

2023-05-26

百度地图切图工具ie内核、chromium内核.zip

【2022-08-20更新】之前使用的winform的webbrowser控件，可能会出现兼容性问题，导致地图不显示，现已经更新为webview2替代原webbrowser控件。【备注】下载后请自行修改html文件夹下的在线地图.html，第7行的ak为自己的ak(注意：因为百度地图api更新，需要申请浏览器端的ak)。【功能描述】 1、此小软件可以用于生成百度瓦片图层生成。 2、支持多项目管理，可以为每次切图创建项目，方便管理 3、支持从地图上多选所需图片，程序自动下载合并为一张图片，自动记录缩放级别和中心点 4、可根据程序合并的图片，精确处理自己的图片 5、程序支持精准的切割瓦片图并生成demo 6、最高支持百度地图缩放级别20级

2020-03-16

基于winform/c#/opencv实现的windows下使用的自动鼠标点击小软件

【2022/08/22】版本v1.0 【功能描述】目前实现两种点击模式。间隔模式：一句话描述，按设置好的间隔时间鼠标左键单击用户设定的位置。图片模式：一句话描述，用户截图想要识别的图片，上传到软件，然后软件按设置好的间隔时间识别屏幕是否出现了用户上传的图片，如果识别到了，则鼠标左键单击用户设定的位置。后面会增加一些点击模式，比如文字识别，颜色识别等。【使用要点】 1、不能进行屏幕缩放，就是《显示设置》-《缩放和布局》那里的缩放，需要使用百分之百，否则定位不准确。 2、快捷键f1为确认功能，比如选择鼠标点击位置，f1进行最终确认。 3、快捷键f5为开始运行。 4、快捷键f6为结束运行。【文章链接】更新细节等会记录在下面文章地址，如果不能访问，可能就是刚更新审核中，耐心等待即可。 https://skydance.blog.csdn.net/article/details/126441719 【如有个性化需求】可以私信我独立开发，费用具体谈。【想增加通用功能】也可以私信我描述清楚需求，如果不是十分复杂，也会进行功能增加之后更新版本。

2022-08-22

医学影像分析+matlab+经典教学课件介绍医学图像分析领域中使用的数学和统计技术，重点是计算机算法。

1、MATLAB 是教学语言。 2、介绍医学图像分析领域中使用的数学和统计技术，重点是计算机实现。我们将研究基于使用各种模型的算法和策略来解决以下医学成像问题：表示、可视化、特征提取、去噪、图像配准、形态测量（可变形）、量化和验证。 3、包含以下细节内容：数字图像数据、随机场、希尔伯特空间、傅里叶分析、小波、线性和非线性滤波器、时间序列、多元技术、模式识别、形状建模、可变形模板、曲线和曲面几何、有限元方法 (FEM)、相似性度量、图像模拟、图像配准（2D 表面和 3D 体积）、统计参数映射 (SPM)、多重比较校正、计算统计、验证技术。 4、一些小节主题摘抄分割是根据某些标准将数字图像划分为多个区域。 fMRI 示例：杏仁核中的功能性 MRI 显示实验皮尔逊积矩相关系数复杂图像重建回顾图像复杂性可以表征图像和潜在的临床状况（癌症的存在、阿尔茨海默病）。医学影像分析流程：（1）图像采集 MRI、fMRI、PET、CT、EEG、MEG 等。（2）将图像导入计算机DIACOM、MINC、ANALYZE、BRIK。（3）基于图像强度的分割 / 可变形曲线和曲面（4）图像配准

2022-06-13

winform + access数据库 + EntityFramework ORM映射

压缩包内包含示例程序、引擎等等 1、winform桌面程序使用access数据库的化，如果用户的电脑里面没有安装最新的access软件（应该是2019版本以上）或者不安装access，就需要安装accessdatabaseengine引擎。 2、accessdatabaseengine引擎分为32位和64位。 3、如果要使用EntityFramework还需要JetEntityFrameworkProvider，这是第三方github提供的软件，在NuGet上也提供了，不过它仅支持32位的，如果想要使用64位的，可以下载源码重新编译dll。 4、上面说的accessdatabaseengine引擎和JetEntityFrameworkProvider要配套，要么都是32要么都是64位的。 5、winform软件启动的时候连接access数据库的时候，启动有点慢，经过抓包测试过，慢的原因是会访问微软的网站，不过网站已经访问不通了所以很慢，如果断网启动就会很快。另一个不一定靠谱的办法是打开office软件更改信任中心的隐私选项，给关闭掉，不让office访问联机服务和信息反馈。

2022-06-01

winform + sqlite数据库 + EntityFramework ORM框架

1、基于.Net Framework4.8的桌面窗口程序。 2、代码演示如何使用sqlite数据库。 3、基于EntityFramework的ORM框架。 4、可以使用SQLite Expert Personal软件查看sqlite数据库文件，数据库文件名为sqlite.db3，位于bin/debug文件夹下。 5、数据库连接描述connectionStrings，再App.config文件内配置。 6、主窗口内放置了一个listview，进入界面时会读取表内数据，展示在listview中，另外界面有两个按钮，一个添加，一个删除，调用我们的EntityFramework的层结构，进行存储或删除。 7、在入口文件方法内，使用GetItemCollection方法进行EF暖机操作，以避免第一次度数据库过慢，不过这个方法是否有效需要自行感受，数据库越复杂可能感受越明显。 8、需要NuGet引入EntityFramework、System.Data.SQLite.Core、System.Data.SQLite.EF6、System.Data.SQLite.Linq等相关的库。

2022-06-01

c++基础学习参考代码

1、标识符、关键字、常量、变量、数据类型、指针、运算符、字符串处理等全部基础点。 2、包含所有流程语句，简单语句、复合语句、ifelse、循环..... 3、函数、内联、重载、模板函数、作用域、命名空间等 4、类和对象、多继承、虚继承、嵌套类、局部类、类模板 5、窗口设置、通用对象、设计媒体播放器、图形设备接口、文件操作、GDI+、程序调试、打印相关、注册表操作、ADO数据库编程、多线程程序设计、动态链接库、套接字socket编程。 6、项目实战局域网监控系统、垃圾文件清理工具、视频聊天软件、人事考勤管理系统等。

2022-05-03

winform使用Graphics进行线段、圆、椭圆、铅笔、多边形等绘制功能完整代码

winform使用Graphics进行线段、圆、椭圆、铅笔、多边形等绘制。同时还有保存、恢复等功能，可以根据需求自定义扩展。、抽象基类如下所示， public abstract class DrawObject { #region Members //是否被选中 private bool selected; //绘制对象的颜色 private Color color; //绘制对象的线条宽度 private int penWidth; //绘制对象的id标识 int id; // Last used property values (may be kept in the Registry) private static Color lastUsedColor = Color.Black;

2022-05-03

winform+FileDialog扩展+自定义FileDialog窗口

内容概要：使用winform原生开发的自定义FileDialog窗口控件，再系统FileDialog的基础上进行扩展。基于UserControl。 public partial class FileDialogControlBase : UserControl { #region Delegates public delegate void PathChangedEventHandler(IWin32Window sender, string filePath); public delegate void FilterChangedEventHandler(IWin32Window sender, int index); #endregion }

2022-05-03

计算机视觉+对象类别检测+各种检测技术简述+PPT讲义

1、通过滑动窗口分类检测 2、多尺度（和纵横比）来检测不同大小的对象 3、困难负例挖掘的重要性（由于类不平衡） 4、通过仅选择窗口子集来加速训练和推理 5、使用 CNN 进行对象类别检测两阶段方法：Faster R CNN 一段式方法：SSD 评价数据集：COCO 6、涉及最先进的方法最近的改进模块：特征金字塔网络、焦点损失培训：复制粘贴数据增强架构：RetinaNet、CenterNet、FCOS、Mask R CNN、DETR、Swin 7、实例分割 8、使用移位窗口的分层视觉转换器 9、DETR：使用变压器进行端到端对象检测 10、复制粘贴和大规模抖动数据增强 11、对象检测、分割、实例分割等的新基准数据集： LVIS（Large Vocabulary Instance Segmentation）：1200个类别，164K 图像，220万个实例分割

2022-04-28

牛津大学2022年计算机视觉课程，深度学习对象类别检测【讲义】

主要涵盖以下内容，并介绍最先进的网络和架构 1、视觉场景理解，对象类别、身份、属性、活动、关系、位置…… 2、任务：分类、定位、分割 3、视觉问答、对象跟踪 4、滑动窗口检测器原理、训练滑动窗口检测器、加速推理 5、两阶段和一阶段网络 5、imagenet、AlexNet、VGG16、ResNet、Squeeze & Excitation 、Faster RCNN 6、“Anchors”：预定义的候选区域 7、RPN：区域提案网络、Anchor Box、Multiple Anchors、正负训练区域 8、大规模数据增强 9、DETR: End to end object detection using transformer

2022-03-30

布法罗大学 + SLAM + 讲义PPT

布法罗大学SLAM讲义PPT下载。 1、SLAM 是一种用于在未知环境或已知环境中构建地图同时跟踪当前位置的技术。 2、为了构建地图，我们必须知道我们的位置；为了确定我们的位置，我们需要一张地图！ 3、同步定位与地图构建 (SLAM) 是自动驾驶汽车所用的一种技术，您不仅可以用它构建地图，还可同时在该地图上定位您的车辆。 4、大致说来，实现 SLAM 需要两类技术。一类技术是传感器信号处理（包括前端处理），这类技术在很大程度上取决于所用的传感器。另一类技术是位姿图优化（包括后端处理），这类技术与传感器无关。 5、相关硬件：移动机器人、距离测量装置 6、SLAM 是 SfM（运动恢复结构：Structure from Motion）的一种实时版本。 7、目前，SLAM技术被广泛运用于机器人、无人机、无人驾驶、AR、VR等领域，依靠传感器可实现机器的自主定位、建图、路径规划等功能。 8、

2022-03-30

双击自定义后缀文件关联打开自己的WinForm应用程序

主要是实现了以下功能，适合初学Windows桌面应用开发的人员： 1、程序运行时请求管理员权限。 1、程序运行时写入注册表。（1）关联自定义后缀文件关联到自己的应用。（2）指定自定义后缀文件的logo。 2、双击自定义后缀文件开自己的应用，并传递文件路径参数到应用内。 3、拖拽自定义文件到主窗口，如果进行获取文件路径。

2021-03-27

windows版本nginx1.7 + rtmp模块

windows下搭建nginx-rtmp服务器，可用来测试obs推流，其它端进行拉流观看。使用方法双击nginx.exe即可。

2020-12-05

ssd_mobilenet_v1_coco_2017_11_17.zip

tensorflow训练的ssd_mobilenet_v1_coco_2017_11_17目标检测、图像分类模型。

2020-11-21

着色论文及算法（含matlab代码）

这里的算法基于一个简单的前提，即时空附近具有相似灰度级的像素也应该具有相似的颜色。适合用于视频和图像着色处理。

2021-08-04

C++语言编写坦克大战源代码下载(vs2019可运行)

C++语言编写坦克大战小游戏的源代码，控制台运行的，代码很简单，适合新手看着玩，可以用vs2019运行着玩耍。

2020-12-14

自定义采集的图像数据集，浣熊、鱼、猫，用于训练神经网络

自定义采集的图像数据集，浣熊、鱼、猫，用于尝试用自己的数据进行神经网络的训练，提供给大家，虽然质量一般，但是不需要自己一张张去弄了。

2020-12-02

风景视频，用于图像处理，模拟长曝光

用于图像处理，模拟长曝光，这里使用Python和OpenCV从输入视频中自动创建长时间曝光的图像。给定输入视频，将所有帧平均在一起（平均加权）以创建长时间曝光效果。

2020-10-26

paint.net-3.36(可运行版本).zip

1、Paint.NET是一个图像和照片处理软件，它由华盛顿州立大学的学生开发和维护并由微软公司提供项目指导，早期定位于MS Paint的免费替代软件，现在逐渐发展为一个功能强大且易用的的图像和照片处理软件，支持图层，无限制的历史记录，特效，和许多实用工具，并且开放源代码和完全免费，界面看起来有点像Photoshop，该软件的开发语言是C#。 2、最后开源的版本应该就是3.3.6，目前i已经不再开源。 3、支持VS2019运行

2020-12-29

Caffe面部检测模型

Caffe面部检测模型，包含res10_300x300_ssd_iter_140000.caffemodel，deploy.prototxt

2020-12-05

K近邻算法进行手写识别的数据集

K近邻算法进行手写识别的数据集，包含手写数字的训练集和测试集，为32*32的数据集合，在代码里转为1024的向量

2020-12-13

深度残差网络.zip

当Microsoft Research发布用于图像识别的深度残差学习时，深度残差网络席卷了深度学习领域。这些网络在ImageNet和COCO 2015竞赛的所有五个主要赛道中均获得了第一名的入围作品，这些竞赛涵盖了图像分类，对象检测和语义分割。此后，ResNets的鲁棒性已被各种视觉识别任务和涉及语音和语言的非视觉任务证明。压缩包内包含以下参考文档： 1、深度残差学习以进行图像识别— ResNet（Microsoft Research） 2、广泛的残留网络（巴黎埃斯特大学，巴黎高等技术学校） 3、聚集残余转换为深层神经网络- ResNeXt（Facebook的AI研究）

2020-12-26

TA关注的人

基于华为P9实现视觉SLAM的低成本方案

顶级资源，布法罗大学深度学习超详细讲义英文版 共20章，三大部分：应用数学和机器学习基础、深度网络：现代实践、深度学习研究

分别基于C#、C++的WinUI 3的demo体验项目

Android开发 8.0及以上调用相机/相册，并根据Uri获取图像绝对路径，并进行文件上传

百度地图切图工具ie内核、chromium内核.zip

基于winform/c#/opencv实现的windows下使用的自动鼠标点击小软件

医学影像分析+matlab+经典教学课件 介绍医学图像分析领域中使用的数学和统计技术，重点是计算机算法。

winform + access数据库 + EntityFramework ORM映射

winform + sqlite数据库 + EntityFramework ORM框架

c++基础学习参考代码

winform使用Graphics进行线段、圆、椭圆、铅笔、多边形等绘制功能完整代码

winform+FileDialog扩展+自定义FileDialog窗口

计算机视觉+对象类别检测+各种检测技术简述+PPT讲义

牛津大学2022年计算机视觉课程，深度学习对象类别检测【讲义】

布法罗大学 + SLAM + 讲义PPT

双击自定义后缀文件关联打开自己的WinForm应用程序

windows版本nginx1.7 + rtmp模块

ssd_mobilenet_v1_coco_2017_11_17.zip

着色论文及算法（含matlab代码）

C++语言编写坦克大战源代码下载(vs2019可运行)

自定义采集的图像数据集，浣熊、鱼、猫，用于训练神经网络

风景视频，用于图像处理，模拟长曝光

paint.net-3.36(可运行版本).zip

Caffe面部检测模型

K近邻算法进行手写识别的数据集

深度残差网络.zip

SocketServer.zip

使用R语言的人多么？

进行视频分析时，动态手势识别都有哪些技术路线？

顶级资源，布法罗大学深度学习超详细讲义英文版共20章，三大部分：应用数学和机器学习基础、深度网络：现代实践、深度学习研究

医学影像分析+matlab+经典教学课件介绍医学图像分析领域中使用的数学和统计技术，重点是计算机算法。