- 博客(34)
- 收藏
- 关注
原创 U-net 系列算法知识解读
核心过程:U-net 的整体结构核心就是 “编码 - 解码”。你可以把这个过程想象成先 “拆” 后 “装”。编码阶段就像把一张完整的图片拆开,一步步提取图片里的关键特征,比如图片里物体的边缘、纹理这些;解码阶段就是把提取到的这些特征再重新组合起来,还原出和原图对应的分割结果,比如在医学影像里,标出哪里是肿瘤、哪里是正常组织。特点:结构简单但特别实用,应用范围很广。应用起源与现状:最开始是为了解决医学影像分割问题而生的,直到现在,在医学领域的应用依然很广泛,比如给 CT 影像、病理切片做分割。
2025-10-31 16:34:58
707
原创 YOLOv5模型的故事:智能城市守护者的诞生
精心设计的组织架构(网络结构)系统化的培训流程(训练策略)持续的优化改进(超参数调优)最终成为智慧之城中不可或缺的安全保障力量,24小时不间断地守护着城市的安全与秩序。
2025-10-27 16:18:46
490
原创 YOLOv3 目标检测算法核心技术
全卷积 + 残差连接:保证特征提取深度与效率;3 尺度特征融合:解决小目标检测痛点;9 种先验框:提升目标定位精度;Logistic 激活:支持多标签检测;速度 - 精度平衡:适配多场景需求。
2025-10-17 16:56:49
1691
1
原创 基于卷积神经网络的 CIFAR-10 图像分类实验报告
本实验基于 PyTorch 深度学习框架,设计并实现了一款轻量级卷积神经网络(CNN),用于解决 CIFAR-10 数据集的 10 分类任务。实验通过数据标准化预处理、多轮迭代训练、GPU 加速计算等手段,完成了模型的构建、训练与测试。结果表明,经过 10 轮训练后,模型损失值从初始的 1.8 左右降至 0.8 以下,在测试集上对随机抽取的 4 个样本实现了 75% 以上的分类准确率,验证了轻量级 CNN 在小尺寸图像分类任务中的有效性。
2025-09-26 17:34:27
1172
原创 【无标题】
3. 继承nn.Module + 模型容器:平衡灵活与简洁,在nn.Module类中用nn.Sequential/nn.ModuleList/nn.ModuleDict打包部分层(如Model_lay类用self.layer1 = nn.Sequential(...)),既减少forward中的重复代码,又保留自定义逻辑的能力,适合中等复杂度模型。• 模型类的forward方法(层的执行顺序),对应“训练阶段”的正向传播(从输入到预测值的计算流程)。
2025-09-22 16:58:36
527
原创 卷积神经网络(CNN)演进与核心原理解读
当处理3600万像素的RGB图像时,即使只使用100个神经元的单隐藏层,参数量也会达到惊人的36亿个,这远超过地球上猫狗的实际数量。这种参数爆炸现象揭示了全连接网络处理图像数据的低效性——它通过展平操作完全破坏了图像的空间结构信息,而图像的空间局部性和平移不变性正是视觉识别的关键特性。CNN的发展不仅推动了计算机视觉领域的进步,更引领了深度学习的复兴,其核心思想(参数共享、局部连接、分层抽象)已渗透到语音识别、自然语言处理等领域。这种分层抽象能力模拟了人类视觉系统的处理方式,是CNN强大表征能力的核心。
2025-09-19 16:47:21
1032
原创 多层感知机技术报告
摘要:本文系统介绍了感知机与多层感知机的基础原理及应用。感知机作为神经网络基础模型,通过权重和偏差实现二分类,但存在线性不可分问题(如异或门)。多层感知机通过引入隐藏层和激活函数(如ReLU、tanh)解决这一局限,能处理复杂非线性问题。文章详细阐述了模型学习过程(前向/反向传播)、评估方法(交叉验证)及过拟合/欠拟合的解决方案(权重衰减、暂退法)。最后强调需平衡模型复杂度与数据复杂度,选择合适的超参数以构建性能优良的网络模型。
2025-09-18 15:00:17
967
原创 线性回归与 Softmax 回归技术报告
本报告详细介绍了线性回归和 Softmax 回归两种基础的深度学习模型。线性回归主要用于解决回归任务,通过建立输入特征与连续输出值之间的线性关系,利用梯度下降类优化算法最小化损失函数(如平方损失、L1 损失、Huber 损失)来确定模型参数。它可以看作是最简单的神经网络,为更复杂神经网络的学习奠定了基础。
2025-09-17 16:21:46
776
原创 SVM 分析 Auto-MPG 数据集代码全解析
三、SVM 分类:优化目标可视化函数 visualize_svm_margin_classification(df)该函数通过 “高 / 低油耗” 二分类任务,直观展示 SVM 分类的核心目标 ——最大化间隔,并标记支持向量,帮助理解 SVM 如何通过支持向量确定决策边界。例如,若 w = [-1.2, -0.8],则 ||w|| = sqrt((-1.2)^2 + (-0.8)^2) ≈ 1.442,间隔宽度 ≈ 2 / 1.442 ≈ 1.387,间隔越大,模型泛化能力越强。
2025-08-26 18:36:08
808
原创 波士顿房价线性回归预测讲解
这些指标从不同角度衡量模型的预测效果,其中 R² 值越接近 1 表示模型拟合效果越好。:展示预测误差的分布情况,理想情况下残差应随机分布在 0 值附近,无明显规律。:直观展示预测值与实际值的吻合程度,理想情况下点应分布在红色参考线附近。这些可视化图表帮助我们更直观地理解模型性能和特征影响。:展示各特征对房价的影响方向和大小。:按系数绝对值展示各特征的影响程度。
2025-08-22 18:52:38
364
原创 K 均值聚类(K-Means)演示,通过生成笑脸和爱心两种形状的模拟数据,展示了无监督学习中聚类算法的效果。以下是详细讲解:
生成两种空间上分离的形状(笑脸和爱心)数据,然后用 K 均值聚类算法自动将它们分为两类,验证聚类算法对 “空间分离明显的数据” 的分类能力。时,K 均值聚类能非常准确地将其划分为不同类别,聚类中心也会落在每个类别的 “密集区域中心”。用不同颜色展示聚类结果(0 和 1 类),黑色 “X” 标记聚类中心。用蓝色标记笑脸点,红色标记爱心点,清晰展示两种形状的空间分布。:用三角函数生成圆形轮廓,上移 0.5 单位,添加噪声。:生成更小的爱心内部点,使形状更丰满。:用三角函数生成下半圆,再添加噪声。
2025-08-21 19:05:43
472
1
原创 基于随机森林的红酒分类与特征重要性分析
本次实验所使用的红酒数据集来自 scikit-learn 库,包含了 178 个样本,每个样本对应一款红酒,并标注了其所属类别(共 3 类)。数据集中的特征均为红酒的理化指标,具体包括酒精含量、苹果酸含量、灰分、灰分的碱度、镁含量、总酚、类黄酮、非黄烷类酚类、原花青素、颜色强度、色调、稀释葡萄酒的 OD280/OD315 值以及脯氨酸含量等 13 项指标。这些客观的理化数据为我们构建分类模型提供了坚实的基础。
2025-08-21 19:03:07
1013
原创 详解 scikit-learn 数据预处理工具:从理论到实践
在机器学习工作流程中,数据预处理是连接原始数据与模型训练的关键桥梁。高质量的预处理能够显著提升模型性能,而 scikit-learn 库提供了一套全面且高效的预处理工具集,帮助开发者轻松应对各种数据转换需求。本文将系统介绍 scikit-learn 中 17 种常用预处理工具的原理与实践应用,通过实例代码展示其具体用法。
2025-08-20 18:30:48
899
原创 基于决策树模型的汽车价格预测分析
这份代码实现了一个完整的机器学习预测流程,核心目标是通过汽车的各项特征预测其价格。这一步的目标是创建一个贴近真实的汽车数据集,包含影响价格的关键特征和目标变量(价格)。预处理是将原始数据转换为模型可输入的格式,包括缺失值处理、分类变量编码等。),因为它能很好地捕捉特征与价格之间的非线性关系,且结果易于解释。通过可视化理解数据分布和特征关系,为建模提供依据。使用决策树回归器构建预测模型,并评估其性能。R²提升至≈0.88。
2025-08-19 17:47:04
903
原创 熵(Entropy)和信息增益(Information Gain)的计算
公式:\(H(X) = -\sum_{i=1}^{n} p_i \log_2(p_i)\) 其中:\(p_i\) 是第 i 类样本在总样本中的占比(\(0 \leq p_i \leq 1\))。:衡量某特征对降低不确定性的贡献,值越大,该特征越适合作为当前节点的划分依据。公式:\(IG = 初始熵 - 按该特征划分后的加权熵\)二、用课堂练习数据集实战计算。: 和 A=“是” 的计算相同(样本分布一致),\(H3 \approx 0.918\): 和 A=“否” 的计算相同,\(H4 = 0\)
2025-08-18 15:12:50
676
原创 机器学习基础讲解
针对特定任务,以大量经验数据为基础。存在衡量任务完成好坏的评判标准。通过分析经验数据,不断优化任务的完成效果。一个广为人知的案例是 2016 年 3 月在韩国首尔,阿尔法围棋(AlphaGo)以总比分 4:1 战胜韩国围棋九段棋手李世石,这正是机器学习在复杂决策领域的精彩应用。从流程上看,机器学习通过对历史数据(经验)进行训练,归纳出规律并构建模型,当输入新的未知数据(属性)时,模型就能做出预测,从而解决新的问题。
2025-08-14 16:06:30
1050
原创 销售数据预处理与分析学习总结
通过本次实践,掌握了从数据清洗到可视化分析的完整流程,理解了如何通过 Python 工具(基于标题关键词构建分类规则(大类:护肤品 / 化妆品;小类:乳液类 / 面膜类等),通过。)将原始数据转化为有价值的商业洞察。
2025-08-13 17:00:43
690
原创 双十一淘宝美妆数据深度分析:从数据中挖掘消费趋势与品牌策略
高端化(300 元以上品牌贡献高销售额)、护肤主导(护肤品占比超 60%)、男士市场崛起(增速领先)。
2025-08-12 16:55:30
1220
原创 车型销售数据爬虫代码详细解释
该函数的作用是建立与目标网站的连接并获取网页内容:。该函数负责将提取的数据保存为 CSV 文件:。主程序定义了整个爬虫的执行流程:。解析函数是数据提取的核心:。
2025-08-11 18:03:30
1252
原创 Pandas:数据科学与计算的利器
Pandas 以其简洁的语法和强大的功能,将数据处理的复杂度大幅降低,让分析师能更专注于业务逻辑而非技术实现。从数据读取、清洗到分析、运算,Pandas 构建了完整的数据分析流水线,是数据科学领域不可或缺的工具。无论是初学者还是资深工程师,掌握 Pandas 都将为数据探索之旅添上关键一笔。编辑分享写一篇介绍Pandas核心数据结构DataFrame的文章分享一些利用Pandas进行数据分析的实际案例详细介绍Pandas中的数据清洗方法。
2025-08-06 18:17:05
751
原创 NumPy 数组操作与字符串函数全解析
NumPy 作为 Python 科学计算的核心库,提供了丰富的数组操作功能和字符串处理工具,极大地简化了数据处理与分析的流程。本文将系统介绍 NumPy 中数组的堆叠、分割、形状调整、元素插入删除,以及字符串处理和数学运算等核心功能,帮助读者快速掌握 NumPy 的实用技巧。
2025-08-04 16:26:21
895
原创 NumPy 数组操作全解析:从广播到堆叠的实用指南
NumPy 提供了丰富的数组操作功能,从广播机制到迭代方法,从形状修改到数组连接,每一种操作都有其特定的应用场景。掌握这些操作技巧,不仅可以提高代码的简洁性和可读性,还能充分发挥 NumPy 的高性能优势。广播机制虽然便捷,但要注意数组形状的兼容性;迭代数组时,注意内存顺序对遍历结果的影响;形状修改函数中,区分返回副本和视图的函数,避免不必要的内存开销;数组连接时,确保输入数组的形状符合堆叠要求。
2025-08-01 18:14:53
1328
原创 NUMPY语言入门
NumPy 是个能方便处理数组和矩阵的工具,用它可以少写很多循环,还有很多数学函数能省事儿。安装可以用 pip 或 conda,导入时通常写成。:有个叫 Ndarray 的 N 维数组,里面装的都是同类型数据,从 0 开始索引。(元素类型)等,能帮我们了解数组的基本情况。
2025-07-31 19:08:03
361
原创 7.28MySQL代码细节
就是对一堆数据做 “汇总计算”,比如算总和(比如所有商品的总销量)、最大值(比如最高的售价)、最小值、平均值,还有计数(比如有多少种商品)。这些函数会忽略空值,而且可以和 “分组” 一起用,比如按 “店铺” 分组,算每个店铺的平均销量。就是 “查询里套查询”。总的来说,这份文档就是教你怎么用 MySQL 对数据进行增删改查,怎么按条件筛选、汇总数据,以及怎么处理多个表之间的数据关联,都是很基础但常用的操作。当需要同时用多个表的数据时(比如 “销售表” 和 “店铺表”),教你怎么把它们 “连起来” 查。
2025-07-28 17:10:00
441
原创 MySQL 数据库基础:从概念到实践的全面解析
CREATE:创建数据库或表,如创建名为 YCY 的数据库,创建学生表。ALTER:修改表结构,如添加年龄字段。DROP:删除数据库或表,如删除学生表(操作不可逆,需谨慎)。MySQL 作为数据管理的利器,其学习需兼顾理论与实践。初学者应从基础语法入手,通过创建数据库、设计表结构、编写查询语句逐步积累经验;进阶阶段可深入存储过程、触发器、索引优化等高级特性。掌握 MySQL 不仅是技术能力的体现,更是理解数据驱动时代核心逻辑的关键一步。
2025-07-24 16:15:26
736
原创 7.23之爬虫开发中的 Requests 高级用法与 XPath 解析技术
人话来说就是通过Xpath代码爬取网页里面我们想要的信息,比如小编这里就是爬取了星座运势,星座日期,星座运势;大家可以用来提取网页数据,比如球队信息,高考录取全部信息等等,这里不介绍,下面上干货在 Web 开发中,会话(Session)是维护用户状态的关键机制。服务器通过会话对象存储用户数据,以便在用户后续操作中提供个性化服务。Requests 库的 session 对象完美模拟了这一过程,能自动处理 Cookies,轻松实现会话保持。
2025-07-23 18:29:03
1986
原创 7.22网络爬虫实战,网络爬虫数据存储与 Robots 协议学习指南
使用上下文管理器安全地打开和关闭文件,这是处理文件的最佳实践,能自动管理资源释放。:通过创建读取器对象,能够正确解析 CSV 格式的文件内容,处理逗号分隔的数据以及可能包含的引号、换行等特殊情况。:通过循环迭代读取 CSV 文件中的每一行数据,将每行数据转换为列表形式进行处理(如打印输出)。代码基础,表格,指在特点环境,编写一个表格,并以自己想要的方法记录爬虫所得信息注意事项。
2025-07-22 18:15:30
1026
原创 7.21,日常学习分享之visual之个人网页制作
最后:这里我们设置通用播放器的功能,这里可以直接照抄,但是说明播放的视频路径要与代码放同一路径,并且视频地址要放在代码里面,所以上面代码我们做的是一个视频,包括他的位置,颜色,视频播放器宽度等等下面说明。其次:这里说的是一个网页挂载视频的网页设计。最后上个视频展示一下。
2025-07-21 17:29:18
455
原创 今日学习7.18星期五
同时,通过浏览器开发者工具分析登录请求的URL、参数(如Form Data中的用户名、密码)和请求头(如User-Agent、Referer),是实现模拟登录的关键步骤。未来我会继续练习不同网站的模拟登录场景,提升应对复杂反爬机制的能力,在合法合规的前提下,更好地利用爬虫技术获取有价值的信息。四、实践中的感悟 通过模仿课程中的“豆瓣登录”案例,我尝试编写代码实现登录并爬取个人主页,过程中犯过不少错误:比如忘记设置请求头导致被识别为爬虫,或是未正确解析登录响应导致误判登录状态。
2025-07-18 17:45:39
360
原创 运用代码,爬取网页获取个人主页
本次代码巧妙运用网站cooking,通过保留网站日志,获取网站URL,然后输入网站需要登陆的用户名还有密码。(3)网站有验证,非密码输入的网站不可爬取,有验证码等不可爬取。(2)网站不可连续爬取,若失败可以换网络继续爬取。(1)网站有强密码的不可爬取。
2025-07-18 15:57:38
215
原创 手机号码归属地查询,第一篇延申扩展
实现类型就是知道对应网站后,要自己进行对应操作,这样锻炼自己的写代码能力,还能加强对互联网网页知识的梳理,了解,后续还会接着更新,有很多地方会有对应的反爬机制,#第一篇我们谈到,通过python语言,打开对应百度网页,现在我们继续进行网站第二篇进阶学习,这里我用到的是手机归属地查询网站。加入进去,然后通过代码设置对应手机号##########,然后代码运行。其中需首先要自己查看对应的网站,比如对应的网站。
2025-07-17 14:43:43
213
原创 简单学习爬虫,并通过以下代码爬取网站想要的图片
通过本代码可批量下载任意图片到指定路径,文件路径就是C/D盘中自己想要的位置,表情,图片壁纸等都可以下载。任意图像鼠标右键看到下面这个·QR 代码,复制其对应链接,放到代码替换我的链接。其次需要对应图片格式一般就是网站前缀加对应图片源代码的尾缀,动图就是gif,静图就是jpg。对于小白想要爬取对应图片这里有一个简单方法。
2025-07-17 14:09:18
224
原创 python语言爬取静态网页
该代码以百度为例,在pycharm中运行,复制运行结果,掐头去尾,在记事本打开,修改尾缀txt为html打开该网页,即打开百度首页百度一下。1:requests用于发送http请求获取网页内容。2:get-html-text定义函数。3:print获取源码信息。
2025-07-16 13:48:06
468
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅