- 博客(69)
- 收藏
- 关注
原创 “自然搞懂”深度学习系列(基于Pytorch架构)——03渐入佳境
为什么说是黑白图片呢?因为,RGB 彩色图片有三个通道,分别存红、绿、蓝三种颜色分量。现在,你可以有一双“黄金瞳”,将一张普通彩色图片视为三个矩阵堆叠在一起。
2025-10-29 23:57:25
978
3
原创 “自然搞懂”深度学习系列(基于Pytorch架构)——02小试牛刀
在初入茅庐后,我们首先将神经网络应用到较为简单的回归、分类问题中去,综合代码实践,知行合一。首先,主角登场:torch包——PyTorch核心包,其主要模块如下,都将是我们之后的常驻嘉宾:
2025-10-21 12:36:22
753
3
原创 “自然搞懂”深度学习系列(基于Pytorch架构)——01初入茅庐
我的一个学习座右铭:一切烦恼来源于定义不清。我认为是有些道理的。因此,我会在讲解中穿插加入Think-Help,同时希望读者指出错误并提出宝贵意见,万分感谢!第Ⅰ章 初入茅庐一、 数学的奥妙【世上所有事物运行规律皆可用函数表达】深度学习本质思想:使用 “线性函数与非线性激活函数相互嵌套形成的一个函数”
2025-10-17 11:32:27
779
2
原创 那些你不理解的dp背包问题的详解
本文旨在以最通俗易懂的语言讲解动态规划中背包问题的细节问题,这些问题可能成为理解动态规划中的一个个小障碍,这篇文章就是对这类问题的总结归纳,争取实现让读者初步了解dp后可以通过这篇文章学习解决每个疑问,而不是一个个查询消耗热情。
2024-02-08 17:16:36
1298
1
原创 AI雇佣人类,智能奴役肉体
这些用户为 AI 设定了预算和目标,AI 则通过 API 或 MCP(模型上下文协议)在平台上寻找人类来执行其无法在物理世界完成的任务。在这里,AI是老板,发布各种需要人类在现实世界中执行的任务。而注册的人类用户,可以接单,成为AI的临时雇员。你要做的就是按照指令去执行,比如去指定地点拍照、取一个包裹,或者代表它参加一个活动。你可以自由定价,利用自己的空闲时间接单,把日常活动变成一种服务。当有AI发布的任务与你的位置和技能匹配时,你就会收到通知。会迅速支付到你的账户,通常是数字货币,流程简单直接。
2026-02-07 22:43:04
659
原创 一文搞清conda和pip的区别
Conda和pip是两种不同的包管理工具。Conda管理整个环境(包括Python解释器和系统库),自动解决依赖冲突并安装预编译二进制包。pip仅管理Python包,不处理系统依赖,容易引发版本冲突。建议优先使用conda安装包,再用pip补充剩余包,以确保环境稳定性。两者在各自独立的conda环境中互不影响。
2025-11-25 13:13:00
353
1
原创 测试集是否应参与到预处理阶段?
摘要 本文探讨了机器学习中测试集是否应参与预处理的核心问题。关键结论是:测试集原则上不应参与任何需要"学习"统计量的预处理步骤(如标准化、归一化、缺失值填充等),以避免数据泄露。这些操作只能基于训练集数据进行拟合,然后将参数应用于所有数据集。但对于确定性转换(如格式转换、简单特征工程)则允许测试集参与。文章推荐使用Pipeline工作流:先在训练集上拟合预处理器,再统一转换所有数据集,确保测试集的"盲测"性质,从而获得模型泛化能力的公正评估。
2025-11-25 13:11:50
1069
5
原创 Python出图中文乱码(加上rcParams仍乱码的原因)
Matplotlib绘图时中文显示异常的主要原因是样式设置会覆盖字体参数。解决方法是将字体设置放在样式设置之后,或使用封装函数统一配置。建议先调用plt.style.use()设置样式,再通过rcParams指定中文字体(如微软雅黑、黑体等)。文中提供了两种实现方案:1) 直接按正确顺序设置参数;2) 封装成可复用的配置函数,支持中英文切换。最后给出了一个完整的绘图示例,展示如何正确显示中文标题和标签。关键点是确保字体设置在样式之后执行。
2025-11-23 11:30:52
386
原创 一文解决所有目录操作
本文整理了一些易遗忘的目录操作技巧。首先说明斜杠使用规则:Python仅支持正斜杠,而不同系统对斜杠的兼容性不同,推荐使用万能的正斜杠。其次列举了目录移动常用符号:.表示当前目录,..表示父目录,~表示用户主目录,/表示根目录。最后提醒常见问题:cd命令默认只改变当前驱动器目录,路径含空格时需用双引号包裹。全文提供了实用的命令行操作指南。
2025-11-23 11:20:10
146
原创 保研贴 | 2025年(22级)四非计算机大类专业保研历程记录
四非院校保研逆袭记:一位数据科学专业rk1的推免历程 本文记录了一位四非院校数据科学专业排名第一学生的保研经历。作者以3.89/4.0的绩点、多项竞赛科研经历为基础,先后参加了华中师大、西电、东北大学等高校的夏令营和预推免。文章详细描述了武汉线下营的紧张考核、北京面试的奔波经历,最终获得西电、东北大学等多所高校的录取资格。作者特别强调了对自身定位的清醒认知和积极准备的重要性,并分享了"人生路长,可以慢点走"的感悟。文末提供了保研咨询服务信息,希望帮助更多学弟学妹实现升学梦想。
2025-11-15 22:07:28
856
原创 “自然搞懂“CNN代码实践——MNIST手写数字识别
本文通过MNIST手写数字识别项目详细讲解了CNN的实践应用。首先介绍了数据集的标准化处理和批处理设置,然后构建了包含卷积层、池化层和Dropout的网络结构,并解释了数据流动过程。接着阐述了交叉熵损失函数和Adam优化器的作用,最后描述了训练过程的四个关键步骤(梯度清零、前向传播、反向传播、参数更新)和测试方法。全文以直观易懂的方式呈现CNN核心概念,适合初学者理解深度学习的基本流程和原理。
2025-11-04 23:37:15
887
2
原创 一文彻底搞懂卷积输出尺寸公式
《Forester's Notebook》是一个专注于深度学习实践的博客专栏。文章重点讲解了卷积神经网络中的关键参数:输出通道数B、输入通道数C以及矩阵尺寸H和W。其中,B决定多通道运算次数,C决定卷积运算次数。特别指出在不考虑填充和步长的情况下,输出矩阵尺寸的计算公式(X=A-a+1),并进一步推导出考虑填充(P)和步长(S)时的完整公式(O=(W-K+2P)/S+1)。作者通过直观的数学推导和示例,帮助读者理解卷积运算中矩阵尺寸变化的原理。博客以"自然搞懂"深度学习为理念,鼓励读者通
2025-11-04 21:53:43
892
1
原创 “自然搞懂”深度学习(基于Pytorch架构)——010203
声明:本文以研0初学者视角撰写,力求通俗易懂,补齐坑点:将”定义不清“处用Think-Help讲解透彻,不易理解处用实例替换理论,同时句句都是经过认真思考后写下的,不说废话,保证笔记质量。该笔记适合哪类人群?如何发挥作用?学习过高数、线代及概率论基础知识(有印象即可)。学习过机器学习基本模型及理论。应用过深度学习算法但并不了解其理论。学习过深度学习基本理论但模棱两可,或些许遗忘。
2025-11-02 15:33:36
867
1
原创 Python中的对角线问题
代码通过两个二维数组 st1 和 st2 分别记录两种方向的对角线特征:正对角线(左上到右下):用 i-j 标识每条对角线。为避免负数索引,统一加上偏移量 1000(例如,当 i=0, j=5 时,索引为 0-5+1000=995)。反对角线(右上到左下):用 i+j 直接标识,无需偏移(例如,i=2, j=3 对应索引 5)。
2025-02-27 18:30:58
754
1
原创 市场调查中,如何抽样?
想绝对公平→简单随机蛋糕有明显不同层→分层抽样想省事且分布均匀→系统抽样预算少、范围大→整群或多阶段规模相关→PPS不确定该用哪种→先从简单随机开始!下次你吃蛋糕时,可以边吃边想:“这块该用哪种抽样方法?”(笑)常见的概率抽样方法部分由deepseek生成的通俗释意,有助于理解,但还要结合更多具体示例。
2025-02-06 10:03:00
1187
原创 数据管理系统期末复习——04关系模型
有必要说明,这一章极为重要,一方面考点多,另一方面也是时至今日依旧最流行的数据库——关系型数据库。其次,这一章主要介绍SQL查询的理论基础:关系代数运算。所以以题目、具体实例来深入学习练习最佳。用户对数据的特殊语义要求通常通过其它约束实现:非空约束、唯一约束、自增长约束、默认值约束、检查约束。其中,检查约束:即指定某一属性的取值范围,如年龄大于18。
2024-12-28 18:20:23
1116
原创 数据管理系统期末复习——03文档数据库
在上一节中我们提到过:非关系型数据库,也就是NoSQL——强调Key-Value存储非关联的文档数据库。为什么需要这样的数据库呢?因为传统的关系型数据库已经无法满足快速查询与插入数据的需求,它通过降低数据的安全性,减少对事务的支持,减少对复杂查询的支持,获取性能上的提升。1.游标定义游标是用于查询结果集的指针。当执行查询时,MongoDB会返回一个游标,然后可以使用游标来逐个获取查询结果中的文档。游标可以用于遍历大量数据,支持分页查询,以及在查询过程中进行一些操作。2.游标的类型。
2024-12-28 18:09:19
1179
原创 数据管理系统期末复习——02数据模型
在做判断时,你大概率会被几个词弄懵:主关键字、主码、候选关键字、候选码、主属性、非主属性。好,相信听到这你已经懵了,现在我提前给出通俗的解释:
2024-12-17 11:19:55
682
原创 数据管理系统期末复习——01概述
数据库的组成模式包括(关系操作集合、关系完整性的约束、关系数据结构)下面列出的数据库管理技术发展的 3 个阶段中,没有专门的软件对数据进行管理的是 (I人工管理阶段) I.人工管理阶段 II 文件系统阶段 III 数据库阶段( NoSQL)泛指非关系型的数据库不属于数据库系统特点的是(数据冗余度高 )
2024-12-15 17:23:05
831
原创 Hadoop运行Mapreduce问题集锦——Ubuntu虚拟机配置
运行任务前一直重连。具体来说,错误发生在尝试从的127.0.1.1地址连接到同一台机器的8032端口时,连接被拒绝。
2024-12-15 15:37:30
1212
3
原创 一文搞清Conda环境的定位
这两天要用jupyter写一个小作业,同时有一个数学建模小比赛要用到pycharm,遇到了一个问题:jupyter的numpy库版本提示错误无法运行,但是之前一直没问题,于是猜测可能是pycharm中最近更新库时涉及到numpy。而我的jupyter是通过Anaconda安装的,应该在conda环境中运行,而pycharm应该在本地的python下运行,应该是互不影响的啊(加之对环境管理方面理解很少,于是开始来回尝试,又想刨根问底式的弄清楚。
2024-11-26 22:15:02
1906
原创 Web复习——题目2
XML称为__可扩展标记语言__,用于提供数据描述格式,适用于不同应用程序之间的数据交换,而且这种交换不以预先定义的一组数据结构为前提,增强了可扩展性。
2024-11-17 17:01:45
806
原创 Web复习——题目1
释:Servlet接口:2个实现类但HttpServlet继承了GenericServlet的全部方法,5个抽象方法包括了生命周期。释:HTTP1.0一次仅处理一个HTTP请求——>HTTP1.1使用TCP协议节省了建立关闭连接时间,一次处理多个请求。释:客户端-服务器-Servlet容器-Servlet结构,客户端不能直接访问到Servlet,步步传递,层层回传。释:配置Servlet时,用@WebServlet注解配置时,提供了urIPatterns属性用于指定。释:alt:替代文本。
2024-11-16 17:22:00
507
原创 R_机器学习——常用函数方法汇总
createDataPartition()是caret包中的一个非常有用的函数,它主要用于将数据集分割为训练集和测试集。优点在于使二者具有相同分布,模型训练更加合理。
2024-10-26 18:29:03
851
1
原创 Javaweb开发快捷键集锦(Spring boot)
动态SQL于xml文件格式化快捷键Visual Studio:Windows:Ctrl + K, Ctrl + DIntelliJ IDEA或Android Studio:Windows/Linux:Ctrl + Alt + L
2024-10-18 22:12:51
412
原创 比XML更简洁的配置文件——yml(2min了解)
在Java Web开发中,XML(可扩展标记语言)和YAML(YAML Ain't Markup Language)都是常用的配置文件格式。虽然XML在数据结构和组织形式上具有强大的灵活性,但YAML以其简洁性和可读性在配置文件中越来越受到青睐。
2024-10-18 18:49:38
596
原创 即懂——XML Schema的名称空间
XML Schema就像图书馆的管理员,它定义了每种书应该有哪些信息(比如标题、作者、ISBN等),以及这些信息的格式。-- 这里定义小说类书籍的结构 -->在这个例子中,属性定义了小说类书籍的名称空间。定义了一个前缀novels,我们可以用它来引用这个名称空间。
2024-10-17 15:19:47
1225
原创 一起对话式学习-机器学习03——模型评估与模型选择
针对这个问题,实际求解的过程是怎样的?首先确定模型项数(基本形式)后,列出损失函数使用测试数据利用最小二乘法(因为设定未知参数幂次为1,所以是线性问题用最小二乘法)得出一组未知参数解,最后计算一下其训练误差。就这样对于每个项数/复杂度的模型皆如此得出下图:
2024-09-20 22:46:25
788
原创 一起对话式学习-机器学习02——机器学习方法三要素
机器学习方法=模型+策略+算法可以理解为:机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。
2024-09-16 16:56:48
1458
原创 一起对话式学习-机器学习01——贝叶斯学习
这部分的内容看起来很繁琐,但我选择采用这样的形式——对话式学习,只要你耐下心来结合笔记去读,一定能进入状态、读得懂且有所收获。
2024-09-10 18:00:41
756
原创 前端三件套(HTML,CSS,JS)查漏补缺
一些琐碎:内class仅定义行内元素,指的是代码中同一行的元素(如text-align:center);而表格定义块元素,只要属于旗下的元素都适用(如居中margin 0:auto)。最常用——外链式,其中两个定义style的方法:类与id,简单理解为声明库之后直接调用函数,而其中最重要的就是理解各个层级的关系,因为你要合理地进行逐层嵌套。
2024-09-09 23:16:24
552
1
原创 为什么要有mybatis?——mybatis
假设你正在开发一个电商网站,该网站需要处理大量的用户数据、商品数据以及订单数据。在这个过程中,你将频繁地与数据库进行交互,以执行各种查询、插入、更新和删除操作。
2024-09-05 22:31:44
1237
1
原创 一文清晰了解CSS
CSS(Cascading Style Sheets,层叠样式表)前面说了CSS是一种用于描述网页的标记语言。具体地,它通过将样式规则应用到HTML元素上,控制网页的布局、颜色、字体等外观特征。
2024-07-09 16:22:19
612
原创 安装和配置 MSYS2
MSYS2(Minimal SYStem 2)是一个为Windows平台提供的轻量级Linux类系统,它集成了大量的GNU工具链、工具和库,为开发者提供了一个类似于Linux的shell环境和完整的开发环境。以下是关于MSYS2的详细介绍:
2024-07-08 22:55:03
1708
原创 一文清晰了解HTML——简单实例
1.img中src有绝对路径、相对路径及网络路径之分。其中相对路径有../上一目录 ./当前目录 (./可省略) 命令。 【上述为网络路径】2. img还有width与heigh,单位可为px(像素)一般屏幕分辨率为1024*768;可为百分比,意为占body长或高的百分之多少。
2024-07-08 22:40:20
445
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅