速查手册
文章平均质量分 70
简单的小文章,用于备忘、快速查阅
UvwxyZ666
这个作者很懒,什么都没留下…
展开
-
笔记:PyTorch文档阅读(3)torchvision.models
以下是pytorch中文文档原文,根据自己的需要,可以选择合适的模型直接下载预训练好的模型,再调整最后一节全连接层输出。这样可以快速收敛,并且不用自己搭建网络。原创 2024-08-09 08:23:17 · 1032 阅读 · 0 评论 -
笔记小结:《利用Python进行数据分析》之处理缺失数据
在pandas中,我们采用了R语言中的惯用法,即将缺失值表示为NA,它表示不可用not available。在统计应用中,NA数据可能是不存在的数据或者虽然存在,但是没有观察到(例如,数据采集中发生了问题)。当进行数据清洗以进行分析时,最好直接对缺失数据进行分析,以判断数据采集的问题或缺失数据可能导致的偏差。你可能不想滤除缺失数据(有可能会丢弃跟它有关的其他数据),而是希望通过其他方式填补那些“空洞”。缺失数据在pandas中呈现的方式有些不完美,但对于大多数用户可以保证功能正常。原创 2024-08-06 08:46:16 · 906 阅读 · 0 评论 -
笔记小结:《利用Python进行数据分析》之汇总与统计
它们大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。利用DataFrame的corrwith方法,你可以计算其列或行跟另一个Series或DataFrame之间的相关系数。返回的唯一值是未排序的,如果需要的话,可以对结果再次进行排序(uniques.sort())。Series的corr方法用于计算两个Series中重叠的、非NA的、按索引对齐的值的相关系数。这里,结果中的行标签是所有列的唯一值。原创 2024-08-01 08:03:06 · 1105 阅读 · 0 评论 -
学习笔记:《利用Python进行数据分析》之pandas入门
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。原创 2024-07-29 08:39:01 · 1001 阅读 · 0 评论 -
学习笔记:《用Python进行数据分析》之Numpy基础
我们说这些都是伪随机数,是因为它们都是通过算法基于随机数生成器种子,在确定性的条件下生成的。numpy.random模块对Python内置的random进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数。跟列表最重要的区别在于,数组切片是原始数组的视图。由于NumPy的设计目的是处理大数据,所以你可以想象一下,假如NumPy坚持要将数据复制来复制去的话会产生何等的性能和内存问题。注意:如果你想要得到的是ndarray切片的一份副本而非视图,就需要明确地进行复制操作,例如。原创 2024-07-28 08:03:30 · 405 阅读 · 0 评论 -
学习笔记:《用Python进行数据分析》之通用函数
通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数。你可以将其看做简单函数(接受一个或多个标量值,并产生一个或多个标量值)的矢量化包装器。虽然并不常见,但有些ufunc的确可以返回多个数组。这些都是一元(unary)ufunc。原创 2024-07-27 07:51:01 · 329 阅读 · 0 评论 -
学习笔记:《用Python进行数据分析》之函数
能以一种一致的方式对序列进行迭代(比如列表中的对象或文件中的行)是Python的一个重要特点。这是通过一种叫做迭代器协议(iterator protocol,它是一种使对象可迭代的通用方式)的方式实现的,一个原生的使对象可迭代的方法。一般的函数执行之后只会返回单个值,而生成器则是以延迟的方式返回一个值序列,即每返回一个值之后暂停,直到下一个值被请求时再继续。为了得到一组能用于分析工作的格式统一的字符串,需要做很多事情:去除空白符、删除各种标点符号、正确的大写格式等。原创 2024-07-26 08:07:28 · 531 阅读 · 0 评论 -
学习笔记:《用Python进行数据分析》之数据结构、函数
本文讨论Python的内置功能,虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的。我们会从Python最基础的数据结构开始:元组、列表、字典和集合。然后会讨论创建你自己的、可重复使用的Python函数。最后,会学习Python的文件对象,以及如何与本地硬盘交互。原创 2024-07-25 08:00:11 · 476 阅读 · 0 评论 -
学习笔记:《用Python进行数据分析》之Python基础
当在Python中创建变量(或名字),你就在等号右边创建了一个对这个变量的引用。考虑一个整数列表,假设将a赋值给一个新变量b,在有些方法中,这个赋值会将数据[1, 2, 3]也复制。在Python中,a和b实际上是同一个对象,即原有列表[1, 2, 3]。Python中的大多数对象,比如列表、字典、NumPy数组,和用户定义的类型(类),都是可变的,意味着这些对象或包含的值可以被修改。这段脚本运行在空的命名空间(没有import和其它定义的变量),因此结果和普通的运行方式。在变量前后使用问号?原创 2024-07-24 09:56:01 · 961 阅读 · 0 评论 -
笔记小结:卷积神经网络之池化层
在这两种情况下,与互相关运算符一样,汇聚窗口从输入张量的左上角开始,从左往右、从上往下的在输入张量内滑动。在汇聚窗口到达的每个位置,它计算该窗口中输入子张量的最大值或平均值。与卷积层一样,汇聚层也可以改变输出形状。下面,我们用深度学习框架中内置的二维最大汇聚层,来演示汇聚层中填充和步幅的使用。这意味着汇聚层的输出通道数与输入通道数相同。与卷积层类似,汇聚层运算符由一个固定形状的窗口组成,该窗口根据其步幅大小在输入的所有区域上滑动,为固定形状窗口(有时称为。的汇聚窗口,那么默认情况下,我们得到的步幅形状为。原创 2024-07-18 08:14:38 · 1100 阅读 · 0 评论 -
笔记小结:卷积神经网络之多输入多输出通道
彩色图像具有标准的RGB通道来代表红、绿和蓝,需要三个通道表示,故而只有单输入单输出是不够的。对于单个输入和单个输出通道的简化例子,可以将输入、卷积核和输出看作二维张量。当我们添加通道时,我们的输入和隐藏的表示都变成了三维张量。例如,每个RGB输入图像具有3×ℎ×𝑤的形状。我们将这个大小为3的轴称为通道。我们可以构造与上图中的值相对应的输入张量X和核张量K,以验证互相关运算的输出。原创 2024-07-17 08:28:44 · 684 阅读 · 0 评论 -
笔记小结:卷积神经网络之步幅与填充
假设以下情景: 有时,在应用了连续的卷积之后,我们最终得到的输出远小于输入大小。这是由于卷积核的宽度和高度通常大于1所导致的。比如,一个240×240像素的图像,经过10层5×5的卷积后,将减少到200×200像素。如此一来,原始图像的边界丢失了许多有用信息。而填充是解决此问题最有效的方法;有时,我们可能希望大幅降低图像的宽度和高度。例如,如果我们发现原始的输入分辨率十分冗余。步幅则可以在这类情况下提供帮助。原创 2024-07-16 08:29:07 · 724 阅读 · 0 评论 -
笔记小结:卷积神经网络之卷积核的实现
在上我们,我们给出了卷积核,一个很容易想到的问题是给定XY能否学习出卷积核,答案是肯定的。在10次迭代之后,误差已经降到足够低。现在我们来看看我们[可以发现,1表示由1到0的边缘,0表示有0到1 的边缘。中间四列为黑色(0),其余像素为白色(1)。可以看到,与之间我们设置的结果很接近。实在是行云流水般丝滑)原创 2024-07-15 08:09:53 · 544 阅读 · 0 评论 -
笔记小结:神经网络中的层与块
用模型参数声明层。这里,我们声明两个全连接的层# 调用MLP的父类Module的构造函数来执行必要的初始化。# 这样,在类实例化时也可以指定其他函数参数,例如模型参数params(稍后将介绍)self.hidden = nn.Linear(20, 256) # 隐藏层self.out = nn.Linear(256, 10) # 输出层# 定义模型的前向传播,即如何根据输入X返回所需的模型输出# 注意,这里我们使用ReLU的函数版本,其在nn.functional模块中定义。原创 2024-07-14 08:11:46 · 639 阅读 · 0 评论 -
笔记小结:常见的激活函数一览
最受欢迎的激活函数是修正线性单元ReLU), 因为它实现简单,同时在各种预测任务中表现良好。给定元素𝑥,ReLU函数被定义为该元素与0的最大值:通俗地说,ReLU函数通过将相应的活性值设为0,仅保留正元素并丢弃所有负元素。为了直观感受一下,我们可以画出函数的曲线图。正如从图中所看到,激活函数是分段线性的。下面我们绘制ReLU函数的导数。原创 2024-07-13 08:23:06 · 352 阅读 · 0 评论 -
笔记小结:Softmax回归之模块导入与数据加载
Fashion-MNIST是一个常用的图像数据集,用于替代传统MNIST手写数字数据集,它包含了10个类别的70,000个灰度图像,每个类别有7,000个图像。这些类别包括T恤、裤子、鞋子等时尚物品。这个数据集通常用于训练和测试图像识别模型。函数batch_size:定义了每次迭代中要加载的样本数量。resize:可选参数,如果提供,将图片大小调整到指定的像素尺寸。定义了一个转换列表trans,其中包含,它将图片转换为PyTorch张量。如果提供了resize参数,则将。原创 2024-07-11 08:23:59 · 950 阅读 · 0 评论 -
笔记小结:Softmax回归预备知识
实现softmax由三个步骤组成:对每个项求幂(使用exp对每一行求和(小批量中每个样本是一行),得到每个样本的规范化常数;将每一行除以其规范化常数,确保结果的和为1。正如上述代码,对于任何随机输入,我们将每个元素变成一个非负数。此外,依据概率原理,每行总和为1。原创 2024-07-10 08:16:25 · 401 阅读 · 0 评论 -
笔记小结:Python自动微分
重要的是,我们不会在每次对一个参数求导时都分配新的内存。因为我们经常会成千上万次地更新相同的参数,每次都分配新的内存可能很快就会将内存耗尽。注意,一个标量函数关于向量𝑥的梯度是向量,并且与𝑥具有相同的形状。y.backward()是通过调用反向传播函数来自动计算y关于x的每个分量的梯度,这些梯度(也就是导数值)是存在x.grad中的。关于x的导数为4x,故而y关于x的梯度为tensor([ 0., 4., 8., 12.])是一个长度为4的向量,计算。的点积,得到了我们赋值给。原创 2024-07-08 11:01:55 · 329 阅读 · 0 评论 -
笔记小结:Python线性代数实现数学基础
【代码】笔记小结:Python线性代数实现数学基础。原创 2024-07-07 16:32:42 · 330 阅读 · 0 评论