自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python领域优质萌新创作者

技术小白的自我修养

  • 博客(309)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 联邦学习算法介绍-FedAvg详细案例-Python代码获取

在DP-FedSGD中,被选中的参与方使用全局模型参数对局部模型进行初始化,通过批梯度下降法进行多轮梯度下降,计算梯度更新量。而在DP-FedAVG中,是利用一个批次的数据进行一次梯度下降,计算梯度更新量。由服务端收集各客户端的梯度信息,通过聚合计算后再分发给各客户端,从而实现多个客户端联合训练模型,且“原始数据不出岛”,从而保护了客户端数据隐私。假设中心方是好奇的,那么客户端通过某种规则向其他客户端广播梯度信息,收到梯度信息的客户端聚合参数并训练,将新的梯度信息广播。面向神经网络模型, 假设网络总共有。

2023-03-12 10:36:34 19099 123

原创 知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

你好!这是一款实体关系联合标注的本地小程序,以Python3Python3Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用PythonPythonPython编程实现可视化界面和主要功能,利用HTMLHTMLHTML和CSSCSSCSS提示标注教程与规范(无需关心它们如何实现)。利用本系统进行文本标注将原始段落文本更新为带有事先定义的命名实体、关系或属性的文本标签数据。

2022-10-31 15:44:50 6965 85

原创 tqdm 进度可视化

【代码】tqdm 进度可视化。

2024-06-18 18:40:51 173

原创 visdom由于目标计算机积极拒绝无法连接

ConnectionRefusedError: [WinError 10061] 由于目标计算机积极拒绝,无法连接。解决方法:先进入虚拟环境,再启动visdom。在cmd中,查看虚拟环境。

2024-06-16 23:09:57 249

原创 算法-对列表元素划分成两个和值最大且相等的子列表

现有私募基金发行一支特殊基金产品,该基金认购人数上限不超过 30 人, 募集总金额不超过 3000W,每个投资人认购金额不定。该基金只能将募集到的钱用于投资两支股票,且要求两支股票投资金额必须相同,且每位投资人的钱只能用于投资一支股票或不投资。问如何在给定募集条件下,实现投资金额最大化。如果无法实现则返回0解题方法注意:[1, 2, 3, 10, 5, 5], 只要求子集和为总和一半,不管哪种划分方式,都是“最优解”

2024-06-02 17:01:04 877 2

原创 算法-找出N个数组的共同元素

3.1、使用集合的intersection_update方法,将当前编辑的新闻编号集合与common_news_set取交集,并更新common_news_set。1.1、使用集合的交集操作找出被所有编辑共同编辑过的新闻:遍历每个新闻集合进行交集操作,时间复杂度为O(K),其中K为所有编辑操作的总数。3.2、这样,common_news_set中将保留与当前编辑共同编辑过的新闻编号,即找到所有编辑共同编辑过的新闻编号的交集。news_ids: 一个包含N个列表的列表,每个列表包含一个编辑编辑过的新闻编号。

2024-06-02 16:48:54 906

原创 Python生成模拟数据、随机文本-Faker库

Faker是一个用于生成虚假数据的Python库,它提供了一种简单而强大的方式来生成各种类型的随机数据,包括姓名、地址、电子邮件、文本、日期、数字等。这对于进行测试、填充数据库或者生成模拟数据是非常有用的。

2024-02-03 21:21:18 701 1

原创 Lindeberg-Feller 定理

Lindeberg-Feller 定理是概率论中关于中心极限定理的一个重要结果,它提供了一种条件,使得独立同分布的随机变量的和的标准化形式在极限情况下收敛到标准正态分布。Lindeberg 条件的直观解释是,随着样本量的增加,随机变量的方差被"适当地"控制,使得随机变量的和标准化后趋于正态分布。总的来说,Lindeberg-Feller 定理是中心极限定理的一个重要推广,适用于更一般的随机变量序列,并提供了一种更强大的工具来理解随机变量和它们和的渐近分布。是独立同分布的随机变量,具有相同的均值。

2023-12-12 19:22:55 1390

原创 特征函数的共轭

简而言之,特征函数的负虚部与其共轭的关系。其中上方横线表示共轭。特征函数的共轭关系是。

2023-12-12 14:16:58 687

原创 上确界(supremum)

上确界(supremum)是实数集合中的一个概念,它表示集合的上界中的最小值。换句话说,如果存在一个数,它是集合中的上界并且不比任何其他上界小,那么这个数就是这个集合的上确界。那么,(s) 就是集合 (A) 的上确界。上确界不一定属于集合,但它是集合中所有上界中最小的一个。上确界在数学分析、实分析以及集合论等领域中经常用于描述和证明。

2023-12-11 21:17:38 2441

原创 R可积与L可积

总体而言,R可积和L可积都是用来描述随机变量的可积性的概念,其中R可积是在Riemann意义下的可积性,而L可积是在Lebesgue意义下的可积性。在很多情况下,它们是等价的,但对于一些特殊的情形,Lebesgue积分更灵活,能够处理一些Riemann积分难以处理的情况,例如处理非绝对收敛的积分。在概率论的基础中,R可积和L可积是两个与随机变量相关的概念。这些概念通常用于描述随机变量的可积性,即它们的期望是否存在或有限。

2023-12-11 21:15:59 1590

原创 AttributeError: cannot assign module before Module.__init__() call 解决方法

方法之外对模块中的某些成员进行了初始化或赋值操作,导致模块还没有被完全初始化就已经被调用了。为了解决这个问题,需要将所有的初始化或赋值操作移到。方法中进行所有的初始化和赋值操作,确保模块中的所有成员都在。方法内被正确初始化后再进行调用即可避免出现。,并且想要在其中定义一个类变量。例如,如果有一个自定义模块。这个错误通常是由于在。

2023-12-06 13:07:36 1567

原创 torch 打印网络参数、结构

它提供了一种方便的方式来打印网络结构的摘要信息,包括每个层的名称、形状和参数数量等。其中input_size指定了输入张量的形状。是定义的神经网络模型对象。这将输出整个网络的结构信息,包括每个层的名称、输入和输出尺寸以及参数量等。该代码遍历了模型中所有需要梯度更新的参数,并打印出参数名称和对应的数值。首先需要导入该类,然后实例化一个对象,并将其赋值给。以上代码遍历了所有子模块,并打印出每个子模块的名称和对应的结构信息。注意:如果模型包含多个子模块(例如,使用。要打印网络结构,可以使用。

2023-12-06 13:05:09 1061

原创 itertools.chain.from_iterable()的含义与用法

将多个可迭代对象中的元素平铺为一个迭代器,这个迭代器包含了所有可迭代对象中的元素。是一个Python列表(list),它最终将包含多个模型的预测值。中的一个函数,它用于将多个迭代器组合成一个迭代器。这样得到的列表包含了当前模型的预测值。是一个模型输出的预测值,是一个张量(tensor)。包含了原始列表中所有的元素,但没有嵌套的子列表。是一个模型输出的预测值、是一个张量,将嵌套列表扁平化为一个迭代器,最后使用。的含义是将当前模型的预测值列表(由。,它们都包含嵌套的子列表。将迭代器转换为扁平化后的列表。

2023-12-06 13:00:49 827

原创 pytorch中A网络的embedding层的权重参数已经初始化为F了,copy.deepcopy(A)的结果网络也跟着初始化为F吗?

的权重参数的值相同,即都是预训练的词向量,但它们是两个独立的张量对象,它们在内存中的地址不同,修改其中一个张量的值不会影响到另一个张量的值。也就是说,当我们通过反向传播计算梯度后,优化器会根据梯度信息来更新网络中所有的参数。方法进行深拷贝时,只有对象的属性值才会被拷贝,而对象的方法、类属性等则不会被拷贝。的权重参数是独立的,而不会共享相同的内存空间。方法对模型A进行深拷贝,那么得到的新模型的权重参数将与模型。在上面的代码中,我们首先定义了一个包含预训练词向量的模型。中的参数不参与反向更新,可以将它的。

2023-12-06 12:56:46 826 1

原创 torch 如何实现两点分布采样,100个样本中20个样本为1,80个为2

分布将数字1和数字2的概率分别设为0.2和0.8,然后调用。函数生成分别包含20个数字1和80个数字2的张量,然后使用。其中,数字1被表示为1.0,数字2被表示为2.0。模块实现两点分布采样。可以使用 PyTorch 中的。函数将它们拼接在一起,再使用。

2023-12-05 13:12:58 890 1

原创 torch 如何生成主对角阵?

具体来说,如果需要生成对角元素都为 0 的主对角阵,可以直接调用 torch.eye() 函数,并指定对角线上的元素为 0。如果需要生成对角元素都为 1 的主对角阵,则可以先生成对角线为 1 的主对角阵,然后将对角线上的元素全部乘以 0。除了使用 torch.eye() 函数生成主对角阵之外,还可以使用 torch.diag() 函数来生成主对角阵。torch.diag() 函数既可以将一个向量转化为对角矩阵,也可以将一个对角矩阵中的对角元素抽取出来形成一个向量。

2023-12-05 13:10:16 783

原创 torch 如何在迭代训练中,只计算参数梯度,不更新参数。并且将参数的梯度保存到列表,这个列表的值不随着梯度清零而跟着变为零

同时,通过将计算出的梯度值放入一个列表中来保存,这个列表的值不会随着梯度清零而清零。同时,通过将计算出的梯度值放入一个列表中来保存,这个列表的值不会随着梯度清零而清零。,所以这些参数不会被优化器更新。最后,我们清空梯度以便进行下一轮迭代,并通过。来清除计算图中的梯度信息,但不影响保存下来的梯度值。在上述代码中,我们首先定义了一个保存梯度的列表。由于我们在更新参数之前将所有参数的。计算梯度,并将计算出的梯度值放入。计算梯度后,可以通过设置参数的。计算梯度后,可以通过设置参数的。,然后在每次迭代中使用。

2023-12-04 10:02:00 669

原创 pytorch中,如何将一个网络参数传给另一个相同网络的参数?

请注意,此方法要求两个网络的结构完全相同,否则会抛出错误。,它们具有相同的网络结构,但是它们的权重和偏差不同。要将一个网络的参数传递给另一个相同网络的参数,可以使用。要将一个网络的参数传递给另一个相同网络的参数,可以使用。,它们具有相同的网络结构,但是它们的权重和偏差不同。方法获取需要传递的参数,然后将它们传递给另一个网络的。如果只想将某些参数传递给另一个网络,可以先使用。由于我们只传递了一部分参数,所以我们需要将。的键值对,并将它们传递给。假设有两个相同的网络。假设有两个相同的网络。

2023-12-04 09:58:59 918

原创 pytorch 给定概率分布的张量,如何利用这个概率进行重复\不重复采样?

该函数接受一个概率分布张量和要抽取样本的数量作为输入,并返回一个整数张量,表示从概率分布中抽取的样本的索引。请注意,上述代码只实现了一种简单的不重复抽样方法。如果需要进行更高效的不重复抽样,可以使用其他算法,如。输出结果将是一个长度为3的整数张量,表示从概率分布中抽取的三个不重复样本的索引。列表中,否则继续循环生成新的样本索引。接下来,我们确定要生成的样本数量,并初始化一个空列表。如果需要基于给定的概率分布进行不重复采样,可以使用。,用于存储已经出现过的样本索引。最后,我们打印输出了生成的样本。

2023-12-03 11:11:09 695

原创 pytorch如何生成小批量数据并传入神经网络?

在定义神经网络模型时,我们可以使用torch.nn中的模块来构建神经网络。return x在定义损失函数和优化器时,我们可以使用torch.nn和torch.optim中的函数来定义。# 定义损失函数和优化器。

2023-12-03 11:07:28 1204

原创 python中argparse库,在B文件中如何调取A文件中的args参数,直接调用的方式

文件需要共享相同的参数值,建议使用配置文件或环境变量等方式来存储和传递参数值,而不是直接在。文件中定义的参数必须是全局变量或者是可被外部访问的类属性或实例属性。文件中,定义一个函数或类方法,用于返回解析得到的参数对象。然后,我们可以直接访问该对象中的属性,如。文件中的同名参数将被覆盖,导致访问到的值可能不是预期的值。中定义了一些命令行参数并对其进行了解析,现在我们想要在。并直接访问其中的参数。解析命令行参数,并返回解析得到的参数对象。需要注意的是,在实际应用中,如果多个。文件中相同名称的参数,那么在导入。

2023-12-02 11:53:21 618

原创 如何将x和y利用torch转换成小批量数据,打乱数据、标准化或者归一化?

接着,我们计算输入数据x_data的均值和标准差,并对其进行标准化处理。最后,将标准化后的输入数据和标签数据转换为张量格式,并重新定义数据集对象和。为了将x_data和y_data转换成小批量数据并打乱数据,可以使用PyTorch中的DataLoader和random库。对输入数据进行标准化处理,即将数据按各自特征的均值中心化,再除以各自特征的标准差进行缩放。类,该类可以自动将数据按照批次划分,并且支持对数据进行随机打乱。需要注意的是,这种标准化方法仅适用于单通道输入数据,如果输入数据是多通道(如。

2023-12-02 11:46:16 915

原创 torch如何将网络参数初始化,又如何将参数还原成原始状态?

其中,nn.Linear代表线性层,nn.init.xavier_uniform()是一种Xavier初始化方法,可以使得网络参数的方差保持不变。其中,init.ones_表示将权重初始化为1,init.zeros_表示将偏置初始化为0。如果初始权重参数为1,偏置为0(也可以改成其他指定的数字或者随机数),那么可以使用PyTorch中的nn.init模块提供的uniform_和zeros_方法。要将网络参数初始化为原始状态,可以使用PyTorch中的权重初始化方法。这样,就可以将网络参数恢复到初始状态。

2023-12-02 10:33:38 879

原创 Pytorch中有哪些损失函数?

以上只是一些损失函数的示例,PyTorch还提供了许多其他损失函数,可以根据任务的不同选择适当的损失函数。除了以上列出的常见损失函数外,PyTorch还提供了许多其他类型的损失函数,如L1Loss、NLLLoss、KLDivLoss等,可以根据具体应用场景选择适合的损失函数。PyTorch提供了丰富的损失函数,用于各种不同的任务,如分类、回归、生成对抗网络(GANs)等。适用于图像分割任务,将每个像素点的预测结果视为一个概率值,用于度量模型输出和目标值之间的交叉熵。

2023-12-02 10:26:40 1115

原创 cuda 在 torch神经网络中哪些地方可以用?

在这个例子中,我们首先定义了神经网络模型,然后将其移动到可用的GPU设备上。在这个例子中,我们将损失函数torch.nn.CrossEntropyLoss移动到可用的CUDA设备上,方法是添加.to(device)。这样,当我们使用该损失函数计算损失值时,PyTorch会在GPU设备上执行相应的计算,从而进一步提高效率。CUDA可以用于在torch神经网络中进行GPU加速计算,包括模型的训练和推理过程。需要注意的是,在使用CUDA进行GPU加速时,我们需要将模型的所有参数和输入数据都移动到GPU设备上。

2023-12-02 10:20:46 611 1

原创 一文搞懂:如何在深度学习中使用GPU和cuda加速

接下来,我们使用 x.tolist() 方法将 x 转换为Python列表并将其添加到 result 中,或者使用 x.cpu().numpy() 方法将 x 转换为CPU上的NumPy数组,然后将该数组添加到 result 中。不是的,len(Xdata)并不在GPU上。要在GPU上创建一个列表,并将张量对象添加到该列表中,可以使用PyTorch的torch.Tensor.tolist()方法或者torch.Tensor.cpu().numpy()方法先将张量转换为NumPy数组,再将数组添加到列表中。

2023-12-02 10:17:42 5458

原创 torch打印一个深度网络的所有参数和参数名

返回的新张量是一个完全独立的副本,而不是共享底层数据缓冲区的视图。方法来获取模型的所有参数及其对应的名称,然后通过循环逐一打印参数名和参数值,并将参数值取出来保存到字典。方法来获取模型的所有参数及其对应的名称,然后通过循环逐一打印参数名和参数值。我们修改副本张量的第一个元素的值,并打印原始张量和副本张量的值,可以看到它们的值分别是。方法来获取模型的所有参数及其对应的名称,然后分别打印参数名和参数值。对象的方法,它返回一个与原始张量具有相同数据和属性的新张量。方法来创建一个张量的深拷贝,然后使用。

2023-12-02 09:52:59 1797 2

原创 torch中的随机数种子

因此,如果需要在代码中使用多个随机操作,并且需要确保它们的结果每次都一样,就需要在每个随机操作之前都调用。由于两次使用了相同的随机种子,因此两次生成的随机张量应该是一样的。函数生成两个不同的随机张量 x 和 y,因此它们的值是不同的,即使使用了相同的随机种子。因此,如果需要取消之前设置的随机种子,应该确保在取消之前只设置了一次随机种子。需要注意的是,如果你在代码中多次设置了随机种子,而每次设置的随机种子不同,那么每次调用。需要注意的是,在设置了随机种子之后,如果代码中还有其他随机操作,比如使用。

2023-12-01 20:09:57 948

原创 jieba分词有哪些模式?

jieba分词库提供了三种分词模式:精确模式、全模式和搜索引擎模式。

2023-12-01 20:05:03 4128

原创 介绍kfold.split()的详细用法

每个元组都包含两个数组,一个用于训练数据,一个用于测试数据。训练数据数组包含除测试数据之外的所有数据点,而测试数据数组则包含当前折叠的子集。在这个示例中,我们只是打印了训练和测试集的索引,但在实际使用中,我们可以将这些索引用于训练和测试模型。个互不重叠的子集,每个子集包含相同数量的数据点。方法迭代每个子集,并将训练集和测试集分别赋值给。是交叉验证中的一种方法,其可以将数据集划分为。在这段代码中,我们首先定义一个5行2列的。份,然后使用其中一份作为验证集,剩下的。类中的一个方法,用于将数据集分割为。

2023-12-01 20:00:28 1320

原创 torch rnn网络中,embedding.weight会反向更新吗?

层通常是一个独立的模块,其权重参数会被随机初始化,并根据训练数据进行反向更新,以使得输入的离散化表示能够更好地在连续空间中表示。如果在模型中使用了预训练的词向量来初始化embedding层,那么在训练过程中,这些预训练的词向量通常会被固定,不再进行更新。embedding已经通过一些预训练的词向量初始化了,加载到上面的网络后,还会继续被更新吗。,则在训练过程中,这些预训练的词向量不会被更新,而只有其他的参数会被更新。这是因为在训练过程中,模型的参数会根据损失函数的反向传播进行更新,而。

2023-12-01 19:57:18 962

原创 详细介绍torch中的from torch.utils.data.sampler相关知识

方法需要返回一个迭代器,迭代器的每个元素都是数据集中的一个样本的索引。在这个方法中,可以自定义样本索引的选取方式,例如根据某种规则筛选样本或者将数据集分成多个子集。如果采样器使用的是数据集的全部样本,则返回数据集的长度。方法中,我们返回了采样器的样本数量,这里的示例是采样器的样本数量等于数据集的长度。在初始化方法中,我们保存了数据集,并可以根据需要对数据集进行处理。方法中,我们自定义了样本索引的选取方式,这里的示例是随机选取样本。在这个示例中,我们首先创建了一个包含10个样本的。,输出每个批次的数据。

2023-12-01 19:53:07 992

原创 pymysql.err.DataError: (1366, “Incorrect string value: ‘\\xC2\\xA0\\xE5\\x89\\xA7\\xE6...‘ for colum

这个错误通常是由于在尝试将一个包含非ASCII字符的字符串插入到MySQL表的一个字符列中,但该列没有设置正确的字符集导致的。解决方法是要确保将表的字符集设置正确,以便它能够支持插入包含非ASCII字符的字符串。可以尝试以下方法来解决这个问题:

2023-12-01 19:48:12 652

原创 dgl的cuda版本安装+对应torch的cuda版本安装

pytorch 1.8.1 + CUDA11.1 对应的DGL-cu111版本是0.6.1。改成你想要的版本,比如。

2023-11-20 11:31:16 8331 1

原创 卡方检验-python代码

卡方检验的结果怎么计算?

2023-11-17 21:01:26 1156 2

原创 latex 中参考引用 将bibtex快速转为bibitem格式

环境:用本地编译软件,比如texstudio,overleaf似乎不行(如果有大佬指导,请教教我!>文件,用文本文件格式打开。注意,建议在文件夹中寻找该文件。第1步:构建ref.bib;内容为引文的bibtext格式。第4步:复制对应的引文到你的主文件中使用。第2步运行:document.tex。第3步:在你的本地文件夹中找到

2023-09-18 20:03:09 912 1

原创 DGL 和 torch 对应关系

调整版本号下载dgl, 运行本地代码,若运行失败则删除dgl,并继续降低版本号安装,如此循环直至脚本运行成功。dgl 1.1.0 这个版本对应python39 的 torch 1.9。报错提示需要升级torch的版本,换言之需要降低dgl的版本。也可以对应 python37 的 torch 1.10.2。可以先查看本地dgl的版本。

2023-08-18 14:32:03 4736 3

原创 混合高斯模型

对于每个高斯分布的均值(mean)的计算,通常使用一种称为“期望最大化”(Expectation-Maximization,EM)算法来进行。在混合高斯模型中,假设数据是由多个高斯分布组合而成的,每个高斯分布称为一个分量(component),而数据点则根据这些分量的权重进行分配。在 E 步骤中,首先通过当前参数(均值、方差、权重)来计算每个数据点属于每个高斯分布的概率(后验概率)。在 M 步骤中,根据 E 步骤中计算的后验概率,重新估计每个高斯分布的参数。均值的更新可以通过对数据点的权重加权平均来计算。

2023-08-11 10:59:00 189

原创 torch 对参数处理后回填

在上面的示例中,rtol 参数表示相对误差容忍度,atol 参数表示绝对误差容忍度。如果两个张量的值在指定的误差范围内相等,那么程序会继续执行,否则会引发一个断言错误。在 PyTorch 中,你可以使用 torch.testing.assert_allclose() 函数来断言两个张量的值是否在一定的误差范围内相等。先从网络中下载参数,将参数所有元素整合在一个向量中,对每个元素添加一定的噪声,接下来还原向量中的元素到参数的对应位置,并用加噪后的参数回填到模型中,最后检查一遍回填情况。

2023-08-09 14:58:01 140

好好画词云图,完整项目数据和代码

博主拿出压箱底的优质代码,和小伙伴们一起品鉴! - 画出词云图 - 指定词云图形状 - 多个文本批量生成多张词云图 - 加词库,添加所有感兴趣的词语 - 停词库,筛选掉所有不感兴趣的词语,融合了四个国内主流停词库(`7352个停词`) - 忽略单个字符 - 控制图片大小、颜色、字体与频率大小 - 自动保存高分辨率词云图到本地

2023-04-07

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

2023-03-26

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

这是一款实体关系联合标注的本地小程序,以Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用Python编程实现可视化界面和主要功能.

2022-10-31

方差分析chenyi.py

博主课程作业,自定义模块,实现多种情况方差分析

2021-12-12

采集到的重庆二手房重庆房地产数据.xlsx

重庆市各个区县房价户型等原始数据xlsx表格

2021-04-09

深圳二手房交易信息.csv

网络爬虫采集

2021-04-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除