自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python领域优质萌新学习笔记

技术小白的自我修养

  • 博客(519)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 一文搞懂:如何在深度学习中使用GPU和cuda加速

接下来,我们使用 x.tolist() 方法将 x 转换为Python列表并将其添加到 result 中,或者使用 x.cpu().numpy() 方法将 x 转换为CPU上的NumPy数组,然后将该数组添加到 result 中。不是的,len(Xdata)并不在GPU上。要在GPU上创建一个列表,并将张量对象添加到该列表中,可以使用PyTorch的torch.Tensor.tolist()方法或者torch.Tensor.cpu().numpy()方法先将张量转换为NumPy数组,再将数组添加到列表中。

2023-12-02 10:17:42 8948 2

原创 菜鸟学Java public static void main(String[] args) 是什么意思?

包名的层数没有硬性的限制要求,你可以根据需要组织包的层次结构。一般来说,官方网站或文档会提供相应的版本兼容性信息,你可以参考这些信息选择适合你的项目的版本。而对于第三方库和框架包,你需要下载相应的库文件,并在项目中进行配置和引用,以便使用其功能。方法中使用其他类型的参数,你可以将命令行传入的字符串参数解析为你需要的类型。),包含了方法要执行的代码块。在这个例子中,方法体内部没有给出具体的代码,你可以在这个代码块中添加你要执行的操作。对于包的层数并没有硬性的限制要求,你可以根据自己的需要来组织包的层次结构。

2023-06-25 17:16:31 29173 7

原创 联邦学习算法介绍-FedAvg详细案例-Python代码获取

在DP-FedSGD中,被选中的参与方使用全局模型参数对局部模型进行初始化,通过批梯度下降法进行多轮梯度下降,计算梯度更新量。而在DP-FedAVG中,是利用一个批次的数据进行一次梯度下降,计算梯度更新量。由服务端收集各客户端的梯度信息,通过聚合计算后再分发给各客户端,从而实现多个客户端联合训练模型,且“原始数据不出岛”,从而保护了客户端数据隐私。假设中心方是好奇的,那么客户端通过某种规则向其他客户端广播梯度信息,收到梯度信息的客户端聚合参数并训练,将新的梯度信息广播。面向神经网络模型, 假设网络总共有。

2023-03-12 10:36:34 26062 189

原创 MySQL 案例-教学管理信息系统

MySQL简单案例,通过构建数据库、建立表格,以及约束。向表格中插入值等操作。

2023-03-11 20:04:16 8282 4

原创 知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

你好!这是一款实体关系联合标注的本地小程序,以Python3Python3Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用PythonPythonPython编程实现可视化界面和主要功能,利用HTMLHTMLHTML和CSSCSSCSS提示标注教程与规范(无需关心它们如何实现)。利用本系统进行文本标注将原始段落文本更新为带有事先定义的命名实体、关系或属性的文本标签数据。

2022-10-31 15:44:50 8602 101

原创 python爬虫技术实例详解及数据可视化库

前言在当前数据爆发的时代,数据分析行业势头强劲,越来越多的人涉足数据分析领域。面对大量数据,人工获取信息的成本高、耗时长、效率低,是否能用代码去完成大量复杂的工作,从而从网络上获取到目标信息?由此,网络爬虫技术应运而生。网络爬虫简介网络爬虫(web crawler,又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种用来自动浏览万维网的程序或者脚本。爬虫可以验证...

2020-02-24 11:58:56 7895 8

原创 统计学中的大Op和小op

在统计学和渐近理论中,符号 OpO_pOp​ 和 opo_pop​ 用于描述随机序列的收敛速度(即随机有界性和依概率收敛到零)。它们是确定性大O和小o符号的概率版本,其定义和计算关系如下:​an​Xn​​​>Mε​)≤ε.直观理解:XnX_nXn​ 的增长速度不超过 ana_nan​ 的阶(类似确定性的大O符号),但允许随机波动。例如:由中心极限定理,n(Xˉn−μ)=Op(1)\sqrt{n} (\bar{X}_n - \mu) = O_p(1)n​(Xˉn​−μ)=Op​(1)(因渐近服从正态

2025-06-11 02:56:07 1006

原创 从300个点中选择使得方差最小的200个点

最小化选出的200个点的。

2025-06-09 11:19:46 723

原创 对F1分数的基本认识

模型存在严重问题,需要排查。有潜力但需大力优化。不错的表现,很多应用可接受。优秀的表现。接近完美(需谨慎验证)。然而,永远将F1分数放在具体问题的上下文中解读,结合精确率、召回率、混淆矩阵、业务目标和领域知识进行综合判断,才能真正理解模型的实用价值。不要被单一指标所迷惑!

2025-06-08 11:57:26 920

原创 一些分布图

这四个图从不同角度展示了z_subs值的分布特征,帮助我们全面理解模型输出的概率分布情况。

2025-06-08 00:21:21 795

原创 文言文停词库 | 古文、古籍停词库 | 624个简体停词 |文言文python分词库-thulac

摘要:本文介绍了文言文分词工具THULAC的使用方法,包括安装步骤和Python代码示例,展示了对古文"臣亮言:先帝創業未半而中道崩殂"的分词结果。同时提供了一份包含624个文言文虚词的停用词表,涵盖助词、连词等非实义成分,适用于古文文本处理。工具和词库结合使用,可有效提升文言文文本分析效果。

2025-06-01 17:09:33 318

原创 【差分隐私】目标扰动机制(Objective Perturbation)

目标扰动机制通过向优化目标注入噪声,在保护个体数据隐私的同时保持模型效用,是差分隐私在机器学习中的核心方法之一。其成功依赖于敏感度的精确计算、噪声分布的合理选择以及隐私预算的优化分配。随着联邦学习等分布式场景的发展,目标扰动机制在平衡隐私与效用上面临更多挑战与创新空间。

2025-04-28 16:09:11 1144

原创 类间@符号装饰器

在Python中,使用装饰器关联两个类是一种高级技巧,可以通过动态修改类属性、方法或实现设计模式来实现类间的交互。

2025-04-27 10:53:05 286

原创 函数间@符号装饰器

的语法糖,用于动态修改函数或类的行为。装饰器本质上是一个高阶函数,接受被装饰的函数作为参数,并返回一个新函数。是 Python 装饰器的通用语法。装饰器在深度学习、Web 开发、工具库中广泛应用,是实现代码复用和功能扩展的核心机制。对批量矩阵乘法进行性能优化的示例,核心目标是验证并对比手动批处理与 JIT 编译后的执行效率。是 JAX 的性能优化装饰器,而 @在 Python 中,@用户提供的代码是使用。用户代码中的 @jit。

2025-04-27 10:51:20 408

原创 【jax】@符号装饰器

的语法糖,用于动态修改函数或类的行为。装饰器本质上是一个高阶函数,接受被装饰的函数作为参数,并返回一个新函数。是 Python 装饰器的通用语法。装饰器在深度学习、Web 开发、工具库中广泛应用,是实现代码复用和功能扩展的核心机制。对批量矩阵乘法进行性能优化的示例,核心目标是验证并对比手动批处理与 JIT 编译后的执行效率。是 JAX 的性能优化装饰器,而 @在 Python 中,@用户提供的代码是使用。用户代码中的 @jit。

2025-04-27 10:49:44 670

原创 【jax】ms(毫秒)和 μs(微秒)

ms(毫秒)和 μs(微秒)是两种常用的时间单位,用于测量极短的时间间隔。

2025-04-27 10:48:48 2777

原创 【jax】纯函数(Pure Function)

“纯函数”在编程领域通常指无副作用且输出仅依赖于输入的函数(常见于函数式编程)定义:纯函数是函数式编程中的核心概念,具有以下特性:案例:

2025-04-27 10:46:30 170

原创 【jax】自动微分(JAX的grad函数)

以下两段代码分别使用**自动微分(Automatic Differentiation)有限差分法(Finite Differences)**计算函数。,并通过 JIT 编译优化计算速度。,高效计算了标量函数的三阶导数,体现了 JAX 在。处的梯度,并通过对比展示两种方法的差异。

2025-04-27 10:44:52 625

原创 【jax】加速计算对比效果

【代码】【jax】加速计算对比效果。

2025-04-27 10:42:42 423

原创 【jax】SELU(Scaled Exponential Linear Unit)激活函数

输入参数x:输入张量(可以是标量、向量或矩阵)。alpha和lmbda:SELU的预设参数,默认值为近似值(lmbda拼写避免与Python关键字lambda冲突)。计算逻辑使用jnp.where进行条件判断:若x > 0,输出x;否则输出。最终结果乘以缩放因子lmbda,完成归一化。

2025-04-27 10:41:41 757

原创 windows安装jax和jaxlib的教程

当你直接或者出现该问题的原因是没有安装jaxlib,并且只支持python3.9以上版本,且需要手动安装(直接用会报错)

2025-04-25 18:58:50 1282 3

原创 cuda 安装两个版本

推荐通过虚拟环境隔离管理版本。若选择系统级共存,需确保驱动版本兼容并正确配置环境变量。多版本CUDA的灵活切换为不同项目(如新旧代码库、特定框架需求)提供了高效支持。(RTX 3060显卡已安装CUDA 11,是否可同时安装CUDA 12),结合搜索结果中的技术信息,以下是关键分析及操作建议。

2025-04-25 16:55:22 1015

原创 驱动支持的最高CUDA版本与实际安装的Runtime版本

【代码】驱动支持的最高CUDA版本与实际安装的Runtime版本。

2025-04-25 16:52:00 479

原创 【差分隐私】假设检验的视角(高斯差分隐私)

的相似性,使得攻击者无法同时降低两种错误率,从而保护个体隐私。这种错误权衡的严格约束是差分隐私理论的核心贡献之一。)的定义反映了攻击者通过机制输出区分相邻数据集的困难程度。差分隐私通过数学约束。在差分隐私中,假设检验的框架被用来量化攻击者通过机制输出区分两个相邻数据集。这种区分的根本困难直接反映了隐私保护强度。这表明攻击者的错误率必须满足此不等式,从而无法自由优化两类错误。攻击者需在两种错误之间权衡:降低。-DP 为例,对任意拒绝规则。(漏判风险),反之亦然。(约束攻击者的错误权衡)

2025-04-25 15:37:20 1043

原创 【差分隐私】basic primitive的含义

在差分隐私研究中,“basic primitive”指代实现隐私保护的核心机制或数学工具,这些机制通过添加噪声或限制信息泄露的方式满足差分隐私的定义(如ϵδϵδ-DP)。噪声添加机制(Noise-Adding Mechanisms)拉普拉斯机制(Laplace Mechanism):通过向数值型查询结果添加拉普拉斯分布的噪声实现隐私保护,适用于计数、均值等统计查询。其噪声量由敏感度(Δf\Delta fΔf)和隐私预算(ϵ\epsilonϵ)决定,公式为Noise∼LapΔfϵ。

2025-04-25 15:35:31 775

原创 【差分隐私】子采样隐私放大定理理解

子采样隐私放大定理通过引入随机性降低个体数据对算法输出的影响,是差分隐私算法设计中的核心工具。其理论分析与实际应用(如深度学习、联邦学习)紧密结合,为高维数据和大规模模型训练提供了可行的隐私保护方案。未来的研究需进一步优化隐私界、探索动态策略,并扩展至更复杂的隐私保护场景。

2025-04-25 15:34:28 544

原创 高斯分布的原始矩可以通过对矩生成函数求导数得到

MGF 的唯一目的是生成各阶矩。这是概率论中一种高效且通用的求矩方法。

2025-04-22 14:50:37 448

原创 差分隐私下采样导致的输出分布为混合分布

在差分隐私和子采样机制中,相邻数据集D和D′的设置、子采样的作用及其对分布的影响是理解隐私保护的关键。DD′DD′DD′。

2025-04-22 14:42:27 1082

原创 瓦瑟斯坦差分隐私(Wasserstein DP)中的一个推导

公式68的推导本质是将敏感度的局部约束(相邻数据集差异)与分布的全局差异(Wasserstein距离)通过Hölder条件和对偶理论联系起来。这一结果为隐私保护算法提供了理论工具,将数据敏感性转化为可计算的分布距离上界。的结合,其核心是利用Wasserstein距离与数据敏感度之间的内在联系。Bobkov和Ledoux的定理指出,对于两个概率测度。的Hölder条件),但需注意此处敏感度的定义基于。所限制,为后续推导提供了不等式条件。这表明两个分布的差异被敏感度。

2025-04-22 13:11:37 1032

原创 瓦瑟斯坦差分隐私中命题7对总变差TV的应用

总变差距离是衡量两个概率分布。

2025-04-22 12:40:22 928

原创 再次理解 瓦瑟斯坦距离(Wasserstein Distance)

瓦瑟斯坦距离通过结合最优传输理论与概率分布的几何特性,提供了一种更鲁棒、更具解释性的分布差异度量方式。其在生成模型、数据对齐等领域的成功应用,尤其是WGAN的突破,彰显了其在现代机器学习中的核心地位。瓦瑟斯坦距离(Wasserstein Distance)是一种基于最优传输理论(Optimal Transport)的概率分布间距离度量。它通过衡量将一个分布“搬运”到另一个分布所需的最小“工作量”,刻画了两者在几何空间中的差异。1. 数学定义与形式瓦瑟斯坦距离的数学形式基于最优运输问题的建模。设XX和。

2025-04-22 12:35:44 1000

原创 Lipschitz函数

在机器学习中,Lipschitz约束(尤其是1-Lipschitz)是Wasserstein距离、生成对抗网络和鲁棒模型设计的核心工具。在梯度下降法中,若目标函数的梯度是Lipschitz连续的(即函数是平滑的),可保证收敛速率。在控制理论和动力系统中,Lipschitz条件确保微分方程解的存在唯一性,避免系统发散。Lipschitz连续的函数不能有“陡峭”的波动,但允许不可导点(如绝对值函数。Lipschitz函数是数学分析和机器学习中一类重要的函数,其核心特性是。是Lipschitz连续的,常数为。

2025-04-22 12:33:39 904

原创 jax 备忘录

https://zhuanlan.zhihu.com/p/532504225https://docs.jax.dev/en/latest/index.html

2025-04-21 21:22:12 391

原创 【天外之物】叉乘(向量积)的行列式表示方法

通过行列式形式,叉乘的计算变得系统化且易于操作,无需单独记忆各分量的计算公式。此方法适用于所有三维向量,并可通过扩展至更高维度(如七维叉乘,需更复杂的结构)保持一致性。将三维向量叉乘转换为行列式的形式,需构造一个包含单位向量。

2025-04-18 16:52:06 1754

原创 【天外之物】线元

通过线元,我们能将局部几何性质与全局物理现象(如引力、电磁场)联系起来,是连接微观与宏观尺度的重要桥梁。(Line Element)是微分几何、物理学及工程学中用于描述几何空间(如曲线、曲面或更高维流形)中。在结构力学中,线元可表示一维单元(如梁、杆),用于离散化模型并计算应力、应变。:线元形式依赖于坐标系和时空的几何性质,需根据具体问题选择合适度规。在参数化曲线(如贝塞尔曲线)中,线元用于细分曲线段或计算渲染路径。在爱因斯坦的广义相对论中,线元描述。是路径的线元矢量,方向沿切线。中,线元表示两点之间的。

2025-04-18 15:22:10 1005

原创 【天外之物】角动量与合力矩

角动量是描述物体旋转运动状态的物理量,表示物体绕某参考点的转动惯性。例如,行星绕太阳公转时,其角动量守恒决定了轨道平面的稳定性。:力矩是力对物体产生旋转效果的度量,合力矩则是所有力矩的矢量和。合力矩决定物体角动量的变化。例如,用扳手拧螺母时,施加的力距螺母越远(角动量的大小反映物体绕参考点转动的“强度”,方向垂直于。例如,花样滑冰运动员收紧身体(减小转动惯量。越大),力矩越大,旋转效果越明显。

2025-04-18 14:34:31 1102

原创 【天外之物】概念区分:磅(力)与磅(质量)

物理量转换公式示例(1 kg)质量1kg2.20462lbm1kg2.20462lbm1kg→2.20462lbm1kg→2.20462lbm重量(力)1lbm1lbf1lbm1lbf2.20462lbm→2.20462lbf2.20462lbm→2.20462lbf在肯尼迪航天中心的海平面高度,由于实际重力加速度与标准值一致,航天飞机的质量(磅质量)和重量(磅力)在数值上相等。

2025-04-18 11:58:06 1313

原创 【天外之物】自由落体运动

其物理意义是抛射体在竖直方向的运动由初始速度的竖直分量和重力加速度共同决定,表现为匀变速直线运动,轨迹方程为抛物线。物体在竖直方向(y轴)的初始位置为。式(b)是通过对竖直方向的加速度。进行两次积分,并分别代入初始速度。

2025-04-18 10:47:40 1554 1

原创 【天外之物】加速度与速度的单位向量的内积得到加速度在切向向量上的值

(两个向量的内积=两个向量的模的乘积再乘以一个夹角余弦,由于其中一个向量是单位向量,单位向量的模为1。因此两个向量的内积就等于一个向量的模乘以1再乘以夹角余弦,就是一个向量在另一个向量上的投影,因此就得到向量的投影结果)通过内积,我们能够从矢量中提取出特定方向(切向)的标量分量,这是矢量分析在物理学中解决实际问题的典型应用。假设卫星的加速度由引力提供,其位置、速度、加速度分别为。

2025-04-16 22:33:05 484

原创 【天外之物】叉乘获得法向量

叉乘是三维向量运算中获取法向量的核心方法。

2025-04-16 21:53:11 1219

好好画词云图,完整项目数据和代码

博主拿出压箱底的优质代码,和小伙伴们一起品鉴! - 画出词云图 - 指定词云图形状 - 多个文本批量生成多张词云图 - 加词库,添加所有感兴趣的词语 - 停词库,筛选掉所有不感兴趣的词语,融合了四个国内主流停词库(`7352个停词`) - 忽略单个字符 - 控制图片大小、颜色、字体与频率大小 - 自动保存高分辨率词云图到本地

2023-04-07

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

2023-03-26

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

这是一款实体关系联合标注的本地小程序,以Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用Python编程实现可视化界面和主要功能.

2022-10-31

采集到的重庆二手房重庆房地产数据.xlsx

重庆市各个区县房价户型等原始数据xlsx表格

2021-04-09

方差分析chenyi.py

博主课程作业,自定义模块,实现多种情况方差分析

2021-12-12

深圳二手房交易信息.csv

网络爬虫采集

2021-04-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除