whyte王-CSDN博客

本博客参考官方文档进行介绍，全网仅此一家进行中文翻译，走过路过不要错过。MPI-4.1为2023年11月2日发表，本专栏开始书写日期2024/3/18，当时最新版本4.1本人会维护一个总版本，一个小章节的版本，总版本会持续更新，小版本会及时的调整错误和不合理的翻译，内容大部分使用chatGPT 3.5翻译，内容不引用文献，请自行去文档查看；

2024-04-07 11:59:03 726

原创 LLM Agent的应用-摘自2024年3月综述论文

LLM Agent的应用-摘自2024年3月综述论文

2024-04-02 13:14:54 2093

原创 k8s kubeadm单机器安装，1.24之前版本

最后编辑时间：2024/3/26。

2024-03-26 09:48:16 1339

这份文档描述了消息传递接口（MPI）标准，版本为4.1。MPI标准包括点对点消息传递、集合通信、组和通信器概念、进程拓扑、环境管理、进程创建和管理、单边通信、扩展集合操作、外部接口、输入输出、一些杂项主题以及多种工具接口。C语言和Fortran语言的语言绑定已定义。MPI-1.0（1994年5月5日）：首次发布。MPI-1.1（1995年6月12日）：小更新和错误修复。MPI-1.2（1997年7月18日）：几处澄清和补充。

2024-03-24 11:37:18 1759 2

原创 MPI4.1文档-第二章MPI术语与约定

MPI4.1文档-第二章MPI术语与约定

2024-03-23 09:54:24 1024

原创 MPI4.1文档5-语言绑定、进程、错误处理、progress和实现

MPI4.1文档5-语言绑定、进程、错误处理、progress和实现

2024-03-22 18:06:26 1178

原创 MPI4.1文档4-MPI数据类型 MPI DataTypes

MPI4.1文档4-MPI数据类型 MPI DataTypes

2024-03-21 12:31:32 1481

原创 MPI4.1文档3-MPI过程与MPI数据类型

2024/3/20。

2024-03-20 18:15:06 1170

原创 MPI4.1文档2：MPI术语与MPI操作过程

这一章节解释了MPI文档中使用的符号术语和惯例，以及其中所做的一些选择和背后的原因。

2024-03-19 20:36:56 978

原创 MPI4.1文档1-MPI总览与各版本介绍

2024-03-18 21:01:45 1648

原创 Pytorch NLP入门3：用嵌入表示单词

嵌入（Embedding）的概念是将单词映射到向量中，这反映了单词的语义含义。其向量的长度是嵌入维度的大小。我们稍后会讨论如何构建有意义的单词嵌入，但现在让我们将嵌入视为降低单词向量维度的一种方式。因此，嵌入层会接受一个单词作为输入，并产生一个指定嵌入尺寸的输出向量。在某种意义上，它与线性层非常相似，但它不是接受独热编码向量作为输入，而是可以接受单词编号作为输入。

2024-03-17 13:02:50 1329

原创 pytorch CV入门 - 汇总

初次编辑：2024/2/14；最后编辑：2024/3/9参考网站-微软教程：https://learn.microsoft.com/en-us/training/modules/intro-computer-vision-pytorch更多的内容可以参考本作者其他专栏：Pytorch基础：https://blog.csdn.net/qq_33345365/category_12591348.htmlPytorch NLP基础：https://blog.csdn.net/qq_33345365/cat

2024-03-16 10:24:44 1500

原创 Pytorch基础-汇总

介绍pytorch基础的各种知识

2024-03-15 10:16:30 1374

原创毕业论文快速修改速查表：latex格式

介绍毕业论文修改的一些技巧，包括bib多种格式的模板

2024-03-14 19:12:24 541

原创 onnx runtime文档学习5-加速Pytorch之Pytorch推理

本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇：CUDA Execution Provider本教程第四篇：介绍EP的相关概念，包括相关的架构。本教程第五篇：介绍Pytorch加速相关知识，首先介绍Pytorch 推理相关知识。包括比较pytorch推理，torchscipt推理和ONNXRuntime推理。

2024-03-13 09:27:06 1391 1

原创硕士研究生三年生涯-西交计算机

奖学金准备：唱歌，委员，社团，方阵，运动会，比赛，论文。论文时期1：加分，工作，转春博，出国。论文时期2：工作，转秋博，出国。毕业论文+预答辩+盲审。论文时期3：工作，出国。我会依据情况持续进行调整。

2024-03-12 20:59:07 851

原创 onnx runtime文档学习4-Execution Providers (EP)架构

本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇：CUDA Execution Provider本教程第四篇：上一篇介绍CUDA EP，本教程介绍EP的相关概念，包括相关的架构。通过上面的介绍，可以得知模型可以运行在多个设备上，因此下一个教程，我们介绍加速pytorch代码相关的内容。

2024-03-12 09:23:34 1777

原创 onnx runtime文档学习3-CUDA provider

本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇(本博客)：CUDA Provider。

2024-03-11 14:59:45 2434

原创 pytorch CV入门4-使用MobileNet解决视觉相关问题

在此模块中，你已了解卷积神经网络如何工作以及它们如何捕获二维图像中的模式。事实上，CNN 还可用于发现一维信号（如声波或时序）和多维结构（例如视频中的事件，其中某些模式在一些帧中重复）中的模式。此外，CNN 是用于解决更复杂的计算机视觉任务（如映像生成）的简单构建基块。生成对抗性网络可用于生成给定数据集中类似的映像，例如，可用于生成计算机生成的图画。同样，CNN 用于对象检测、实例分段等。我们还用单独的一节课程了解了如何实现神经网络来解决这些问题，我们建议你继续学习掌握计算机视觉！

2024-03-09 15:33:05 804

原创 pytorch CV入门3-预训练模型与迁移学习

使用迁移学习，我们能够快速地为我们的自定义对象分类任务组建一个分类器，并实现高准确率。然而，这个例子并不完全公平，因为原始的VGG-16网络是预先训练的，用于识别猫和狗，因此我们只是重复使用了网络中已经存在的大部分模式。您可以预期在更奇特的领域特定对象上，例如工厂生产线上的细节或不同的树叶上，准确率会更低。您可以看到，我们现在解决的更复杂的任务需要更高的计算能力，并且不能轻易在CPU上解决。在下一个单元中，我们将尝试使用更轻量级的实现来使用更低的计算资源训练相同的模型，这将导致略低的准确率。

2024-03-08 15:22:53 1371

原创 onnx runtime文档学习2-torch & TF简单示例

本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇(本博客)：是一个快速指南，包括安装使用ONNX进行模型序列化和使用ORT进行推理。安装ONNX Runtime安装ONNX进行模型输出Pytorch, TensorFlow和SciKit的快速开始例子。

2024-03-05 16:03:56 1187

原创 pytorch基础6-加载并运行模型预测 & 总结

在本专题中，我们介绍了使用神经网络构建机器学习模型的关键概念，并使用PyTorch实现了这些概念。我们构建了一个图像识别模型，可以对图像进行分类，例如：T恤/上衣、裤子、套衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包包和短靴。如何在CPU和GPU上使用张量如何管理、缩放和规范化数据集如何使用神经网络构建模型如何优化模型如何优化模型推理。

2024-03-04 14:56:11 2079

原创 pytorch基础5-优化循环

初次编辑：2024/3/4；最后编辑：2024/3/4本教程第一篇：介绍pytorch基础和张量操作本教程第二篇：介绍了数据集与归一化本教程第三篇：介绍构建模型层的基本操作。本教程第四篇：介绍自动微分相关知识。本教程第五篇：介绍优化循环(optimization loop)相关知识。

2024-03-04 13:11:31 869

原创 pytorch基础4-自动微分

初次编辑：2024/3/2；最后编辑：2024/3/3本教程第一篇：介绍pytorch基础和张量操作本教程第二篇：介绍了数据集与归一化本教程第三篇：介绍构建模型层的基本操作。本教程第四篇：介绍自动微分相关知识，即本博客内容。

2024-03-03 17:06:56 1084

原创 pytorch基础3-构建模型层

神经网络是由神经元(neurons)通过层连接而成的集合。每个神经元是一个小型计算单元，执行简单的计算以共同解决问题。神经元分布在三种类型的层中：输入层、隐藏层和输出层。隐藏层和输出层包含多个神经元。神经网络模仿人类大脑处理信息的方式。一个层包含多个神经元，一个神经网络包含多层，我们通过子类化nn.Module来定义我们的神经网络，并在__init__中初始化神经网络层。每个nn.Module子类在forward方法中实现对输入数据的操作。输入层具有 28x28 或 784 个特征/像素。

2024-03-03 12:49:09 918

原创 pytorch基础2-数据集与归一化

Dataset逐个样本检索数据集的特征和标签。在训练模型时，通常希望以“minibatch”的形式传递样本，在每个周期重混洗(reshuffle)数据以减少模型过拟合，并使用Python的多进程加速数据检索。在机器学习中，需要指定数据集中的特征和标签。**特征(Feature)**是输入，**标签(label)**是输出。我们训练特征，然后训练模型以预测标签。特征是图像像素中的模式。标签是10个类别类型：T恤，凉鞋，连衣裙等。DataLoader是一个可迭代对象，用简单的API抽象了这种复杂性。

2024-03-02 18:46:14 1917

原创 pytorch基础1-pytorch介绍与张量操作

大多数机器学习工作流程都涉及处理数据、创建模型、使用超参数优化模型、保存和推断已训练的模型。本模块介绍在 PyTorch 中实现的完整机器学习（ML）工作流程，PyTorch 是一种流行的 Python ML 框架。本教程使用 FashionMNIST 数据集来训练一个神经网络模型，该模型可以识别图像，如 T 恤/上衣、裤子、套衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包包或短靴。在构建模型之前，会展示构建神经网络模型的关键概念。学习如何在 CPU 和 GPU 上使用张量（Tensors）

2024-03-01 20:43:31 1428

原创 onnx runtime文档学习1-介绍与架构

ONNX Runtime是由微软公司开发和维护的深度学习推理框架。是一个跨平台的机器学习模型加速器，具有灵活的接口，可以集成硬件特定的库。ONNX Runtime 可以与 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架中的模型一起使用。

2024-02-29 15:16:54 3640

原创 onnx 1.16 doc学习笔记8：API-Protos

onnx作为一个通用格式，很少有中文教程，因此开一篇文章对onnx 1.16文档进行翻译与进一步解释，onnx 1.16官方文档：https://onnx.ai/onnx/intro/index.html](https://onnx.ai/onnx/intro/index.html)，开始编辑时间：2024/2/28；最后编辑时间：2024/2/28。这是本教程的第七篇，其余内容见上述专栏链接。

2024-02-28 10:58:27 1179

CUDA 12.4官方文档 - 英文

CUDA 12.4官方文档 -- 英文

2024-04-16

论文：A hybrid CPUGPU Scheme for Optimizing ChaCha20 Stream Cipher

内容概述：描述如何使用GPU和CPU并行加速CHACHA20对称加密算法，本篇文章是第一个使用GPU加速CHACHA20的论文，CHACHA20和AES是目前唯二广泛使用的对称加密算法，它使用流式格式进行设计。使用人群： 1 学习使用GPU编程：包括很多常用并行技术，例如PTX，合并访存 2 学习使用MPI/OpenMP编程：可以了解现有的CPU上多核和多节点编程的方法 3 学习密码学知识：可以学习到一些基本的密码学知识 4 研究对称加密的科研作者：CHACHA20是一个新的密码，但是广为使用，在一些没有AES硬件加速的平台上，该算法性能更好使用场景： 1 学术研究：参考论文寻找更多研究点 2 学习知识：GPU编程，密码学知识，并行计算知识，CHACHA20知识其他说明：如果需要了解更多的知识，可以联系本博主，本博主是该论文的第一作者。可以私聊，也可以发邮件阅读建议： 1. 关注编程技巧

2024-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人