自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

神经旷野舞者

神经旷野舞者

  • 博客(18)
  • 资源 (11)
  • 收藏
  • 关注

原创 【无标题】

参考官方文档。

2024-03-23 00:22:34 1134 1

原创 numpy和pytorch的tensor哪个效率更高?

此外,PyTorch的设计初衷是为了深度学习,它提供了更多的高级功能,如自动微分、优化器、预训练模型等,这些都是NumPy不具备的。因此,选择哪个库取决于你的具体需求和工作场景。在大多数情况下,如果你的工作不需要GPU加速,或者你正在处理的是非深度学习相关的数值计算任务,NumPy可能是更高效的选择。然而,如果你正在进行深度学习研究或开发,需要利用GPU的并行计算能力,或者需要构建复杂的神经网络,PyTorch的Tensor将提供更高的效率。一共找到 7 篇资料,正在阅读...

2024-03-07 15:32:09 1155

原创 实用Python定时点击Chrome网页按钮

用Python的好处就是稳定,完全模拟了手动操作,用浏览器控制台的JavaScript总感觉是假死啊。

2024-01-31 17:01:42 831

原创 TVM 如何编译生成 libtvm.so libtvm_runtime.so

参考2.1 配置TVM环境。

2024-01-27 11:21:53 980

原创 翻译 OpenAI Triton Programming Language for Neural Networks

Triton 1.0是一种类似Python的开源编程语言。这种新的编程语言可以重新定义编码过程。Triton专注于减少代码大小。它可以用更少的代码行执行与其他编程语言相同的功能。它可以在25行以下编写F16矩阵乘法代码。使用Triton生成的内核比之前的torch实现更高效和更快。Triton可以为DNN转换器提供稳定的接口。

2024-01-19 12:09:06 1037 1

原创 安装Nsight Compute

安装路径 /code/usr/local/nvidia-nsight-compute-2023.3 # 默认路径 /usr/local/NVIDIA-Nsight-Compute-2023.3。ln -sf /code/usr/local/nvidia-nsight-compute-2023.3 /usr/local/NVIDIA-Nsight-Compute # 可执行文件位置。

2024-01-18 21:50:38 1226 1

原创 升级或者安装Nsight Systems

NVIDIA Nsight System 和 Nsight Compute 是 NVIDIA 提供的两个不同的性能分析工具,它们各自专注于不同的性能分析领域,但都是为了帮助开发者优化和调试 GPU 加速应用程序。因为之前电脑上安装的是低版本的CUDA Installer 11.4,里面包含了nsys,但是是当时的低版本的nsys,所以应该升级,以便默认调用的是最新的nsys ,vscode应该和最新的nsys系统交互。在本文档中,我们将把进行性能分析的设备称为。,将用户工作和控制性能分析会话的计算机称为。

2024-01-18 21:50:08 1475 1

原创 vscode使用nsight调试cuda代码

因为在学习cuda编程,所以当然要调试了。

2024-01-18 21:38:45 2949 3

原创 ubuntu 22.04安装低版本cuda比如cuda 11.4

但是报错了: /usr/include/stdio.h(189): error: attribute "

2024-01-18 16:43:44 1139 1

原创 CUDA十万个为什么

GPU内存(显存)的理解与基本使用 - 知乎 (zhihu.com)#todo通常情况下,游戏显卡上的内存规格(例如12GB、16GB、40GB)指的是图形内存,也称为显存或视频内存。这种内存专门用于存储图形和图像数据,以及在进行图形渲染时需要的其他相关信息。在游戏中,图形内存存储纹理、模型、帧缓冲等图形数据。与之相对应,A100上的40GB和80GB是全局内存的规格。全局内存是 GPU 上的主要存储区域,用于存储程序代码、输入数据和计算结果等。

2024-01-18 14:41:06 396 1

原创 张雪峰:”程序员年薪百万,为什么还觉得人生没有意义?“

几个微软的工程师就在这聊天儿,我觉得我的人生没有意义,一年大几十万挣扎,他说人生没有意义,那他就吃饱了,撑的就是什么,你已经不错了。我说当你没有什么的时候,你多看看自己,你已经有了什么,你已经通过自己的努力让花钱才能解决的事儿,对于你来讲就不是事儿了,对吗?我怎么知道你是上线还是下线,那是你自己的事儿。但是我先跟你说明白了,计算机就是下限无下限,上限无上限,找不着工作的,饿死找着工作了,低端累死。我说你的年一百多万,你告诉我你有没有没有意义,吃饱了撑的了,你就是我觉得人生没有意义,人生该怎么办呢?

2024-01-11 22:31:28 402

原创 使用pdf补丁丁自动识别标题生成书签

调整书签级别,比如把个别章节书签点击 ←,批量选中小节章节 等等。点击“自动生成书签”窗口的右上角的“生成书签”成品,书签生成啦,比你自己添加效率高无数遍吧。使用pdf补丁丁自动识别标题生成书签。调整书签文字,多选,然后搜索复制替换。选择各级标题提取标题格式用于识别。在软件里打开,直接拖放没用的。

2024-01-08 15:59:00 680

原创 请问一路的快排的时空复杂度怎么计算呢?

请问一路的快排的时空复杂度怎么计算呢?-慕课网](https://coding.imooc.com/learn/questiondetail/15858.html)

2024-01-07 21:29:48 352 1

原创 15-4 如何阅读《算法导论》

(文章读后感:算法是什么?宇宙是由无穷的原子构成,而地球生命物质是一种有序的集合状态,这个状态的形成就是算法,也就是通过一定步骤形成了一个东西。如何定义一个东西?我们用复杂度来定义,直觉上,一个东西越复杂我们认为智能程度越高(好像说错了),而算法就是实现这种复杂度的最快方法,这个算法就是智能。

2024-01-07 21:27:08 2148 1

原创 10-7 STL容器的统计与二分查找\_慕课网

【代码】10-7 STL容器的统计与二分查找\_慕课网。

2024-01-07 20:55:51 380

原创 visual studio 2022推送项目到自定义远程仓库

visual studio还是相当方便了,操作没遇到问题,就是填写远程地址那可能不是太清晰。

2024-01-07 17:10:03 373

原创 10-6 算法transform和lambda表达式

【代码】10-6 算法transform和lambda表达式。

2024-01-07 16:04:32 401 1

原创 使用浏览器控制台js定时点击网页按钮

/选择点击"停止"按钮,xpath是/html/body/div[2]/div[3]/div[2]/div[1]/div[2]/div[1]/div/div[3]/table/tbody/tr[1]/td[6]/div/div/a[2]//选择点击"停止"按钮,xpath是/html/body/div[2]/div[3]/div[2]/div[1]/div[2]/div[1]/div/div[3]/table/tbody/tr[1]/td[6]/div/div/a[2]//等待disabled属性消失。

2024-01-04 00:32:40 3364

《复分析可视化方法》配套 小软件g(z)

还没用,具体功能也不清楚,应该是绘图的,说明里面有。

2014-04-08

《latex入门》 刘海洋(扫描全本)

购买的扫描版 清晰有书签 经济适当者请购买正版

2014-03-25

数字图像处理课件

老师上课的课件,老师比较认真,所以课件也是自己做的。 比较基础,看课件只能起个大概了解的作用。

2014-03-25

一份不错的图像处理讲义,有实例

下载的pudn,作者称最好的,简单看了下,PPT还是比较实用的

2014-03-25

离散数学及其应用++原书第6版.part2.rar

离散数学及其应用++原书第6版.part2.rar

2013-05-17

离散数学及其应用++原书第6版.part1.rar

离散数学及其应用++原书第6版.part1.rar

2013-05-17

《离散数学及其应用》(第五版)学生解题指南

《离散数学及其应用》(第五版)学生解题指南

2013-05-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除