自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Sinh算子kernel直调实现

上面是sinh的算子公式,通过公式我们可以看出总共有一个输入,一个输出,为了方便计算还引用了两个tembuf临时变量。对于输入和输出数据的类型和shape,在这里我们先使用固定shape,类型的话是fp16,后面我们会不断的优化这个算子,并且也会尝试其他的算子实现,尽情期待吧。异构计算架构中,NPU(kernel侧)与CPU(host侧)是协同工作的,完成了kernel侧核函数开发后,即可编写host侧的核函数调用程序,实现从host侧的APP程序调用算子,执行计算过程。修改完成后,就可以执行看看了。

2024-06-24 22:13:29 464

原创 CANN8.0安装踩坑记

选用的规格服务器ascend 310在文档中没有直接找到,后来提工单,根据发给我的链接,里面310P AI服务器,里面有好多型号,我用的Atlas 300I Pro 推理卡对应的驱动,尝试了多种安装方式,均告知安装失败,最后还是根据群友的提示,安装Atlas300 I推理卡对应的驱动才成功的,真可谓是一波三折。但是在安装固件时,提示没有物理机器,无法安装,问了下广大的群友,说是虚拟机无法安装,那我就尝试不安装固件继续安装CANN开发套件(经过实验是可行的)。最后再确认下配置,没有问题的话,就可以购买了。

2024-06-24 22:01:22 527

原创 CANN版本升级及Add算子调试

在购买服务器并绑定IP后,登陆方式是多种的,可以考虑cloudshell和VNC登陆方式,我们这里采用第三方远程登录工具登录,使用的工具是mobaxterm,之所以选择该工具是因为它支持上传文件到服务器。通过下方的样例链接进行下载,因为服务器没有安装git,因此要下载zip压缩包,然后在上传到服务器,如果是第一次访问gitee平台,需要注册账户。在cmake官网下载对应操作的最新版本,下载成功后,上传到服务器,执行解压命令:tar -xzvf cmake-3.XX.X.tar.gz。

2024-06-24 21:59:57 584

原创 样例体验一之图片解码缩放与同步推理

点击下一步,选择网络,如果没有创建子网的话,需要先创建,公网带宽,根据个人需求,在这里我建议选用按流量计费,这样在不使用服务器的时候,可以点击停止,不用解绑弹性公网IP。我们首先打开华为云官网,点击弹性云服务器,选择按需计费,AI加速器,我们选用的是x86架构,当然也可以选择鲲鹏架构,系统用公共镜像就可以,ubuntu和centos都可以,根据习惯选择。驱动升级:chmod + ./{product name}-npu-firmware_x.x.x.x.X.run。

2024-06-24 21:58:13 301

原创 基于Caffe ResNet-50网络实现图片分类(视频解码+同步推理)

命令执行后,需要等待一会,我们借此正好简单介绍下上面参数的含义,--model代表需要转换的模型文件;--framework为原始的框架,0代表caffe,1代表mindspore,3代表tensorflow,5代表onnx;--output代表的是模型的输出位置。配置环境变量,需要注意的是$HOME是你的CANN安装路径,比如我的安装路径上在/usr/local,所以需要改成合适的路径,否则编译会失败。切换到样例的out路径下,里面有个main文件,一般是有执行权限的,如果没有需要为其增加权限。

2024-06-24 21:56:38 815

原创 初始昇腾CANN

CANN提供了在昇腾平台上开发神经网络应用的昇腾计算语言AscendCL(Ascend Computing Language),提供运行资源管理、内存管理、模型加载与执行、算子加载与执行、媒体数据处理等API,实现利用昇腾硬件计算资源、在昇腾CANN平台上进行深度学习推理计算、图形图像预处理、单算子加速计算等能力。自下而上它分为昇腾计算基础层、昇腾计算执行层、昇腾计算编译层、昇腾计算服务层,还提出了昇腾计算语言AscendCL,包括算子开发、图开发和应用开发。

2024-06-24 21:54:20 651

原创 MindSpore第一天打卡

mindspore框架可以适用于多个领域,对于不同的领域提供了拓展,有专门用于科学计算的,还提供了很多的网络modelzoo,在API上分为3个层次,包括高阶API可以帮助用户更快的上手,中阶API可以帮助用户灵活的构建神经网络,低阶API用户可以用它来实现张量定义,求导等操作。mindspore框架具有易开发,高效执行,全场景统一部署等特点。

2024-06-19 20:40:51 103

原创 Amazon CodeWhisperer 体验分享

其次关于该工具的操作文档也比较简单,写的并不够完善,提供的场景环境也比较有限,建议能够提供更加完善的操作文档,对于期间有可能遇到的问题,提供对应的解决方案,可以为该工具提供更多的支持场景,让该工具变得更加强大,减少重复代码的生成,完善工具,减少错误的产生。让该工具自动生成一个打地鼠的游戏,但是生成的代码并不对,而且代码也有很多是重复生成的,在代码的最后,还额外加上了某页面的网址,可见该工具对于中文的识别能力还不够,并且只能满足一些简单场景。但是对于一般的简单场景还是够用的,可以减少开发者的很多重复性工作。

2023-10-07 20:55:22 9941 1

原创 华为送Mate60pro活动来了!

点此处报名:--------------------------------------报名入口---------------------------------------------

2023-09-14 08:45:23 161 1

原创 西瓜书课后笔记---实验评估方法与性能度量

模型评估与选择错误率与精确率 训练误差与泛化误差 训练误差低≠泛化误差低⟹ 欠拟合(训练的不够)与过拟合(训练的太好NP≠P)评估方法:通过与训练集数据不同的验证集来进行评估1)留出法: 直接将数据集分割为训练集和验证集,常选用2/3~4/5作为训练集2)交叉验证法:将数据集分成k个互斥的子集,每次选取其中一个作为验证集,其他的作为训练集,最终取k个分组的测试结果的平均值3)自助法:每次从数据集D中随机抽取一个样本放入D1 中,然后放回数据集D,如此重复m次,数据集样本中始终不会被取到的概率

2022-03-15 16:36:34 347

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除