- 博客(1000)
- 收藏
- 关注
原创 MindSpore目前支持Atlas 200I DK A2吗?
想学习一下,但是受限于成本使用了Atlas 200I DK A2的开发板,这个开发板能做分布式训练吗,能用来深度开发吗?如果不能请问能够平替的软硬件是什么?
2024-09-29 17:00:44 310
原创 msprof命令行工具无法得到op_statistic _*.csv
在mindstudio_profiler_output下只有msprof_xxx.json / op_summary.csv / prof_rule.json / task_time.csv这几个,没有op_statistic_*.csv。我想要通过op_statistic_*.csv查看哪个环节耗时最多。以我之前的经验来看,多次推理文本,有几次确会突然变得特别慢,很可能是什么原因导致了重新进行图编译,比如有些非动态shape的情况下,某一次推理的输入shape变化很大,就会导致重新图编译。
2024-09-29 16:59:35 434
原创 关于 mindquantum.algorithm.nisq.qaoa.qaoa_ansatz 的错误RuntimeError: Number of dimensions must be one.
今天在查找QAOA的时候发现了一个包QAOAAnsatz,输入参数有ham和depth,但是一直会报错误。
2024-09-29 16:58:31 194
原创 MindSpore自定义数据集训练时遇到错误ValueError: The data pipeline is not a tree
iam["train"]为mindspore.dataset.engine.datasets_user_defined.GeneratorDataset运行时报错。
2024-09-29 16:55:06 351
原创 mindspore 进行可视化报错 TypeError: RepeatedCompositeFieldContainer object does not support item assignment
架构 cpumindspore版本2.3.0rc1 描述: 加入SummaryCollector 后代码出现报错期望 : 可以解决报错 或者可以给一下成功可视化的代码文件与可视化日志文件TypeError: RepeatedCompositeFieldContainer object does not support item assignment代码信息以下为堆栈信息 TypeError Trace
2024-09-29 16:53:43 678
原创 运行nn/cell.py在init_pipeline出错:ImportError: cannot import name ‘utils‘ from partially initialized modu
如图,程序在运行nn/cell.py在init_pipeline出错: 运行环境见二,请问这是版本不兼容的问题吗?该如何解决?
2024-09-29 16:52:11 187
原创 [910]单卡训练速度慢,AICore(%)为0是否正常
在910单卡起的容器中运行MindOCR模型训练脚本,速度较慢:fps per card: 58.70 img/s。通过npu-smi info查看npu状态,发现AICore(%)=0。图片见下请问该值为0是否正常?训练速度较慢是否与其有关?
2024-09-29 16:50:01 155
原创 atlas200I DK A2套件上mindspore lite 安装问题
在文档中下载了mindspore lite和 NPU的安装包到atlas200I DK A2上,但不知道怎么给他俩安装到环境中?能不能给个教程阿在下载的mindspore-lite-2.3.0-linux-aarch64文件目录中也没有找到install 或者 README文件。
2024-09-29 16:48:28 317
原创 Mindspore2.2.14 安装不成功
910卡=3.9.1: 测试的时候有问题 (policy) linweibin@user:/usr/local$ python -c "import mindspore;
2024-09-29 16:46:57 676
原创 为什么Mindspore社区的Transformer课程脚本仅能用CPU运行
在华为ModelArts平台上,选择北京四线路,镜像选择pytorch1.8-cuda10.2-cudnn7-ubuntu18.04,规格设置为GPU: 1*Vnt1(32GB)|CPU: 8核 64GB的情况下,为什么在运行Mindspore社区的Transformer课程脚本,发现实际上用的还是CPU在跑呀?
2024-09-29 16:44:42 222
原创 mindformers的hccn.conf问题
main()然后我打开/etc/hccn.conf 是已经有这些内容了,但是我重新运行hccl_tools.py还是上面的报错,是没有关系嘛。],
2024-09-29 16:42:19 645
原创 Mindspore调用ascendc算子,算子为原地计算,但是mindspore无法获取原地计算的值
使用mindspore的2.3.1版本调用ascendc算子时,该算子是原地计算的算子,算子定义如下:算子内部更新向量x,在用c++进行aclnn调用时,可以在计算完毕后将device侧的x内存拷贝到host侧输出但是使用mindspore进行aclnn调用时,CustomRegOP注册该算子时,无论添不添加output注册,都无法获取原地输出的值请问该如何将原地计算的值从device侧拷贝到host侧。
2024-09-29 16:41:27 162
原创 mindspore加入自定义的动态库后,报“ImportError: /lib64/libcurl.so.4: symbol SSLv3_client_method version OPENSSL_1
在mindsore源码c++中添加了一些自定义的函数作数据监控,新增函数会调用系统内的一些动态库,在CMakeLists中增加了相关动态库,可以正常编出whl包,但是运行就会报错。ccsrc/CMakeLists.txt修改。
2024-09-29 16:39:08 195
原创 MindSpore的from mindspore.train import Model 和 from mindspore import Model ,这两个Model什么异同?
和这两个Model什么异同?
2024-09-29 16:36:28 181
原创 Mindspore安装2.3.1版本后,验证报错Parse dynamic kernel config fail.
HwHiAiUser@dcn:tmp$ pip3 install https://ms-release.obs.cn-north-4.myhuaweicloud.com/2.3.1/MindSpore/unified/aarch64/mindspore-2.3.1-cp38-cp38-linux_aarch64.whl --trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.edu.cn
2024-09-29 16:34:01 695
原创 华为开源自研AI框架昇思MindSpore应用案例:ICT实现图像修复
卷积神经网络由于其强大的纹理建模能力,在计算机视觉领域取得了巨大进展,然而卷积神经网络在理解全局结构上表现不佳,近几年transformer的发展证明了其在建模长期关系(全局结构)方面的能力,但transformer的计算复杂度阻碍了其在处理高分辨率图像中的应用。ICT将这两种方法的优点结合到图像补全任务当中,先使用transformer进行外观先验重建,恢复了多元相干结构和一些粗糙纹理,再用卷积神经网络进行纹理补充,增强了由高分辨率掩模图像引导的粗糙先验的局部纹理细节,其基本原理如下图所示。
2024-08-27 16:11:05 181
原创 使用mindspore-gl 0.2版本报错,‘NoneType‘ object has no attribute ‘loader‘
使用mindspore==2.0.0和mindspore-gl==0.2报错 File "D:\software\Anacnoda\Anaconda3\envs\mynlp\lib\site-packages\mindspore_gl\__init__.py", line 22, in
2024-08-27 16:09:15 341
原创 使用MindSpore自定义loss之后,模型训练过程中AIcore占用一直为0
使用自定义loss之后,模型训练过程中AIcore占用一直为0,训练速度很慢,该如何解决这个问题呢。
2024-08-20 11:29:01 396
原创 使用mindspore训练DKT知识追踪模型,模型是LSTM,没报错,只训练了一个Epoch:0 ,就直接终止
使用mindspore训练DKT知识追踪模型,模型是LSTM,没报错,只训练了一个Epoch:0 ,就直接终止,显示Process finished with exit code -1073741819 (0xC0000005).数据量很小,有3800多条数据,下面是运行截图.我使用CPU跑的,CPU是AMD R7-5800H。
2024-08-20 11:27:46 228
原创 使用mindspore.train.Mode的一些疑惑
1.执行单机多卡脚本后,程序看起来更像是在四张卡上跑,之间毫无关联。正常应该是怎样的?2.在单机多卡数据并行的情况下,用model.fit()进行模型训练,会自动将梯度聚合吗?还是说,单机多卡的情况不支持使用fit()边训练边验证。
2024-08-20 11:25:04 273
原创 流水线并行相关问题,mindspore版本2.1/2.2
在使用昇腾910proa芯片进行单机八卡的模型训练(较大规模的resnet),但是我们在使用流水线并行时有如下疑问与问题:1.在mindspore2.1中,2.1的流水线并行教程给出的代码在分布式情况下似乎损失函数值并没有下降(https://gitee.com/mindspore/docs/blob/r2.1/docs/sample_code/distributed_training/resnet50_distributed_training_pipeline.py),在改代码中,我们将pytest -s
2024-08-20 11:21:16 274
原创 请问MindSpore Dev Toolkit代码补全功能可以离线使用吗?
请问MindSpore Dev Toolkit代码补全功能可以离线使用吗?
2024-08-20 11:19:03 335
原创 请问mindspore里对标(pytorch里summarywriter)的是summarycollector吗
请问mindspore里对标(pytorch里summarywriter)的是summarycollector吗,summarywriter里哪个函数对标(summarycollector里add_gragh函数)呢。
2024-08-20 11:17:51 331
原创 Ascend C自定义算子使用问题
基于cann进行自定义算子开发,然后想要在mindspore中进行调用,参考官网教程:https://www.mindspore.cn/tutorials/experts/zh-CN/master/operation/op_custom_ascendc.html使用的是cann8.0+mindspore2.3的镜像执行报错:请问下该问题怎么解决,或者有其他方法将cann开发的算子在mindspore中使用吗。另外是否有更详细的Ascend C自定义算子应用到mindspore的教程。
2024-08-20 11:15:53 420
原创 ModelArts使用过程中,升级mindspore的一些疑惑
modelarts的镜像环境版本不够高,升级mindspore的时候要升级cann的版本吗?只升级mindspore会有什么问题。
2024-08-20 11:09:44 363
原创 如何可以找到AI核相关指令?
我们希望能够从编译的二进制文件中找到文档中提到的AI核专用指令,类似MMAD, VADD, VBS16.... 但我们尝试去对比对于编译的基于CPU的二进制以及基于Ascend平台的二进制文件,发现Ascend平台中的二进制文件仍然是arm指令,并没有发现AI核的专用指令。请问mindspore/mindspore-lite中可以去显示调用NPU中的AI核/AI CPU吗?如果是,mindspore/mindspore-lite中是如何去调用AI核/AI CPU的呢?有什么方法可以验证这一点呢?
2024-08-20 11:08:06 195
原创 安装MindSpore之前需要安装miniconda3,报错: version `GLIBC_2.25‘ not found (required by /tmp/_MEImCVQoD/libpytho
系统是centos7.8,架构在下面这幅图,装了python3.7最低版本的miniconda都不行,该怎么办。
2024-08-20 11:06:26 420
原创 在安装MindSpore无误的情况下pycharm识别不到nn模块
我用官方安装指令在anaconda里下载了mindspore-cpu 2.3.0rc1 py37_0,问题是:在pycahrm里面”from mindspore import nn”pycharm就会识别不到nn模块,但是“import mindspore as ms”就没有问题。
2024-08-20 11:04:53 402
原创 【无标题】
我看Mindspore支持TripletLoss,有没有可以直接将Mindrecord数据集直接转换成三元组形式的API,暂时在文档中没有看到,后续会支持吗。
2024-08-20 11:02:52 374
原创 MindSpore中的yolov5s转换为.onnx后结果变了,会提示301 parameters in the ‘net‘ are not loaded
环境信息:win10,cpu,报错信息:工程和权重文件从官方网站上下载的。
2024-08-20 11:01:45 191
原创 mindyolo什么时候才能开放API
mindyolo何时能开放API调用 真的很需要一个能在昇腾npu架构上调用的yolo来进行开发 虽说已经有v5的样例 但是机动性对于我这种小白来说太差 能否早日开放api。
2024-08-08 10:45:40 199
原创 MindSpore在使用算子切分策略进行训练时,数据集报strategy的相关错误
mindspore版本为2.0.0算子切分模式下训练正常,但在采用EvalCallback进行评估时报错,相关报错如下图:相关配置如下:训练相关:评估相关:可以使用2.3版本避免上面报错 https://www.mindspore.cn/tutorials/experts/zh-CN/r2.3.0/parallel/shard_function_parallel.html
2024-08-08 10:41:59 179
原创 MindSpore2.3正式版发布了,只看到ASCEND版本,GPU版本还有吗?
MindSpore2.3正式版发布了,只看到ASCEND版本,GPU版本还有吗?
2024-08-08 10:33:51 225
原创 关于mindspore和torch两个方法的异同
ops.gather()函数和torch.gather()函数首先这两个函数的异同并没有给出在api映射文档中,于是我默认两者一致但是在进行模型迁移的时候,我发现ops.gather()的结果与torch.gather()的结果出入很大我此处给出一个测试样例(mindspore=2.2.14,torch=1.13.1+cu116)多的输出我就不放了,这是两者的运行结果对于这个问题,我目前的解决办法使用np+mindspore.tensor重新实现了一个简易的torch.gather索引问题。
2024-08-08 10:31:09 307
原创 MindSpore如何调用预训练模型
如何调用预训练模型,使用mindspore_hub调用在load的时候报错说文件编码存在问题,然后修改文件编码方式,结果又说无法访问gitee仓库,但仓库我点进去是正常的,如果最后只能调用本地模型,那又如何调用呢。
2024-08-08 10:27:57 189
原创 mindspore_hub如何调用预训练模型
mindspore_hub如何调用预训练模型,调用预训练模型报错,显示gbkl编码无法识别,修改模型编码模式,则显示check failed,这个模块是否已经被弃用,是否mindspore加载预训练模型只能加载参数而无法加载神经网络架构?如果我要把pytorch的模型调过来如何操作。
2024-08-08 10:25:23 175
原创 MindSpore在进行模型推理时传入tensor格式数据出现报错
inputValue=analyze_fail.ir)'interpolate'和'scale_factor' 需要是float格式的,但现在是int格式的。根据报错提示这应该是数据格式的问题。
2024-08-08 10:11:42 862
原创 aipro上运行mindyolo报错
用的是自带mindspore2.2.14问题:这个错误信息指出,在使用MindSpore框架的函数时,传递了一个不被识别的关键字参数jit_config。请问如何解决呢。
2024-08-08 10:05:53 164
MindSpore报错解决地图2022.10.21
2022-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人