ncnn 编译与使用 pnnx 编译与使用

9 篇文章 0 订阅
5 篇文章 0 订阅

ncnn 编译与使用 pnnx 编译与使用

ncnn

1.ncnn的官网:https://github.com/Tencent/ncnn
2.clone到本地:git clone git@github.com:Tencent/ncnn.git
3.visual studio打开:右键全部生成

pnnx

1.位置:pnnx位于ncnn的 toos/pnnx
2.配置 libtorch :

使用 CMAKE_PREFIX_PATH 配置:
首先找到 TorchConfig.cmake 的目录(可用everything工具),然后list(append CMAKE_PREFIX_PATH …)

if(CMAKE_BUILD_TYPE AND (CMAKE_BUILD_TYPE STREQUAL "Debug"))
    list(APPEND CMAKE_PREFIX_PATH "D:/lib/libtorch-win-shared-with-deps-debug-1.9.0+cu111/libtorch/share/cmake")
elseif(CMAKE_BUILD_TYPE AND (CMAKE_BUILD_TYPE STREQUAL "Release"))
    list(APPEND CMAKE_PREFIX_PATH "D:/lib/libtorch-win-shared-with-deps-1.9.0+cu111/libtorch/share/cmake")
endif()

注意:如果遇上 torch_cpu.lib(torch_cpu.dll) 和 torch.lib(torch.dll) 中定义多重定义的 dll,则取消链接 torch.lib即可,我们需要去 TorchConfig.cmake 找到存库名的变量 TORCH_LIBRARIES

# 找到TORCH_LIBRARIES后,首获查看得所有变量全路径
foreach( __val ${TORCH_LIBRARIES} )
	message(${__val})
endforeach()
# 直接删除
list(REMOVE_ITEM TORCH_LIBRARIES "-WHOLEARCHIVE:D:/lib/libtorch-win-shared-with-deps-debug-1.9.0+cu111/libtorch/lib/torch.lib")
# 或者这总方式(可以采用正则)
foreach( __val ${TORCH_LIBRARIES} )
    string(COMPARE EQUAL ${__val} "-WHOLEARCHIVE:D:/lib/libtorch-win-shared-with-deps-debug-1.9.0+cu111/libtorch/lib/torch.lib" FLAG)
    if(FLAG)
        list(REMOVE_ITEM  TORCH_LIBRARIES  ${__val})
    endif()
endforeach()
3.visual studio打开:右键全部生成
2021 AI基础软件架构峰会PPT汇总,共29份。 AI基础设施软件技术横跨深度学习算法、编程语言、编译器、数据库、分布式系统、高性能网络和AI芯片等多个前沿领域,是当前学术界和产业界共同感到兴奋的新领域。 一、AI芯片及编译器 AI芯片软件栈技术挑战和初探 地平线在软硬件协同设计的一些实践 NVIDIA GPU架构下稀疏特性的实践与挑战 二、深度学习框架 当我们谈论框架时,我们在谈论什么? 面向云计算的分布式机器学习优化实践 超大模型高效训练的分布式框架Whale 飞桨:源于产业实践的开源深度学习平台 MegEngine DTR 技术与训练框架技术创新 构建高效易用的图深度学习平台 三、端侧推理 Tengine-边缘AI异构计算平台 面向AIoT的深度学习框架MACE PNNX:PyTorch Neural Network Exchange MNN —— 功能完备的推理引擎 四、MLops及AI工程化落地 建立公开数据集标准,赋能AI工程化落地 字节跳动机器学习系统云原生落地与实践 OpenMLDB:为AI工程化落地高效供给正确数据 开源AI框架的程序接口设计 五、超大规模模型训练 快手八卦!突破 PyTorch、TensorFlow并行瓶颈的训练加速框架到底是啥? Maximizing Parallelism in Distributed Training for Huge Neural Networks 神舟大规模预训练模型 让大规模分布式深度学习变得更方便 六、互联网广告推荐 基于GPU的超大规模离散模型训练框架PaddleBox、FeaBox 浅谈点击率预测模型中Embedding层的学习和训练 XDL训练系统的演进 稀疏模型训练引擎-DeepRec 无量深度学习系统在腾讯推荐类业务的应用 七、前沿应用与基础架构 如何使用 JuiceFS 为 CV 模型训练提速 Milvus+Towhee:向量数据库及embedding流水线
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI_潜行者

赐予我力量吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值