nd4j 矩阵（matrix）repeat重写性能150倍提升（干货！）

最新推荐文章于 2024-02-01 00:49:25 发布

Wendell6

最新推荐文章于 2024-02-01 00:49:25 发布

阅读量1.7k

点赞数

分类专栏： Nd4j 机器学习文章标签： nd4j java 矩阵做机器学

本文链接：https://blog.csdn.net/wwwwenming2007/article/details/54629721

版权

上篇文章提到的INDArray中的repeat重写，我项目中使用的是40*1*300的矩阵操作，本人亲测性能得到了150倍的提升。

现在给出个直观的算法概念和具体实现代码：

Nd4j的repeat实现算法如图：

本人重写后的实现算法如图：

下面是针对我的项目情况的代码实现, 我的实现只针对被repeat的维度长度为1的情况，如果大家需要对任意长度维度的repeat操作，需要做少许修该。

    /*
    This funciton only support repeat the dimension of which the length of it is one.
    * */
    static INDArray re

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Wendell6

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

nd4j mmul and repeat

wwwwenming2007的专栏

12-01

1788

最近使用dl4j下的nd4j做机器学习相关算法的移植任务，总结下使用nd4j矩阵运算遇到的问题和解决方法开发平台： Win7 X64 开发工具：IntelliJ IDEA + Maven dl4j： java下的一个机器学习开源项目 nd4j： dl4j使用的底层的算法库，实现的几乎所有的矩阵相关的操作 nd4j version：0.6.0 1. 矩阵的点成操

nd4j：JVM（NDArrays）的快速，科学和数值计算

02-03

ND4J：JVM上的科学计算 ND4J是用于JVM的Apache 2.0许可的科学计算库。通过向该存储库贡献代码，您同意根据Apache 2.0许可提供您的贡献。它旨在用于生产环境，而不是用作研究工具，这意味着例程旨在以最小的RAM需求快速运行。请在search.maven.org上搜索最新版本。或使用以下版本中显示的版本： : 主要特点多功能n维数组对象包括GPU在内的多平台功能线性代数和信号处理功能细节通过CUDA后端nd4j-cuda-7.5支持GPU，而通过nd4j-native支持Native。所有这些都包装在一个统一的界面中。该API模仿了Nu

参与评论您还未登录，请先登录后发表或查看评论

ND4J的基本操作

dong_lxkm的博客

10-08

1628

开发十年，就只剩下这套架构体系了！ >>> ...

DL4J中文文档/ND4J/矩阵操作

bewithme的专栏

01-26

660

在学习nd4j的过程中，还有其他一些基本的矩阵操作要突出显示。（示例代码）转置矩阵的转置是它的镜像。矩阵A第1行第2列中的元素将位于矩阵A转置后的第2行第1列中，其数学符号为a到t或a^t。请注意，沿正方形矩阵对角线的元素不会移动-它们位于反射的铰链。在nd4j中，矩阵转置就像这样： INDArray nd = Nd4j.create(new float[]{1, 2, 3, 4}, ...

[DeepLearning4j学习日记]-ND4J矩阵的基本操作

Timeless小帅的博客

03-15

1583

什么是ND4J 官网上的介绍是这样介绍的 ND4J是Java编写的开源、分布式深度学习项目，由总部位于旧金山的商业智能和企业软件公司Skymind牵头开发。团队成员包括数据专家、深度学习专家、Java程序员和具有一定感知力的机器人。通过科学计算，分析师能够从大数据中挖掘出价值。我们认为，业内对深入理解和挖掘数据之货币价值的旅程才刚刚起步。因此，我们决定在Java虚拟机（JVM）环...

DeepLearning4j实战1--ND4J矩阵操作

横竖撇折点

12-17

1106

ND4Jmaven安装DL4J创建矩阵矩阵运算--拼接矩阵运算-加减矩阵运算-乘除矩阵运算-翻转三维矩阵本文示例源码地址：https://github.com/tianlanlandelan/DL4JTest/blob/master/src/test/java/com/dl4j/demo/Nd4jTest.java maven安装DL4J pom文件引入： &lt;dependency&gt...

Python-Jumpy是ND4J的Python接口用于JVM的NumpyArray封装

08-10

此外，由于ND4J支持GPU计算，Jumpy也能够利用GPU加速运算，这对于高性能计算来说是一个巨大的提升。在实际应用中，Jumpy可以用于以下几个方面： 1. 数据预处理：在进行机器学习或深度学习项目时，数据预处理是必...

Numpy中矩阵matrix读取一列的方法及数组和矩阵的相互转换实例

01-20

Numpy matrix 必须是2维的，但是 numpy arrays (ndarrays) 可以是多维的（1D，2D，3D····ND），matrix是Array的一个小的分支，包含于Array。 import numpy as np >>> m = np.mat([[1,2],[3,4]]) >>> m[0] #读取...

libnd4j和nd4j编译

Fabuler的专栏

03-30

2463

最近新学deeplearning4j,写好的代码无法跑起来，发现需要libndfj 下载下来之后是源码，网站也没有提供编译好的文件，没办法只好自己编译了。先在window下编译，根据提示要看windows.md,根据提示安装了msys2这个软件，然后安装了mingw64，msys2安装好了以后运行它，然后执行 pacman -Syu 更新核心包数据库和系统包，然后关闭程序再重新打开，并执行

nd4s：ND4S：Scala的N维数组。科学计算的概念。基于ND4J

02-05

nd4s：ND4S：Scala的N维数组。科学计算的概念。基于ND4J

ND4J求多元线性回归以及GPU和CPU计算性能对比

dong_lxkm的博客

06-03

1544

上一篇博客《梯度下降法求多元线性回归及Java实现》简单了介绍了梯度下降法，并用Java实现了一个梯度下降法求回归的例子。本篇博客，尝试用dl4j的张量运算库nd4j来实现梯度下降法求多元线性回归，并比较GPU和CPU计算的性能差异。一、ND4J简介 ND4J是DL4J提供的张量运算库，提供了多种张量运算的封装，以下内容复杂于ND4J官网： ND4J和ND4S是JVM的...

matlab矩阵复制函数：【repmat】

VisionYE的博客

07-27

7774

处理大矩阵且内容有重复时使用，其功能是以A的内容堆叠在（MxN）的矩阵B中，B矩阵的大小由MxN及A矩阵的内容决定，

ND4J中BaseNDArray的四个矩阵相乘方法小结

weilan06的博客

01-19

1180

BaseNDArray中有四个矩阵相乘的方法： 1、public INDArray mul(INDArray other) 2、public INDArray muli(INDArray other) 3、public INDArray mmul(INDArray other) 4、public INDArray mmuli(INDArray other)

ND4J读取图片

用时间去蜕变

03-22

997

一、构建加载器 NativaImageLoader loader = new NativeImageLoader(height, width, channels); 构建图片加载器，顺便完成了对图片的缩放功能，可以直接用于fit网络模型。 height: 图片的高 width: 图片的宽 channels: 图片通道数，3为彩色，1为黑白二、图片读取 INDArray ...

ND4J自动微分

dong_lxkm的博客

05-25

287

一、前言 ND4J从beta2开始就开始支持自动微分，不过直到beta4版本为止，自动微分还只支持CPU，GPU版本将在后续版本中实现。本篇博客中，我们将用ND4J来构建一个函数，利用ND4J SameDiff构建函数求函数值和求函数每个变量的偏微分值。二、构建函数 ...

【深度学习】ND4J-科学计算库

最新发布

神也在Cpoy

02-01

1332

ND4J主要是JVM的科学计算库，内置了很多计算方法，目的是以最低的RAM需求快速运行。主要特点是：一个多功能的n维数组对象。线性代数和信号处理函数。多平台功能，包括GPU。所有主要操作系统: win/linux/osx/android.架构: x86, arm, ppc.Nd4j的主要特点是具有多功能的n维阵列接口INDArray。为了提高性能，Nd4j使用堆外内存来存储数据。INDArray不同于标准Java数组。

线程说：不是我想爆炸，只怪你Nd4j没用好

weixin_50666791的博客

09-25

293

背景：去年接手了一个排序服务，用于播单、声音、主播排序。接手于来处理过内存溢出问题，后面也没再出现过其他状况。但是最近该项目用于离线任务计算后，出现了问题。并且问题发生时间是在计算量扩量之后。项目背景：该项目与算法的配合方式：项目提供接口规范，涉及：排序算法加载、自动更新、模型调用、输入参数解析、告知模型所需特征数据（包括特征表、表字段等）。项目需要做的事：加载算法–>解析请求数据–>获取特征数据–>调用模型排序–>解析排序结果–>结果拼装返回。二、问题背景

nd4j 向量_DL4J中文文档/ND4J/元素操作

weixin_32349577的博客

12-24

401

元素操作比矢量操作更直观，因为一个矩阵的元素清楚地映射到另一个矩阵上，为了获得结果，你只需要执行一个算术操作。(示例代码位于此处。)对于向量矩阵运算，你必须首先建立直觉，并执行多个步骤。矩阵乘法有两种基本类型：内(点)积和外积。内积产生一个减少维度的矩阵，外部积产生一个维度扩大的矩阵。助记法：向外扩张，向内收缩。内积与哈达马积，哈达马积要求两个矩阵具有相等的行和列，内积只要求第一个矩阵的列数等于第...

nd4j 矩阵（matrix）repeat重写 性能150倍提升（干货！）

nd4j 矩阵（matrix）repeat重写性能150倍提升（干货！）