ai
文章平均质量分 72
AI(人工智能)相关
thl789
这个作者很懒,什么都没留下…
展开
-
LLVM for TVM
本文简明列举LLVM作为target,如何集成到TVM里的。{cmake/modules/LLVM.cmake}原创 2023-06-01 15:34:29 · 801 阅读 · 0 评论 -
骁龙888在AI-Benchmark榜单上发布,引领下一轮AI算力的军备竞赛?
高通的骁龙888在苏黎世联邦理工学院(ETH)的AI-Benchmark榜单上发布,并刷新了榜首位置。不过数据来自Dev Platform,采用888芯片的XiaoMI 11的分数并不那么亮眼。麒麟990 5G通过系统升级,排行也进入前三,并且头两名是后发布的芯片。原创 2021-01-20 23:47:11 · 950 阅读 · 1 评论 -
TensorFlow Lite 8bit量化Spec
田海立@CSDN 2021-01-03TensorFlow Lite量化spec随时间会微调,这里记录一下目前量化采用的数据类型、范围,以及对历史模型兼容等情况。上面的TFLite int8量化归纳起来要点如下:由量化值计算浮点值的公式:real_value = (q - zero_point) x scale; per-channel或per-tensor的权重用int8表示。范围[-127, 127],zeor-point为0; activation/input用int8表示。范围[原创 2021-01-03 22:17:35 · 1242 阅读 · 0 评论 -
编译iOS的TensorFlow Lite Benchmark应用
TensorFlow Lite可以运行在Android/iOS/Linux等系统上,也可以通过各自系统上支持的TFLite Delegate(NNAPI / CoreML / GPU / xnnpack / Hexagon)利用AI硬件加速器进行计算。TFLite有其Benchmark工具,过去笔者关注重点在Android/Linux系统上,遇到iOS都是直接略过,今天在MacBook 上编译了一下iOS的Benchmark,本文记录之。原创 2020-12-26 23:59:51 · 816 阅读 · 3 评论 -
从TVMConf 2020看TVM的生态环境
TVM在每年12月初举办TVM Conference,今年的会议由于疫情于太平洋时间12/3~4在网上进行,不过由于时差并不利于亚太地区,估计国内在线观看者并不多,现在视频已经在官网(https://tvmconf.org/)公开。本文不具体介绍内容,仅从参与的厂商有TVM的朋友圈看TVM的生态。原创 2020-12-13 23:49:30 · 1636 阅读 · 5 评论 -
[news]Github年度报告《The 2020 State of the Octoverse》
Github发布了2020年度运行报告《The 2020 State of the Octoverse》。披露了2020数据增长(开发者增长了56M+)、用户分布(北美最多,亚洲次之)、使用语言(JavaScript第一,Python由第三上升为第二,Java由第二下降为第三),以及其他报告。原创 2020-12-06 20:53:02 · 664 阅读 · 2 评论 -
TensorFlow2.4可以在MacBook Pro/Mac Pro上利用GPU做机器学习训练了
之前MacBook上TensorFlow只能利用CPU做训练,TF2.4开始可以利用GPU做训练了,并且不管是M1的MacBook Pro,还是Intel架构的MacBook Pro还是Mac Pro都是支持的。Apple披露这一信息,并且po出性能对比数据。原创 2020-11-22 00:33:38 · 6635 阅读 · 6 评论 -
图解TensorFlow op:tf.slice
与tf.strided_slice比,tf.slice相对更简单些,在各维度上切分指定起始点和尺寸的数据。本文用图文的方式来解释TensorFlow中slice算子运算的方式。原创 2020-11-15 12:00:41 · 1546 阅读 · 0 评论 -
图解TensorFlow op:tf.strided_slice
本文用图文的方式来解释TensorFlow中strided_slice算子运算的方式。原创 2020-11-14 19:50:46 · 2258 阅读 · 0 评论 -
PyTorch Mobile在端侧可堪大用?能否与TensorFlow Lite一较高下
PyTorch在1.3发布Pytorch Mobile,其支持情况如何,能否与TensorFlow Lite一较上下呢?本文试分析之。PyTorch Mobile的宣传显得要么诚意不足要么对行业领悟不够。目前只能说是有Mobile这个路在而已,与TFLite比不可同日而语,至少目前的实现是。相对于Google移动端的即有Android生态布局,Facebook有其苦衷,要坚守其生态底线又要放弃次要考量去适配NNAPI才是其捷径。原创 2020-11-07 21:57:34 · 6915 阅读 · 8 评论 -
机器学习框架之争:PyTorch vs TensorFlow学术论文中被引用和实现的数据分析
机器学习框架之争由来已久,如果是两年(2018)前你让推荐或比较机器学习框架,那可能会有好多种,2019年已经有些明晰就是PyTorch和TensorFlow之争了,今年形势更加明朗了。本文从研究领域各大顶级会议上被引用的次数数据看这两大框架的发展趋势。两种框架被用来实现论文中的算法的次数数据,更直接反应了框架的实际地位。原创 2020-11-07 11:47:23 · 1575 阅读 · 2 评论 -
卷积的权重(Weight/Kernel/Filter)数据格式采用HWIO/OHWI,还是其他……
卷积的权重(Weight/Kernel/Filter)的数据格式一般不同于Tensor或Activation数据,有其特定的排布方式。但是这深入到平台(训练和/或推理)内部的机制了,一般大众的使用者不会关心,所以这部分信息很少。本文给出一些指引,实际用到时可以利用《图解NCHW与NHWC数据格式》里的分析方法再去具体理解。原创 2020-10-26 23:14:27 · 5381 阅读 · 5 评论 -
NCHW与NHWC数据格式之外之nChw8c
《图解NCHW与NHWC数据格式》从逻辑表达和物理存储角度用图的方式来理解常用的NCHW和NHWC这两种数据格式,其实这两种之外还有别的数据格式。本文就介绍Intel MKL-DNN里所采用的nChw8c数据格式,这种格式或其变种会在AI加速器(NPU等xPU)里采用,你不一定要记住这种格式,而要学习分析的方法,这样就能应对你所要处理的特定的数据格式了。原创 2020-10-25 22:07:32 · 1421 阅读 · 1 评论 -
为什么麒麟9000是AI-Benchmark榜单的王者?——具体指标分析及当前Android生态AI态势
田海立@CSDN 2020-10-24随着华为Mate40 pro及其搭载的海思麒麟9000处理器的发布,其手机和移动soc的AI性能也双双登上了AI-Benchmark的榜首位置。其具体指标如何呢,为什么能登上榜首?本文从CPU性能、NNAP-INT8量化性能、NNAPI-FP16浮点性能、NNAPI-INT8精度和NNAPI-FP16精度等诸多指标因素来分析,借此分析当前Android生态各家移动soc AI性能态势也就明朗了。原创 2020-10-24 23:59:35 · 3652 阅读 · 17 评论 -
AI Benchmark v4榜首风云:海思麒麟9000登上榜首
田海立@CSDN 2020-10-23随着Mate 40 Pro手机及其所采用的麒麟9000芯片的发布,麒麟9000也登上了AI Benchmark的榜首。在《AI Benchmark v4榜首风云:天玑1000+ vs 麒麟990 5G》一文中看到了麒麟990 5G在做优化改进,不过现在看不是990 5G也是新的麒麟9000,当时可能只是名字没改,导致流露了以为是990 5G的中间的一些数据谍报。最近一直在看AI-Benchmark榜单,果然是配合Mate 40 Pro手机及其所采用的麒麟9.原创 2020-10-23 08:18:40 · 1905 阅读 · 5 评论 -
图解TensorFlow op:tf.nn.space_to_depth
田海立@CSDN 2020-10-20TensorFlow算子space_to_depth是depth_to_space的逆操作。本文用图文的方式来解释该算子运算的方式。一、space_to_depth原型space_to_depth是把space数据(width和height维)移到depth(Channel)维上,与depth_to_space刚好是反向的操作。对应到ML该操作是把width和height维上各取block_size都分给depth上。所以,对应有一个参数block_s.原创 2020-10-20 21:57:41 · 5467 阅读 · 0 评论 -
图解TensorFlow op:tf.nn.depth_to_space
田海立@CSDN 2020-10-20TensorFlow算子depth_to_space的官方说明文档写得很简单,从中获取不到真正的执行方式,对于复杂的情况也就无从得知运算结果。本文用图文的方式来解释该算子运算的方式。零、前提阅读本文,你需要知道下列基本知识,可以从笔者之前的博文中了解:《数据的NCHW/NHWC排布方式》 用到数据的NHWC摆放顺序《Tensor Reshape操作》 用到Reshape操作,以及Reshape操作不改变数据的摆放原则。...原创 2020-10-20 04:06:25 · 7329 阅读 · 7 评论 -
图解TensorFlow中Tensor的shape概念与tf op: tf.reshape
《图解NCHW与NHWC数据格式》中从逻辑表达和物理存储角度用图的方式讲述了NHWC与NCHW两种数据格式,数据shape是可以改变的,本文介绍TensorFlow里Tensor的Shape概念,并用图示和程序阐述了reshape运算。原创 2020-10-18 00:20:21 · 3506 阅读 · 3 评论 -
图解NCHW与NHWC数据格式
流行深度学习框架中有不同的数据格式,典型的有NCHW和NHWC格式。本文从逻辑表达和物理存储角度用图的方式来理解这两种数据格式,最后以RGB图像为例来加深NHWC和NCHW数据存储格式的理解。原创 2020-10-12 22:47:16 · 21313 阅读 · 18 评论 -
TensorFlow ops:tf.round为“Bankers Rounding”,不是什么“四舍五入”
TensorFlow里的算子round不是什么四舍五入,而是Bankers Rounding——四舍六入五取偶。用搜索工具搜索,如果不是链接到官方网站的话,特别是到链接到中文描述,看起来还很官方的样子的地方,会把round就直接翻译成“四舍五入”,希望你再搜索的时候,看到的是本文的描述。原创 2020-10-11 23:49:35 · 1724 阅读 · 3 评论 -
AI Benchmark v4 Device选择:Google Pixel 4/XL简析
《AI Benchmark v4测试项更新以及榜单数据解读》知道了AI Benchmark执行的时候可以选择NNAPI,也可以直接用TFLite里的Delegate。Google Pixel 4/XL里用的芯片是高通骁龙855+Google TPU Edge,设备如何选择,选择的是否合理,这里简要分析之。原创 2020-10-07 12:00:54 · 816 阅读 · 1 评论 -
AI Benchmark v4榜首风云:天玑1000+ vs 麒麟990 5G
《AI Benchmark v4测试项更新以及榜单数据解读》只是解释了AI性能数据获取的机制以及简单数据概览,仔细看一下榜单,发现另有玄机,也许下一刻榜首位置就会变化。本文简要分析一下,这也许就是未来几个月的榜单趋势。原创 2020-10-06 18:40:36 · 2605 阅读 · 7 评论 -
AI Benchmark测试原理、v4测试项变化以及榜单数据解读
AI Benchmark这里特指ETHZ(苏黎世联邦理工学院)的AI性能评测工具。最新其发布了v4版本以及基于这个版本的soc和手机AI性能数据。本文分析了AI Benchmark测试的原理,v4版本的变化,以及榜单头部海思麒麟990 5G与MTK天玑1000+的对比。据此也就能解读AI-Benchmark榜单上各个数据的含义了。原创 2020-10-03 17:09:08 · 7238 阅读 · 6 评论