关于Loop Vectorization的二三事

通过一些简单例子了解循环向量化

这是一篇关于LLVM Loop Vectorize的调研记录,并将在 January 19, 2022 进行线上报告。

本文章参考了:
高伟, 赵荣彩, 韩林, 等. SIMD 自动向量化编译优化概述[J]. 软件学报, 2015, 6.
PLDI 2011 Tutorial: Program Optimization through Loop Vectorization。
Allen R, Kennedy K. Automatic translation of Fortran programs to vector form. ACM Trans.on Programming Languages andSystems, 1987,9(4):491−542. [doi: 10.1145/29873.29875]
Auto-Vectorization in LLVM. https://llvm.org/docs/Vectorizers.html

本文章将随着LLVM和Loop Vectorization的学习持续更新修改。

What is “vectorization”?

Loop Vectorization,即循环向量化,是利用处理器中“向量”或“SIMD”的指令集拓展,同时操作多个数据,以达到优化循环的目的。
循环向量化的简单理解,是利用ISA的特性。同时执行多条相同的指令,以达到提高效率的目的。对于简单定义与简单例子的展示,是通过StarkOverflow的一则提问了解的。

对于上述的简单循环,出去常规的循环展开外,使用SSE向量化可以得到更高效的结果。对比普通计算单元,向量单元可以同时计算多个数据。

在这里插入图片描述
在这里插入图片描述

SIMD向量化技术

SIM

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1. 清洗类(Cleaning): - 属性:raw(原始数据),cleanedData(清洗后的数据) - 方法:clean()(对原始数据进行杂质数据清洗) 2. 标准化类(Normalization): - 属性:rawData(原始数据),standardizedData(标准化后的数据) - 方法:normalize()(将数据统一为特定格式) 3. 分词类(Tokenization): - 属性:rawData(原始数据),tokenizedData(分词后的数据) - 方法:tokenize()(对文本进行分词处理) 4. 词语处理类(WordProcess): - 属性:tokenizedData(分词后的数据),processedWords(经过词语处理后的数据) - 方法:processWords()(对词语进行相关处理,如去除停用词、词干提取等) 5. 数据增强类(DataAugmentation): - 属性:rawData(原始数据),augmentedData(扩增后的数据) - 方法:augment()(对数据进行扩增,生成更多样本) 6. 实体识别类(NamedEntityRecognition): - 属性:rawData(原始数据),namedEntities(识别出的实体) - 方法:recognizeNamedEntities()(识别文本中的实体) 7. 向量化类(Vectorization): - 属性:processedWords(经过词语处理后的数据),vectorizedData(文本向量表示的数据) - 方法:vectorize()(将文本转换为向量表示) 8. 序列化类(Serialization): - 属性:rawData(原始数据),serializedData(保存到磁盘的数据) - 方法:serialize()(将数据保存到磁盘) 以上是每个类中一般会使用的属性和方法,用于完成各自的功能。具体使用哪些属性和方法可以根据实际需求进行调用和操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值