![](https://img-blog.csdnimg.cn/20210815111425706.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
【汇编优化技术100例】
文章平均质量分 86
本专栏主要讲述CPU架构(以X86、ARM和MIPS架构为例)汇编优化技术,从底层汇编原理讲起,详细讲解汇编原理和基本方法(包括纯汇编、Intrinsic汇编和内联汇编),每个方法都附带运行示例demo。
(1)限时特价79.9,最终定价99.9。
(2)所有文章绝对干货!有任何问题可私信博主。
优惠券已抵扣
余额抵扣
还需支付
¥79.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
飞翔的鲲
一名音视频领域coder,喜欢深入钻研各种新技术(编解码、图像处理、算法优化等),擅长Matlab,Python,C编程。
CSDN明星博主,认证博客专家,视频、Matlab领域优质创作者。目前专注于音视频编解码和AI技术领域,开源分享,不忘初心,追求卓越!
欢迎订阅我的付费专栏,每篇都是博主的多年工作经验总结和呕心之作,任何问题都可以私信博主,必给您答疑解惑!希望我的博文可以帮助到你~
展开
-
【优化系列】汇编优化技术100例----导航页
DATE: 2021.8.15文章目录1、前言2、专栏内容--持续更新1、前言本专栏主要讲述CPU架构(以X86、ARM和MIPS架构为例)汇编优化技术,从底层汇编原理讲起,详细讲解汇编原理和基本方法(包括纯汇编、Intrinsic汇编和内联汇编),每个方法都附带运行示例demo。每周一例,持续更新,限时特价29.9,最终定价99.9。推荐订阅,有问题可以直接与我沟通~2、专栏内容–持续更新本专栏包括如下文章:【优化系列】汇编优化技术(一):主流CPU架构简介【优化系列】汇编优化技术(二)原创 2021-08-15 18:22:17 · 420 阅读 · 0 评论 -
【优化系列】汇编优化技术(一):主流CPU架构简介
DATE: 2021.8.15文章目录1、指令集架构2、ARM架构3、x86架构/Atom处理器4、MIPS架构5、PowerPC(PPC)架构6、LoongArch架构1、指令集架构RISC(reduced instruction set computer,精简指令集计算机)是一种执行较少类型计算机指令的微处理器,起源于80年代的MIPS主机(即RISC机),RISC机中采用的微处理器统称RISC处理器。这样一来,它能够以更快的速度执行操作(每秒执行更多百万条指令,即MIPS)。因为计算机执行每原创 2021-08-15 14:41:15 · 666 阅读 · 0 评论 -
【优化系列】汇编优化技术(二):X86架构汇编优化及demo
DATE: 2021.8.15文章目录1、简介2、入门基础3、寄存器3.1、32位寄存器3.2、64位寄存器4、调用规则4.1、32位函数调用规则4.2、64位模式(linux64)调用规范4.3、64位模式(windows64)调用规范4.4、调用规则实例5、指令集使用方法5.1、数据表示和寻址方式5.2、指令格式和通用指令5.2.1、指令格式5.2.2、通用指令5.3、MMX指令5.3.1、MMX指令简介5.3.2、MMX指令使用5.4、SSE/SSE2/SSE3/SSSE3/SSE4.1指令5.5原创 2021-08-15 16:02:08 · 301 阅读 · 0 评论 -
【优化系列】汇编优化技术(三):x86架构Intrinsic优化及demo
DATE: 2021.8.15文章目录1、SSE Intrisic based on x861.1、指令集对应的位数1.2、指令集intrinsic对应的头文件2、 数据类型2.1、数据类型的转换3、 intrinsic函数命名4、示例5、附录5.1、Latency and Throughput6、重要Intrinsic函数用法6.1、数据移位指令6.2、读取和存储指令6.3、不同位数数据扩展或转换6.4、乘法指令6.5、数据提取指令Shuffle6.6、绝对值,相反数指令6.7、饱和指令7、x86 I原创 2021-08-15 16:50:53 · 542 阅读 · 0 评论 -
【优化系列】汇编优化技术(四):x86架构内联汇编及demo
DATE: 2021.8.15文章目录1、前言2、Gcc内联汇编2.1、概览2.2、GCC汇编语法2.3、基本内联2.4、扩展汇编2.5、内联汇编模块2.6、更多关于约束2.6.1、常用约束2.6.2、约束修饰符3、一些实用诀窍4、x86 inline demo4.1、加法操作4.2、梯度计算5、内联汇编的编译1、前言前面几篇文章详细讲解了x86架构纯汇编优化和Intrinsic汇编优化的基本方法和示例demo。本文重点讲解x86架构内联汇编的基础知识和示例demo。2、Gcc内联汇编2.1、概原创 2021-08-15 17:08:07 · 262 阅读 · 0 评论 -
【优化系列】汇编优化技术(五):ARM架构32位汇编优化及demo
DATE: 2021.8.15文章目录1、前言2、Arm汇编架构和Reference Manuals3、Arm32位寄存器4、ARM指令寻址方式5、ARM指令特点以及优化技巧6、ARM和NEON指令集 常用指令汇总7、ARM32位加载数据的两种格式8、ARM32位汇编编写demo9、注意事项10、汇编优化基本准则11、ARM程序调试12、汇编优化demo1、前言前面的几篇文章详细讲解了X86架构纯汇编、Intrinsic汇编和内联汇编三种形式的汇编方法,从本文开始详细讲解ARM架构汇编优化的基础知识原创 2021-08-15 17:29:18 · 371 阅读 · 0 评论 -
【优化系列】汇编优化技术(六):ARM架构64位(AARCH64)汇编优化及demo
DATE:2021.8.15文章目录1、arm架构64位优化基础知识2、ARMv8/AArch64 neon指令格式3、ARM相关编译参数4、查看状态标记位NZCV的方法5、A64指令集特有的指令及其用法6、资料文档查阅7、AArch64 asm demo8、优化经验总结(满满的干货)1、arm架构64位优化基础知识 【arm】arm架构64位入门基础:架构分析、寄存器、调用规则、指令集以及参考手册 该博客已经分析了arm架构64位汇编优化的入门基础知识,主要包括架构分析,寄存器,调用原创 2021-08-15 17:46:27 · 1179 阅读 · 0 评论 -
【优化系列】汇编优化技术(七):ARM架构Intrinsic汇编优化及demo
DATE: 2021.8.15文章目录1、前言2、入门知识3、arm intrinsic头及编译方法4、arm intrinsic数据类型及函数介绍4.1 数据类型4.2 intrinsic函数4.3 intrinsic函数介绍5、指令查找手册6、Automatic vectorization7、arm neon Intrinsic demo1、前言 在ARM汇编优化中,除了ARM纯汇编assembly优化,还有arm Intrinsic优化和arm inline内联优化。前面已经讲述了AR原创 2021-08-15 17:56:36 · 493 阅读 · 0 评论 -
【优化系列】汇编优化技术(八):ARM架构内联汇编优化及demo
DATE: 2021.8.15文章目录1、系列总结2、参考3、ARM内联汇编优化方法3.1、Gcc asm声明3.2、优化C代码3.3、应用实例3.4、通用寄存器用法4、arm inline demo1、系列总结【ARM系列】ARM NEON汇编优化系列汇总2、参考ARM GCC的内联汇编详解 (ARM GCC Inline Assembler Cookbook)ARM GCC 内嵌(inline)汇编手册ARM GCC Inline Assembler CookbookARM嵌入式开发中原创 2021-08-15 18:12:23 · 404 阅读 · 0 评论 -
【优化系列】汇编优化技术(九):WebAssembly(wasm)平台SIMD优化
DATE: 2021.6.6文章目录1、Wasm simd优化方法1.1、编译器优化选项1.2、缺陷和行为差异1.3、Chrome开启SIMD支持1.4、Wasm simd头文件1.5、Wasm SIMD编程的三种形式1.6、Wasm 128bit SIMD扩展1.6.1、数据类型: v1281.6.2、Wasm intrinsic函数用法2、wasm优化测试demo3、Wasm Intrinsic优化基础(x86通用)3.1、主要Intrinsics函数3.1.1 数据移位指令3.1.2 读取和存储指原创 2021-08-15 19:00:39 · 785 阅读 · 0 评论 -
【优化系列】汇编优化技术(十):MIPS架构纯汇编优化及demo
DATE: 2021.8.15文章目录1、参考资料2、MIPS介绍和设计理念2.1、介绍2.2、设计理念3、MIPS体系架构4、MIPS汇编基础4.1、MIPS SIMD架构(MSA)4.2、MIPS数据类型4.3、MIPS指令格式4.4、MIPS指令风格4.5、MIPS寄存器4.5.1、MIPS32寄存器4.5.2、MIPS64寄存器4.5.3、MIPS32和MIPS64寄存器区别4.6、MIPS调用约定4.7、MIPS指令集4.7.1、寻址方式4.7.2、MIPS指令特点4.7.3、存取指令4.7.原创 2021-08-15 19:07:15 · 354 阅读 · 0 评论 -
【优化系列】汇编优化技术(十一):MIPS架构MSA Intrinsic优化及demo
DATE: 2021.11.17文章目录1、简介2、msa寄存器类型2.1、矢量寄存器类型2.2、立即数类型3、MSA Intrinsic函数3.1、load/store3.2、Logic Shift3.3、Arithmetic3.4、Saturate3.5、Shuffle3.6、Interleave3.7、Copy/Splat4、注意事项5、mips msa intrinsic优化demo6、龙芯3A4000优化建议7、更多资料1、简介GCC提供了intrinsics来获取MSA(MIPS SIM原创 2021-11-17 18:04:38 · 717 阅读 · 0 评论 -
【Web系列】WebAssembly(wasm)基础知识
DATE: 2019-7-28文章目录1、参考2、Wasm简介2.1、官方介绍2.2、Wasm特点2.3、Wasm原理2.4、wasm标准规范2.5、Wasm主要应用3、Wasm编译3.1、下载和安装Emscripten3.2、Emcc使用文档3.3、编译示例3.4、wasm文本格式和二进制格式1、参考WebAssembly从0 到 hello World几张图让你看懂WebAssemblyWebAssembly完全入门——了解wasm的前世今身2、Wasm简介2.1、官方介绍官方网址:原创 2019-07-28 22:35:28 · 1646 阅读 · 0 评论 -
【汇编优化系列】关于符号扩展和无符号扩展(包括mips msa实现)
DATE: 2021.11.26文章目录前言1、参考2、符号扩展和无符号扩展 含义3、举例说明4、mips msa相关指令前言1、参考符号扩展和无符号扩展extension2、符号扩展和无符号扩展 含义MIPS32 指令集架构中,经常会有指令需要将其中的立即数进行符号扩展,或者无符号扩展,一般都是都是将n位立即数扩展为32位。无符号扩展:直接将扩展后的数据的高(32-n)位置为0。符号扩展:将扩展后的数据的高(32-n)位置为立即数的最高位。An integer register原创 2021-11-26 17:10:11 · 1608 阅读 · 0 评论