代码优化
文章平均质量分 90
housisong
游戏开发,性能优化,图形图像处理,算法开发,ios,android,asm
展开
-
hsynz 同步更新算法的设计和实现 -- 如何将传统同步算法本身提速10倍
本文是对我开源的 https://github.com/sisong/hsynz 库中的同步更新算法的思路介绍原创 2023-06-08 14:41:30 · 1268 阅读 · 0 评论 -
代码优化-之-Base64编码函数的极限优化挑战
代码优化-之-Base64编码函数的极限优化挑战 HouSisong@GMail.com 2007.07.27tag:速度优化,Base64,CPU缓存优化,代码优化,查找表,汇编,SSE、SSE2优化,并行 摘要: Base64编码是很常用的一种把二进制数据转换为字符串的算法;本文章对Base64的编码函数进行了各种优化尝试,目标是极限原创 2007-07-27 11:09:00 · 11274 阅读 · 9 评论 -
关于STL中stack的实现的讨论
关于STL中stack的实现的讨论 HouSisong@GMail.com 2004.11.07整理tag:STL,stack,faststack2012.02.18 修正lazylazypig发现的my_fast_stack::size()的bug; empty()函数也稍做优化(作用不大);摘要: 文章讨论了为什么大多原创 2005-10-17 09:52:00 · 7724 阅读 · 5 评论 -
高级语言内的单指令多数据流计算(SIMD)
很多年来,x86体系的CPU增加的新指令集大多都是SIMD指令(和相应的寄存器);然而很容易忽视的是,我们在高级语言内也能进行很多SIMD类计算!原创 2011-04-14 23:01:00 · 26908 阅读 · 25 评论 -
图形图像处理-之-高质量的快速的图像缩放 补充 使用SSE2优化
本文章对线性插值和三次卷积插值(bicubic)的实现做了一些新的优化尝试;使用了SSE2的128bit寄存器及相关指令;并预先建立SSE2用到的缩放系数表; 实现的结果在我的i7电脑上比以前的版本分别快出145%和75%! 线性插值的速度是StretchBlt的13倍!原创 2011-04-12 20:36:00 · 26015 阅读 · 16 评论 -
YUV视频格式到RGB32格式转换的速度优化 下篇
YUV视频格式到RGB32格式转换的速度优化 下篇 HouSisong@GMail.com 2008.03.23 tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化 摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)原创 2008-03-23 17:12:00 · 7228 阅读 · 6 评论 -
YUV视频格式到RGB32格式转换的速度优化 中篇
YUV视频格式到RGB32格式转换的速度优化 中篇 HouSisong@GMail.com 2007.11.05 tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化 摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)都使用了一种叫YUV的颜色格原创 2007-11-05 08:16:00 · 10361 阅读 · 22 评论 -
YUV视频格式到RGB32格式转换的速度优化 上篇
YUV视频格式到RGB32格式转换的速度优化 上篇 HouSisong@GMail.com 2007.10.30 tag: YUV,YCbCr,YUV到RGB颜色转换,YUV解码,VFW,视频,MMX,SSE,多核优化 摘要: 我们得到的很多视频数据(一些解码器的输出或者摄像头的输出等)原创 2007-10-31 11:37:00 · 15002 阅读 · 7 评论 -
代码优化-之-优化条件分支
代码优化-之-优化条件分支 HouSisong@GMail.com 2007.10.05tag:代码优化,条件分支,饱和,MMX,CMOV,掩码摘要: 条件分支是编程中经常使用的基本操作,然而在某些时候它确可能带来严重的性能问题.当前的CPU都能对条件分支做预测(动用了庞大的晶体管资源),如果分支预测正确,原创 2007-10-05 16:58:00 · 9543 阅读 · 10 评论 -
代码优化-之-优化浮点数取整
代码优化-之-优化浮点数取整 HouSisong@GMail.com 2007.05.19tag: 浮点数转换为整数,fpu,sse,sse2,读缓冲区优化,代码优化,ftol,取整,f2l,ftoi,f2i,floattoint 摘要: 本文首先给出一个浮点数取整的需求,并使用默认的取整方原创 2007-05-19 09:55:00 · 13628 阅读 · 5 评论 -
abp竞赛-之-文本文件词频查询 优化报告
abp竞赛-之-文本文件词频查询 优化报告 HouSisong@GMail. 2007.03.15comtag: abp,单词统计,比赛,hash,速度优化,优化报告摘要: 以前参加过几次abp论坛的比赛 http://www.allaboutprogram.com/bb (现在的www.原创 2007-03-15 01:40:00 · 3374 阅读 · 11 评论 -
英特尔多核平台编码优化大赛的优化过程--补充
英特尔多核平台编码优化大赛的优化过程--补充 HouSisong@GMail.com 2007.01.20tag: 多核编程,sse2,牛顿迭代,代码优化,优化大赛,invsqrt,开方 主要文章请参看我的《英特尔多核平台编码优化大赛的优化过程》: http://blog.csdn.net/housis原创 2007-01-20 17:20:00 · 4831 阅读 · 1 评论 -
英特尔多核平台编码优化大赛的优化过程
英特尔多核平台编码优化大赛的优化过程 HouSisong@GMail.com 2007.01.20tag:多核编程,sse,sse2,牛顿迭代,代码优化,优化大赛,invsqrt,开方 英特尔最近举办了一次多核平台编码优化大赛,我也参加了这次比赛;大赛代码提交阶段已经结束,所以也可以公开自己的原创 2007-01-20 15:45:00 · 13775 阅读 · 20 评论 -
并行计算简介和多核CPU编程Demo
并行计算简介和多核CPU编程DemoHouSisong@GMail.com 2007.01.16tag:多线程,并行计算,OpenMP,多核编程,工作线程池( 2008.01.19 更新 鉴于读者反映代码阅读困难,重新改写了文章和实现,使文章更易读 )( 2007.09.04 更新 把用事件控制的线程启动更新为临界区的实现 ) 2006年是双核的普及年,双核处理器出货量原创 2007-01-17 00:54:00 · 21508 阅读 · 30 评论 -
原生代码与托管代码的一个简单性能对比
原生代码与托管代码的一个简单性能对比 HouSisong@GMail.com tag:托管代码,原生代码,性能对比 在网上看到一篇文章"托管代码和非托管代码效率的对比" ( http://www.cnblogs.com/wuchang/archive/2006/12/07/584997.html ),作者用英特尔多原创 2007-01-18 11:37:00 · 12347 阅读 · 20 评论 -
代码优化-之-优化除法
> HouSisong@GMail.comtag:代码优化,除法,牛顿迭代,减法代替除法,除法优化 说明:文章中的很多数据可能在不同的CPU或不同的系统环境下有不同的结果,数据仅供参考 x原创 2006-08-25 10:21:00 · 17898 阅读 · 14 评论 -
程序优化的三个级别
程序优化的三个级别 HouSisong@GMail.com 2004.11.07整理tag:代码优化,程序优化,综级优化,代码调整,新的视角,表驱动状态机文章来源于abp论坛中的一篇帖子:http://bbs.allaboutpro原创 2005-10-16 19:17:00 · 6411 阅读 · 6 评论