mult 和 shift

最新推荐文章于 2023-02-07 15:12:50 发布

ganggexiongqi

最新推荐文章于 2023-02-07 15:12:50 发布

阅读量3.8k

点赞数

分类专栏： Linux 基础学习实时操作系统移植文章标签： math 64bit function pair linux div

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ganggexiongqi/article/details/7491468

版权

Linux 基础学习同时被 3 个专栏收录

134 篇文章 1 订阅

订阅专栏

实时操作系统

66 篇文章 0 订阅

订阅专栏

43 篇文章 0 订阅

订阅专栏

Reading notes about mult and shift pairs
Author: Yang Honggang(Joseph) <eagle.rtlinux@gmail.com>
Kernel Version: Linux 3.0.4

===================================================================================================================

关于mult和shift这一对儿值，在内核代码中有X处存在。

clocksource，clock_event_device, timekeeper，cyclecounter, clock_data

下面，我们先了解一下它在clocksource中的应用。

clocks_calc_mult_shift()函数用来根据具体应用参数计算mult 和 shift值。我们从这里开始入手分析。

/* clocks_calc_mult_shift - calculatemult/shift factors for scaled math of clocks

* @mult: pointer to mult variable

* @shift: pointer to shift variable

* @from: frequency to convert from

* @to: frequency to convert to

* @maxsec: guaranteed runtimeconversion range in seconds

* The function evaluates theshift/mult pair for the scaled math

* operations of clocksources andclockevents.

* @to and @from are frequency valuesin HZ. For clock sources @to is

* NSEC_PER_SEC == 1GHz and @from isthe counter frequency. For clock

* event @to is the counter frequencyand @from is NSEC_PER_SEC.

* The @maxsec conversion rangeargument controls the time frame in

* seconds which must be covered by theruntime conversion with the

* calculated mult and shift factors.This guarantees that no 64bit

* overflow happens when the inputvalue of the conversion is

* multiplied with the calculated multfactor. Larger ranges may

* reduce the conversion accuracy bychosing smaller mult and shift factors.

*/

void

clocks_calc_mult_shift(u32 *mult, u32*shift, u32 from, u32 to, u32 maxsec)

{

u64 tmp;

u32 sft, sftacc= 32;

/*

* Calculate the shift factor whichis limiting the conversion

* range:

*/

tmp = ((u64)maxsec * from) >>32; [1]

while (tmp) { ……[*]

tmp >>=1;

sftacc--;

} [-1]

/*

* Find the conversion shift/multpair which has the best

* accuracy and fits the maxsecconversion range:

*/

for (sft = 32; sft > 0; sft--){[2]

tmp = (u64) to << sft;

tmp += from / 2;

do_div(tmp, from);

if ((tmp >> sftacc) ==0)[3]

break;

}

*mult = tmp;

*shift = sft;

}

在分析这段代码的原理之前，先看如下的关系式。

假设时钟频率为freq,那么时钟周期为1/freq秒，即 1/freq * NSEC_PER_SEC 纳秒。

cyc个时钟的ns数为，

ns = cyc *(NSEC_PER_SEC / freq) ……[a]

实际计算时，由于内核不支持浮点运算，只支持整数的除法运算，会带来很大精度损失，所以对上面式子进行变换，如下

ns = (cyc * ((NSEC_PER_SEC << N)/ freq) >> N ……[b]

令

mult = (NSEC_PER_SEC << N) / freq

N=shift

那么，

ns = (cyc * mult) >> shift ……[c]

下面开始分析上面代码：

下面分析，基于

clocks_calc_mult_shift(&cs->mult,&cs->shift, freq,

NSEC_PER_SEC, sec);

调用实例。

首先，[1]得到可能使用mult,shift来处理的最大的cyc值

解释如下,

由式子[a],

因为maxsec为可以用来使用mult,shift转化的最大的时间范围(单位为：秒)，这个是已知的。

有，

maxsec= CYC / freq

可以推出，

CYC= maxsec * freq

所以，我们的结论是[1]处代码的作用是得到可以使用mult,shift来转化的最大的cyc值。

[*]处的while循环用来得到CYC最多可以左移多少位，能够保证不出现64位溢出。

结果保存在sftacc中。//ns = ((cyc << N) * NSEC_PER_SEC/freq) >> N

然后，[2]找到能够得到最好转换精度的mult,shift值对。

shift值，在符合32位整数时，越大越好。

解释如下，

tmp = (to << sft) / from

= (NSEC_PER_SEC << sft) /freq

其实，tmp即为mult

但是，可以有多个mult,shift对，但是只有一对是最佳的。

由式子[c]可以找到转化精度好的标准，

如果， mult>> (sftacc+x), x为大于1的整数，那么，显然，cyc的最大限将会减小，

如果， mult>> (sftacc – x), x 为大于1的整数，那么，显然，cyc在数比较小的情况下，经过

[c]转换的结果将为0，那么会影响转换精度。

所以，好的标准就是，

能够满足(mult>> sftacc == 0)的最大mult定位最终的mult，对应的shift也可以得到。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ganggexiongqi CSDN认证博客专家 CSDN认证企业博客

码龄15年

141: 原创

12万+: 周排名

84万+: 总排名

96万+: 访问

: 等级

1万+: 积分

249: 粉丝

123: 获赞

65: 评论

362: 收藏

私信

关注

热门文章

分类专栏

多处理器编程 8篇
数据库 2篇
Linux socket 编程 11篇
Linux 内核 112篇
Linux 基础学习 134篇
Linux 应用编程 15篇
Linux 驱动 76篇
shell 编程 8篇
实时操作系统 66篇
杂项 72篇
移植 43篇
网址备份 4篇
git 9篇
娱乐 2篇
Linux文件系统 17篇
编辑工具 4篇
网络维护 1篇
面试，笔试
面试 1篇
笔试 2篇
经典错误 2篇
vim使用 1篇
裝机 5篇
rt 4篇
云计算 20篇
存储 14篇
ceph 22篇
rgw 14篇
流媒体

最新评论

LaTeX技巧189：LaTeX括号总结
凌十一: 受益匪浅。。原来big Big和bigg和Bigg都不一样大。。。
ACCESS_ONCE()
小狗爱吃黄桃罐头: 实际贴出来的内核源码的例子，说明ACCESS_ONCE()的确是能解决遇到的问题。也就是说文章里讨论的使用access_once()的假设情景的确会真实的出现。
linux 路由表维护
fluidog: 请问一下博主知道第一张图是用 visio 画的吗，还是有什么效率更高的工具。万分感谢！
使用debugfs导出调试信息--一个简单的例子
一分生一分熟: 用处不大
cosbench 部署配置
feifeifei..: linux安装启动cosbench, sh start–all.sh卡在 Booting cosbench driver... 博主有遇到或者知道怎么解决么

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。