Java 0xaf_JAVA:位运算 & 0xff 终于明白其中的意义   JAVA中的byte转换int为

.html

问题1:

字节数组转换为 short

private static short bytesToShort(byte[] bs)

{

return (short)(bs[1]

<< 8 | (bs[0] &

0xff)); //为什么低位必须 & 0xff

}

我的理解:bs[1] <<

8(高位左移8位),然后与低位(bs[0])直接进行 | (或运算) 不就行了吗?

当然我的理解在测试下证明是错误的,为什么非要在低位先进行 & 0xff ?。

答案:

bs[0] & 0xff运算的时候会将bs[0]按符号先扩展为int类型。

如果bs[0]为负数,bs[0]扩展后前24位都是1,与0xFF与运算后,前24位就变成0了

问题2:

网上一般都这么写

private static short bytesToShort(byte[] bs)

{

return (short)(bs[1]

<< 8 & 0xff00 |

(bs[0] & 0xff));  }

但我测试发现,高8位没必要 & 0xff00,结果也是正确的。

解答:

bs[1] << 8

假设bs[1]是11001011

先转换成int:11111111 11111111 11111111 11001011

左移8位 :11111111 11111111 11001011 00000000

结果一样是因为强转为short了,你先把强转去掉,让返回值为int

强转为short:11001011 00000000

位运算符的优先级

~的优先级最高,其次是<>和>>>,再次是&,然后是^,优先级最低的是|。

首先:

Java 定义的位运算直接对整数类型的位进行操作,这些整数类型包括long,int,short,char,and byte

在剖析该问题前请看如下代码

publicstaticString bytes2HexString(byte[] b) {

String ret = "";

for(inti =0; i 

String hex = Integer.toHexString(b[ i ] & 0xFF);

if(hex.length() ==1) {

hex = '0'+ hex;

}

ret += hex.toUpperCase();

}

returnret;

}

上面是将byte[]转化十六进制的字符串,注意这里b[ i ] & 0xFF将一个byte和

0xFF进行了与运算,然后使用Integer.toHexString取得了十六进制字符串,可以看出

b[ i ] & 0xFF运算后得出的仍然是个int,那么为何要和 0xFF进行与运算呢?直接

Integer.toHexString(b[ i ]);将byte强转为int不行吗?答案是不行的.

其原因在于:

1.byte的大小为8bits而int的大小为32bits

2.java的二进制采用的是补码形式。

在这里先温习下计算机基础理论

byte是一个字节保存的,有8个位,即8个0或者1,8位的第一个位是符号位,也就是说0000 0001代表的是数字1,1000

0001代表的就是-1,所以正数最大位0111 1111,也就是数字127

负数最大为1111 1111,也就是数字-128,上面说的是二进制原码。

但是在java中采用的是补码的形式,下面介绍下什么是补码

1、反码:

一个数如果是正,则它的反码与原码相同;

一个数如果是负,则符号位为1,其余各位是对原码取反;

2、补码:利用溢出,我们可以将减法变成加法

对于十进制数,从9得到5可用减法:

9-4=5 因为4+6=10,我们可以将6作为4的补数

改写为加法:

9+6=15(去掉高位1,也就是减10)得到5.

对于十六进制数,从c到5可用减法:

c-7=5 因为7+9=16

将9作为7的补数

改写为加法:

c+9=15(去掉高位1,也就是减16)得到5.

在计算机中,如果我们用1个字节表示一个数,一个字节有8位,超过8位就进1,在内存中情况为(100000000),进位1被丢弃。

⑴一个数为正,则它的原码、反码、补码相同

⑵一个数为负,刚符号位为1,其余各位是对原码取反,然后整个数加1

-1的原码为 10000001

-1的反码为 11111110

+ 1

-1的补码为 11111111

0的原码为 00000000

0的反码为 11111111(正零和负零的反码相同)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你使用pyquery库读取本地HTML文件时,报错"UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 1409: illegal multibyte sequence",这是由于编码问题导致的。根据引用的代码,你正在使用GBK编码来读取文件,但是文件包含了无法解码的多字节序列。为了解决这个问题,你可以在打开文件时指定编码为UTF-8,例如:file = open(f, "r", encoding="utf-8")。这样就能够正确地读取文件并避免编码错误了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [pyquery报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte](https://download.csdn.net/download/weixin_38665944/13751270)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 14: illegal multibyte ...](https://blog.csdn.net/m0_59856692/article/details/130932880)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [已解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 27: illegal multibyte ...](https://blog.csdn.net/weixin_53817810/article/details/131050449)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值