python爬虫Beautiful Soup基础知识--第一篇get方式获取网页内容 apparent_encoding获取网页源码的编码方式,encoding从网页响应的header中,提取charset字段中的编码,若header中没有charset字段,则默认为ISO-8859-1编码模式,ISO-8859-1编码无法解析中文,这也是中文乱码的原因。,使用 requests 提供的方法向指定 URL 发送 HTTP 请求,返回一个 response 对象,该对象包含了具体的响应信息,如状态码、响应头、响应内容等。html.parser是一个用于解析HTML的解析器。
C语言强制类型转化的几个难点(一篇文章就可搞懂) (这里补充我自己的一个疑惑吧,既然int型可以有正整数和负整数,那为什么需要无符号数呢,我是这样想的,无符号数强制数据是正数,计算机是以地址方式来找数据,而地址其实也是需要大量的存储空间,且大多数是正数,那么这种类型就变得非常重要了)再看看第三种,因为short转int类型是短的转长的,所以可以保证数据不会丢失,因此符号位保留,short的15bit数据位放到最后,然后按照符号位扩展,中间补0/1。无符号数:通常指的是自然数,在计算机中通常是以原码存在,且最高位也是数值位而非符号位。
原码的除法运算(恢复余数法和加减交替法),补码的除法运算(加减交替法) x/y都先取绝对值,然后默认先上商1,如果计算的余数符号位为1,说明余数为负数,表示搞错了,计算机要恢复余数,加上[|y|]补,然后把商改为0,左移一位。如果余数为负将商改为0然后直接跳到下一次上商1的地方,忽略恢复余数的过程,其中操作直接等价于先将余数左移一位,再加上|余数|,得到下一个余数。值得注意的是:加减交替法最后一次如果余数为负,要改商为0,并且要加[|y|]补码来恢复余数。若余数为正,直接左移,再+[-|y|]补码,得到新的下一个余数。符号位:通过异或运算得到。加减交替法:如下图所示,
计算机各部件之间的层次结构以及协调工作原理 初始化PC指向第一条存储地址,即MAR等于0,然后存储器找到MAR=0的存储单元内容,取出里面的存储单元放到数据存储器MDR,MAR将指令送给指令存储器IR,IR取出指令的操作码给CU(操作码可以指明要进行什么操作,比如000001是取数操作),然后将指令的地址码给MAR,同样将从存储体中的到的存储单元放到MDR中,即0000000000000010,最后MDR将取出的数送回给累加器ACC 中。取指周期从内存中取出的是指令,而执行周期从内存取出或往内存中写入的是数据。运算器:了解各部件存放的是什么数据吧。