爬取的页面如何判断是否更新

最新推荐文章于 2022-07-03 21:01:49 发布

三人一木T

最新推荐文章于 2022-07-03 21:01:49 发布

阅读量830

点赞数 1

文章标签：爬虫网页检测是否更新比较同一网页的不同时间的爬取

本文链接：https://blog.csdn.net/qq_41552533/article/details/88036571

版权

哈希函数

第一获取：

import hashlib

md5 = hashlib.md5()

md5.update('qianfengpython'.encode('utf-8'))

print(md5.hexdigest())

输出：2b036a15be73f4446e661d95e8e9603c

比较时需要再次创建一个md5，如果没有再次创建，直接md5.update()则会再原来的基础上更新，哈希出来的哈希值一定不同

第二次获取：

md5_compare = hashlib.md5()

md5_compare.update('qianfengpython'.encode('utf-8'))

print(md5_compare.hexdigest())

输出为：2b036a15be73f4446e661d95e8e9603c

两者相同

注意：
使用以下命令：
md5.update(‘qianfengpython’)

报以下错：
Traceback (most recent call last):
File “”, line 1, in
TypeError: Unicode-objects must be encoded before hashing

再用：
md5.update(‘qianfengpython’.encode(‘utf-8’))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

三人一木T

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬取的页面如何判断是否更新

哈希函数第一获取：import hashlibmd5 = hashlib.md5()md5.update('qianfengpython'.encode('utf-8'))print(md5.hexdigest())输出：2b036a15be73f4446e661d95e8e9603c比较时需要再次创建一个md5，如果没有再次创建，直接md5.update()则会再原来的基...
复制链接

扫一扫