自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Python 内置的二分库 bisect

bisect 是 Python 内置的一个二分查找库,功能是查找给定值在一个有序列表中的插入位置,插入该值后,列表仍然保持有序。查找插入 x 后能保证数组依然有序的最左边的位置。(同 bisect)(同 insort)

2024-03-14 18:34:11 550

原创 图片数据的爬取

2.数据解析:解析出页面源码中图片的存储位置(此处初步使用了xpath方法爬取,具体方法见xpath文章),本次爬取的内容为'https://pic.netbian.com/4kmeinv/'图片网址中的图片内容。4.持久化存储:建立循环,遍历每一张图片,并将每一张图片保存到本地。3.创建保存图片的地址。1.爬取页面源码数据。

2023-11-01 16:35:10 96 1

原创 百度翻译+豆掰榜单+kfc餐厅查询的爬取

对百度翻译的单词进行爬取,并获取该单词的翻译解释的json格式爬取的网站地址对应为代码中的url部分:复制后访问即可json格式的结果,可将获得的结果复制后,在网上找寻json格式化的工具,进行格式化解析json解析后的结果:百度翻译:sug对百度翻译进行动态的网页数据采集时(如dog)使用页面检查并xhr无法导出sug文件,动态,检测时再输入需要翻译的word。

2023-10-31 18:32:11 390 1

原创 requests模块

概念 : python中原生的一款基于网络请求的模块,功能强大简单便捷,效率高。使用:(requests模块的编码流程)实现一个简易的网易采集器。作用:模拟浏览器发请求。

2023-10-31 18:00:01 63 1

原创 User-Agent的获取和常用的User-Agent

2..开发者工具:在大多数现代浏览器中,打开开发者工具(一般按F12键或右键点击页面选择"检查")后,切换到"网络"或"网络请求"选项卡,然后刷新页面或加载新页面。在请求头的"User-Agent"字段中,可以找到当前浏览器的User-Agent信息。JavaScript:在前端使用 JavaScript,可以通过。获取User-Agent。

2023-10-31 17:51:28 9418 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除