自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 百度网页数据采集

查询新闻栏的标签内容,粘贴xpath路径。导入lxml库的etree包。获取新闻的xpath路径。使用etree解析网页。下面类型一样依次这样。

2023-10-15 20:19:40 1180 1

原创 jpsall脚本

【代码】jpsall脚本。

2023-10-04 20:56:22 136 1

原创 Xpath表达法

【代码】Xpath表达法。

2023-09-28 14:26:04 76

原创 SSH登录出现“Host key verification failed.“

如果实在不行删掉虚拟机重新来一遍。然后重新进入免密过程。

2023-09-24 13:38:06 1069 1

原创 网页结构分析

(一)网页请求获取图片请求的网址。https://wx3.sinaimg.cn/large/007e4nGQly1hh95t81v1pj36bk47su1a.jpg 打开开发者模式。 查找请求头。 获取请求方式-get。(二)新建Python文件(三)图片采集导入request包。 import requests 获取图片地址。 import requests#图片地址img_url = 'https://wx3.sinaimg.cn/large/007e4n

2023-09-17 13:59:10 128 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除