![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python 网络爬虫
文章平均质量分 65
小杜℃
这个作者很懒,什么都没留下…
展开
-
Python解析本地html文件 数据存储为字典
xpath解析本地html文件原创 2022-07-11 23:51:54 · 1521 阅读 · 0 评论 -
selenium学习----Xpath
xpath 语法中,整个HTML文档根节点用'/‘表示,如果我们想选择的是根节点下面的html节点,则可以在搜索框输入, /有点像 CSS中的 > , 表示直接子节点关系。/html/body/div 绝对路径html>body>div 类似CSS#用法:elements = driver.find_elements(By.XPATH, "/html/body/div")选择示例页面的所有标签名为 div 的元素,如果使用css表达式,直接写一个 div 就行了。x原创 2022-04-30 15:43:40 · 708 阅读 · 0 评论 -
python 网络爬虫之下载图片 学习心得
爬取斗图 表情包 为例:这是一个单线程的爬取下载图片的代码import requestsfrom lxml import etreefrom urllib import requestimport reHEADERS = { 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) Appl...原创 2019-02-14 12:06:54 · 620 阅读 · 0 评论 -
python 网络爬虫之下载图片 多线程
以下载 斗图 表情包为例#-----utf-8-----import requestsfrom lxml import etreefrom urllib import requestimport reimport randomimport threadingfrom queue import Queueclass Producter(threading.Thread):...原创 2019-02-14 12:12:17 · 297 阅读 · 0 评论