lxml,etree简单爬取数据

最新推荐文章于 2023-08-04 10:51:06 发布

JoseThree

最新推荐文章于 2023-08-04 10:51:06 发布

阅读量332

点赞数 1

本文链接：https://blog.csdn.net/weixin_44419382/article/details/97569455

版权

# //div[@class='billboard-bd']//a/text()

import requests
from lxml import etree
url = 'https://movie.douban.com/'
headers = {'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'}

with requests.request("GET", url, headers=headers) as response:
    html = response.text
    # print(html)
    root = etree.HTML(html)
    print(root.tag)
    titles = root.xpath('//div[@class="billboard-bd"]//a/text()')
    print(titles)
    print(len(titles))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JoseThree

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lxml,etree简单爬取数据

# //div[@class='billboard-bd']//a/text()import requestsfrom lxml import etreeurl = 'https://movie.douban.com/'headers = {'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTM...
复制链接

扫一扫