2021_12_04_自学笔记_获取百度网站的百度一下

# _*_ coding : utf-8 _*_
# @Time : 2021/12/4 17:50
# @Author : Harken

# 1.获取网页源码
# 2.解析  解析的服务器响应的文件  etree.HTML
# 3.打印

import urllib.request

url = 'https://www.baidu.com/'
headers = {
    'User-Agent': ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'
}
# 请求对象定制
request = urllib.request.Request(url = url,headers=headers)
#模拟浏览器访问服务器
respons = urllib.request.urlopen(request)
# 获取网页源码
content = respons.read().decode('utf-8')
# 解析网页源码来获取想要的数据
from lxml import etree
# 解析服务器响应的文件
tree = etree.HTML(content)
# 获取想要的数据 xpath返回的值是一个列表类型的数据  可通过列表下标访问[0]
result = tree.xpath('//input[@id="su"]/@value')[0]
print(result)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值