python 爬虫之beautifulsoup（bs4）使用 --待完善

最新推荐文章于 2024-08-03 19:27:22 发布

weixin_33922672

最新推荐文章于 2024-08-03 19:27:22 发布

阅读量84

点赞数

文章标签： python 爬虫

原文链接：http://www.cnblogs.com/longesang/p/10494166.html

版权

#!/usr/bin/env python
# -*- coding:utf-8 -*-
from bs4 import BeautifulSoup
import requests

url = 'http://www.jd.com/'
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
}
#User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36
web_date = requests.get(url,headers=headers)
soup = BeautifulSoup(web_date.text,'lxml')
print soup

headers表示头文件，伪装成浏览器浏览网页

wb_data网页数据requests.get请求访问(url网页京东,headers伪装的头文件）

soup解析后的数据BeautifulSoup解析数据(wb_data网页数据,lxml解析的格式按这个要求解析)

打印结果如下：

转载于:https://www.cnblogs.com/longesang/p/10494166.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33922672

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫之beautifulsoup（bs4）使用 --待完善

#!/usr/bin/env python# -*- coding:utf-8 -*-from bs4 import BeautifulSoupimport requestsurl = 'http://www.jd.com/'headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWeb...
复制链接

扫一扫