python爬虫（三）

最新推荐文章于 2024-09-10 13:01:50 发布

luogan129

最新推荐文章于 2024-09-10 13:01:50 发布

阅读量328

点赞数

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/luogan129/article/details/55002334

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

爬虫手机端 headers

from bs4 import BeautifulSoup
import requests

headers = {
    'User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1',
}

url =  'http://www.tripadvisor.cn/Attractions-g294212-Activities-c47-oa190-Beijing.html'

mb_data = requests.get(url,headers=headers)
soup    = BeautifulSoup(mb_data.text,'lxml')
titles   = soup.select('.title.titleLLR > .location')
names    = soup.select('.overflowEllipsis > .rs.popularityLLR.overflowEllipsis')
imgs    = soup.select('div.thumb.thumbLLR.soThumb > img')


for title,name,img in zip(titles,names,imgs):
    data = {
        'title':title.get_text(),
        'name':name.get_text(),
        'img':img.get('src')
    }
    print(data)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

luogan129

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫（三）

爬虫手机端 headersfrom bs4 import BeautifulSoupimport requestsheaders = { 'User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobi
复制链接

扫一扫