python输出结果存到文件拒绝访问_Python中的Scraper给出了“拒绝访问”

到现在为止我使用这段代码:

import bs4

import requests

def extract_source(url):

source=requests.get(url).text

return source

def extract_data(source):

soup=bs4.BeautifulSoup(source)

names=soup.findAll('title')

for i in names:

print i

extract_data(extract_source('https://www.justdial.com/Panipat/Saree-Retailers/nct-10420585'))

但是当我执行这段代码时,它给了我一个错误:

Access Denied

我该怎么做才能解决这个问题?

解决方法:

正如评论中提到的,您需要指定允许的用户代理并将其作为标头传递:

def extract_source(url):

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0'}

source=requests.get(url, headers=headers).text

return source

标签:python,python-requests,beautifulsoup

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值