python的服务器、客户端被拒绝访问_Python中的Scraper提供了“访问被拒绝”

最新推荐文章于 2024-03-04 08:58:50 发布

weixin_40000131

最新推荐文章于 2024-03-04 08:58:50 发布

阅读量136

点赞数

文章标签： python的服务器、客户端被拒绝访问

I'm trying to code a scraper in Python to get some info from a page. Like the title of the offers that appear on this page:

https://www.justdial.com/Panipat/Saree-Retailers/nct-10420585

By now I use this code :

import bs4

import requests

def extract_source(url):

source=requests.get(url).text

return source

def extract_data(source):

soup=bs4.BeautifulSoup(source)

names=soup.findAll('title')

for i in names:

print i

extract_data(extract_source('https://www.justdial.com/Panipat/Saree-Retailers/nct-10420585'))

But when I execute this code, it gives me an error:

Access Denied

What can I do to solve this?

解决方案

As was mentioned in comments, you need to specify allowable user-agent and pass it as headers:

def extract_source(url):

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0'}

source=requests.get(url, headers=headers).text

return source

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_40000131

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python工作流引擎开源_7 款 Python 开源框架的优劣总结

weixin_39525097的博客

12-15

1772

学习任何一门开发语言都离不开框架，一个框架就好比是一个毛坯房，只需要我们装修就可以入住。如果没有框架我们就只能一砖一瓦的去盖楼房了。框架的种类很多，具体选择要根据实际的业务情况。下面就简单的介绍一下Python七款开源框架的优劣。DjangoDjango 应该是最出名的Python框架，GAE甚至Erlang都有框架受它影响。Django是走大而全的方向，它最出名的是其全自动化的管理后台：只需要使...

python服务器搭建实战_自己搭建的简单的Python服务器运行时提示权限被拒绝

weixin_39613824的博客

12-14

"""用python实现一个HTTP Web服务器,它知道如何运行服务器端CGI脚本从当前工作目录提供文件和脚本Python脚本必须存储在webdir\cgi-bin或webdir\htbin"""import osfrom http.server import HTTPServer, CGIHTTPRequestHandlerwebdir = "." # 存放HTML文件和cgi-bin脚本文...

参与评论您还未登录，请先登录后发表或查看评论

python拒绝访问_浏览器工作时,Python urllib被拒绝访问

weixin_39819283的博客

12-03

296

urllib2(和类似的urllib)的用户代理头是“Python-urllib / 2.7”(由你的Python版本替换2.7).您收到403错误,因为NASDAQ服务器似乎不想向此用户代理发送内容.您可以“欺骗”用户代理标头,然后成功下载.这是一个最小的例子：import urllib2DOWNLOAD_URL = 'http://www.nasdaq.com/screening/compan...

python的服务器、客户端被拒绝访问,拒绝访问您无权访问“网站”在服务器上使用ChromeDriver和Chrome通过Selenium Python...

weixin_35196909的博客

02-21

900

I've been using selenium with chrome and I've been trying to access a website but I keep receiving this error message:Access Denied You don't have permission to access "website" on this server.The web...

python.org打不开解决办法

yuze2020的博客

11-14

1万+

今天我听说python3.9出来了，于是想下一个，结果出来一个: 无法访问此网站找不到www.python.org的服务器 IP 地址。尝试运行 Windows 网络诊断。 DNS_PROBE_FINISHED_NXDOMAIN jb都能打开，python打不开了？？解决办法打开cmd（不用管理员），输入 ping python.org 接着，将会输出反正是类似这样的，红笔圈的地方只要不是100%丢失就好你只需要看蓝笔涂了的部分，比如：11.11.1...

python官网进不去怎么办,python官方网站地址

最新发布

2301_81895257的博客

03-04

661

IDLE是Python的集成开发和学习环境，全称Integrated Development and Learning Environment，是一个可视化的shell命令行，是一个简单的命令运行窗口，安装后在电脑开始菜单(windows桌面左下角)中生成IDLE快捷方式。图3-1左边是稳定发布版本Stable Releases，右边是预发布版本Pre-releases，前者是经过测试，相对完善、稳定的版本，后者还处于测试中，可能不完善，因此，我们下载左边的稳定发布版本Stable Releases。

django_dynamic_scraper-0.12.4：Python Django后端开发库

资源摘要信息:"django_dynamic_scraper是一个Python库，专门为Django框架设计，用于实现动态网页的抓取。该库版本为0.12.4，并支持Python 3，能够在任何操作系统上运行，不需要任何额外的依赖。" 知识点: 1. ...

wiki_nixos_org-scraper-源码.rar

10-10

总的来说，"wiki_nixos_org-scraper-源码.rar"提供了一个了解NixOS生态系统，学习网页抓取技术以及熟悉NixOS配置管理的宝贵资源。无论是为了个人学习还是实际项目需求，深入研究这份源码都将对提升你的IT技能...

2019WebScraper:我于2019年在瑞士留学期间使用python创建的Web刮板

03-11

【2019WebScraper】是一个基于Python的网络数据抓取工具，是作者在瑞士留学期间为了获取特定网页信息而开发的项目。这个项目展示了Python在数据爬取领域的强大功能，尤其对于需要定期更新或大量收集网络信息的场景，...

taylor-ecommerce:版本2。实现react-bootstrap。该项目正在进行中。我正在为我的gf建立一个功能全面的电子商务网站。我已经制作了一个Pythonselenium脚本，该脚本将抓取她所有从poshmark，merari，facebook和ebay上转售的衣服。他们被添加到一个Excel。我将它们添加到MongoDB的数据库中。该客户端将做出React并进行还原。该服务器将是node，express和mongodb。全面响应

03-22

在这个项目中，React将用于创建客户端部分，提供动态交互和高效的组件化开发。 2. **React-Bootstrap**：这是一个基于Bootstrap的React组件库，用于简化响应式网页设计。它提供了预定义的样式和布局，帮助快速构建...

解决启动django,浏览器显示“服务器拒绝访问”的问题

12-17

这个问题用了我整整一晚上的时间才解决，希望有人遇到和我一样的时能少走些弯路。启动Django，服务器拒绝访问，可以尝试以下方法解决： 1. 没有开启允许访问编辑你所创建项目(HelloWorld)目录下settings.py，把其中的 ALLOWED_HOSTS=[] 修改为 ALLOWED_HOSTS=[‘*’] // ‘*’表示任意地址 2.Django版本太高（SQLite3版本太低）运行python3 manage.py runserver 0.0.0.0:8000报错： django.core.exceptions.ImproperlyConfigured: SQLite

【笔记-python】关于无法进入python官网的解决办法[该方法所有网站都适用]

热门推荐

胡先森i的博客

07-10

2万+

【笔记-python】关于无法进入python官网的解决办法[该方法所有网站都适用] 修改host文件完美解决

python自动化部署好后客户端只能打开服务器端浏览器_解决启动django,浏览器显示“服务器拒绝访问”的问题...

weixin_39868034的博客

12-05

265

这个问题用了我整整一晚上的时间才解决，希望有人遇到和我一样的时能少走些弯路。启动Django，服务器拒绝访问，可以尝试以下方法解决：1. 没有开启允许访问编辑你所创建项目(HelloWorld)目录下settings.py，把其中的ALLOWED_HOSTS=[] 修改为 ALLOWED_HOSTS=['*'] // '*'表示任意地址2.Django版本太高(SQLite3版本太低)运行pyth...

python android api_服务器python 安卓接口

weixin_39957461的博客

12-01

909

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":6,"count":6}]},"card":[{"des":"云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务，助您降低 IT 成本，提升运维效率，使您更专注于核心业务创新。",...

linux中使用get或者put，进行文件上传或者下载时，Permission denied(拒绝访问)

代码君的博客

07-05

1万+

今天从linux中备份数据库，生成的一个dmp文件，刚想把这个文件拿下来放到我本地路径上，在sftp中使用get命令是，总是提示我Permission denied(拒绝访问)然后我想了想，会不会是这个文件权限的问题。然后我把这个文件的权限改了一下 chmod 777文件名然后重新get一下，结果还是提示 Permission denied(拒绝访问)然后又想了想，会不会是这个文件所在的目录下面...

Python库board_game_scraper新版本发布

board_game_scraper-2.0.3-py2.py3-none-any.whl文件名中的“py2.py3”表示该wheel文件同时兼容Python2和Python3，这是为了确保它可以在不同版本的Python环境中正常安装和运行。开发者在安装此类库时，应确保其开发...