python爬取图片失败显示404_使用Python的Web爬网给出HTTP错误404：找不到

最新推荐文章于 2024-07-02 12:36:15 发布

weixin_39714191

最新推荐文章于 2024-07-02 12:36:15 发布

阅读量771

点赞数

文章标签： python爬取图片失败显示404

新手使用Python进行Web爬虫时，在尝试从Transfermarkt网站抓取足球数据时遇到了HTTP 404错误。问题出在用户代理可能被服务器拒绝。解决方案是设置请求头，模拟浏览器访问，避免被识别为爬虫。

摘要由CSDN通过智能技术生成

I am brand new to Python and have not very good at it. I am trying to web scrape from a website called Transfermarkt (I'm a big football fan) but its giving me HTTP Error 404 when I try extract data. Here is my code:

from urllib.request import urlopen as uReq

from bs4 import BeautifulSoup as soup

my_url = "https://www.transfermarkt.com/chelsea-fc/leihspielerhistorie/verein/631/plus/1?saison_id=2018&leihe=ist"

uClient = uReq(my_url)

page_html = uClient.read()

uClient.close()

page_soup = soup(page_html, "html.parser")

for che in chelsea:

player = che.tbody.tr.td.table.tbody.tr.td["spielprofil_tooltip tooltipstered"]

print("player: " +player)

Error says:

Traceback (most recent call last):

File "C:\Users\x15476582\Deskto

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39714191

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

问题记录-python写mapper测试时出现urllib.error.HTTPError: HTTP Error 404: Not Found

学在途中

05-12

1万+

hadoop@ub1401:~/python/pythonfile$ cat keyword.txt sheep 2 dog,3 firework 3 hadoop@ub1401:~/python/pythonfile$ cat keyword.txt | ./mappertest1-1.py Traceback (most recent call last): File "./mappert

python爬取图片失败显示404_python3.7中Web抓取时出现http404错误

weixin_29558841的博客

02-04

1288

我收到404错误代码(如下所示)当尝试对某个网站进行网页抓取时。在我试着在不同的论坛上寻找答案，但找不到解决办法有人有解决方案来修复这个404错误吗？>>> from urllib.request import urlopen as uReq>>> from urllib.request import Request>>> from bs4 i...

参与评论您还未登录，请先登录后发表或查看评论

python报错：urllib.error.HTTPError: HTTP Error 404: Not Found 怎么解决请教大神

最新发布

屿小夏.的知识博客

07-02

1906

在使用Python的urllib库中的urlopen或urlretrieve函数下载文件时，有时会遇到“HTTP Error 403: Forbidden”的错误。这段代码尝试使用urlopen直接打开一个可能需要特定权限的URL，如果没有提供必要的请求头或身份验证信息，服务器可能会返回403 Forbidden错误。在这个示例中，我们通过添加一个常见的浏览器User-Agent来模拟浏览器行为，这有时可以绕过服务器的访问控制。

python web.py 404_urllib2.HTTPError：HTTP错误404：未找到

weixin_39584529的博客

12-21

760

My Error Message when running my python scripts using a raspberry piTraceback (most recent call last):>Traceback (most recent call last):File "test.py", line 6, in (module)import appengineauthFile ...

python爬取图片失败显示404_图像不显示在django得到404

weixin_39862985的博客

12-04

368

我遵循了django官方的图像字段文档，我可以将图像存储在数据库中，但是当我试图在浏览器中显示它时，我得到了404错误。在我的设置文件TEMPLATES = [{'BACKEND': 'django.template.backends.django.DjangoTemplates','DIRS': [os.path.join(BASE_DIR,"templates")],'APP_DIRS': T...

入门用Python进行Web爬取数据：为数据科学项目提取数据的有效方法

TensorFlowNews

09-30

1016

作者|LAKSHAY ARORA 编译|Flin 来源|analyticsvidhya 总览 Web抓取是一种从网站提取数据的高效方法（取决于网站的规定）了解如何使用流行的BeautifulSoup库在Python中执行网页抓取我们将介绍可以抓取的不同类型的数据，例如文本和图像介绍我们拥有的数据太少，无法建立机器学习模型。我们需要更多数据！如果这句话听起来很熟悉，那么你并不孤单！希望获得更多数据来训练我们的机器学习模型是一个一直困扰人们的问题。我们无法在数据科学项目中获得可以直接使用的E

利用Python实现爬取彩票网站数据——小样

weixin_34297300的博客

04-19

2054

写这篇文章纯属自娱自乐。主要是近期在自学如何利用Python解决IT运维的一些问题时，总是不得其门而入，为了增加学习兴趣，就想通过完成一个小小有趣的爬虫程序激励下自己，同时也把这次经历跟各位道友分享下。Technorati Tags: Python,爬网,×××,数据,夏明亮首先申明，本人不是专职coding的，所以，代码部分如果不符合专业审美，还请多多包涵；俺就是纯粹以实习...

Python程序员都在用的20个网页爬虫工具

Python学习笔记

09-04

2035

网络爬虫在许多领域都有广泛的应用，它的目标是从网站获取新的数据，并加以存储以方便访问。而网络爬虫工具越来越为人们所熟知，因为它能简化并自动化整个爬虫过程，使每个人都可以轻松访问网络数据资源。 1. Octoparse Octoparse是一个免费且功能强大的网站爬虫工具，用于从网站上提取需要的各种类型的数据。它有两种学习模式 - 向导模式和高级模式，所以非程序员也可以使用。可以下载几乎所有的...

chrome 抓取图片_利用chrome开发工具进行动态网页抓取

weixin_26755331的博客

09-06

3742

chrome 抓取图片So you have a website you want to scrape? But don’t necessarily know what package to use or how to go about the process. This is common when first starting out web scraping. Understanding h...

AWVS工具介绍

Auscoo111的博客

11-05

1万+

AWVS基本操作　　AWVS工具在网络安全行业中占据着举足轻重的地位，作为一名安全服务工程师，AWVS这款工具在给安全人员做渗透测试工作时带来了巨大的方便，大大的提高了工作效率。 AWVS工具介绍　　Acunetix Web Vulnerability Scanner(简称AWVS)是一款知名的Web网络漏洞扫描工具，它通过网络爬虫测试你的网站安全，检测流行安全漏洞。它包含有收费和免...

python3判断url链接是否为404的方法

09-20

主要介绍了python3判断url链接是否为404的方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

python 404_Python请求获得404响应

weixin_42524004的博客

02-09

1812

我在其他几个vbulletin论坛上使用过同样的脚本，除了这个网站，它对所有论坛都有效。我找了又找，找错别字等等。。。只是想不通。我创建了一个虚拟用户帐户来登录。在网站=www.thereftank.com网站用户名imadummy密码MyDumIma123这是我的代码，我得到一个404响应，我不知道。在import requestsr = requests.session()forumURL =...

Python爬取网页提示状态码404，浏览器可访问网址

weixin_44302370的博客

04-11

8580

Python爬取网页提示状态码404，浏览器可访问网址错误原因原因正确修改错误原因 url = "https://www.ip138.com/iplookup.asp?ip=222.222.64.194&action=2" try: r = requests.get(url) print(r.status_code) r.raise_for_status() r.encoding = r.apparent_encoding

python 爬虫基础（一）：访问网页时候，总是报错404错误

科大小笨的博客

08-31

9189

python 爬虫访问网页时候，总是报错404错误> 如题，可能是因为没有增加header，网站认为你在非法攻击。可以用如下代码调试代码块语法遵循标准markdown代码，例如：import urllib2 import jsonpath import time # get city idrequest_city= urllib2.Request("http://www.xj.10086.cn/s

requests爬虫遇到404怎么办_如何解决python爬虫requests.get()遇到的418问题

weixin_31361715的博客

02-11

3989

如何解决python爬虫——遇到requests.get()访问得到418问题在爬虫时候，通过requests.get()得到不正确的状态码：4**：表示出错403问题：服务器已经理解请求，但是拒绝执行它418问题：网站的反爬程序返回的其他HTTP状态码查找可以参考：https://baike.baidu.com/item/HTTP%E7%8A%B6%E6%80%81%E7%A0%81/50536...

Python实现404页面识别实践

浪子燕青的博客

03-18

1926

“你说我虽然是个普通人，我也想人家关注我啊，我也想有女孩喜欢我啊，我也想有什么东西可以吹牛啊......总不能因为我没本事很普通，就当一辈子的路人甲吧？那有什么意思啊？可在家里我真的是什么都没有，”他摊了摊手，“什么都没有......我饿了，你有没有什么吃的？” 阅读提要全文约4.8K字，大致阅读完约6分钟，包含主要知识点：HTTP状态码，网页跳转方式，404错误页面种类，定制型网址404识别，通用型404页面识别，其中关键部位文字使用橙色重点标注，网址使用绿色重点标注，具体代码结果保存在文末。目

python爬虫

weixin_30613433的博客

06-14

261

爬虫介绍爬虫定义爬虫基本流程爬虫介绍爬虫定义爬虫是请求网站并提取自己所需要数据的过程。通过我们的程序，可以代替我们向服务器发送请求，然后进行批量的数据下载。爬虫基本流程发起请求通过url向服务器发送requests请求，请求可以包含额外的header信息。2.获取响应内容如果服务器正常响应，那么将受到一个response，response即为我们所请求的网页内容，可能包含html\js...

爬取虫404解决办法python_程序员的Python爬虫学习——写出最简单的网页爬虫

weixin_29728529的博客

01-27

1925

在我们日常上网浏览网页的时候，经常会看到一些好看的图片，我们就希望把这些图片保存下载，或者用户用来做桌面壁纸，或者用来做设计的素材。我们可以通过python 来实现这样一个简单的爬虫功能，把我们想要的代码爬取到本地。下面就看看如何使用python来实现这样一个功能。开发工具笔者使用的工具是sublimetext3，它的短小精悍(可能男人们都不喜欢这个词)使我十分着迷。推荐大家使用，当然如果你的电脑...