一起学python爬虫第四天

最新推荐文章于 2024-08-26 13:41:43 发布

陆岑卿

最新推荐文章于 2024-08-26 13:41:43 发布

阅读量155

点赞数 2

分类专栏：个人 python爬虫文章标签： requests库爬虫新浪新闻参数传递 F12开发者工具

陆岑卿

本文链接：https://blog.csdn.net/program_Mr_lu/article/details/111656277

版权

个人同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

python爬虫

4 篇文章 0 订阅

订阅专栏

今天我们写一爬取新浪新闻的小项目。
爬取一个数据的时候我们第一步肯定就是要找到这个网址，比如我们去找朋友去玩，首先肯定得知道这个朋友家的地址吧。

http://search.sina.com.cn/

url双手奉上

进入网页按下F12，第一次去朋友家肯定得需要确认一下是不是朋友
在这里插入图片描述
如果不是我们就继续找，如果是就是拜访朋友

import requests

response = requests.get(url='http://search.sina.com.cn/')

print(response.text)

打印出来的结果就是网页源代码
在这里插入图片描述
然而我们看到的界面是具备搜索功能的

这就需要用到params
当我们输入一个百度的时候

就会看到有个

这个是我们需要找的内容，就需要在代码中加上

name = input("请输入查找的内容：")
params = {
    'q': name,
    'c': 'news',
    'from': 'index'
}

下面是完整的代码。

import requests
name = input("请输入查找的内容：")
params = {
    'q': name,
    'c': 'news',
    'from': 'index'
}

response = requests.get(url='http://search.sina.com.cn/', params=params)

print(response.url)

我们打印的是输入需要查找的内容的url，效果如下：
在这里插入图片描述今天就分享到这里啦。拜拜啦!

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陆岑卿

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python爬虫数据可视化_python爬虫可视化

2401_84692299的博客

04-29

631

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。爬取数据：此方法只适用于表格。

Python爬虫入门教程（非常详细）_python爬虫自学

04-27

1446

设k值为3，即每抓取3个页面后，重新计算一次PageRank值。

1 条评论您还未登录，请先登录后发表或查看评论

【Python爬虫】10个Python爬虫入门实例！快来一起学习吧！！！

lhx1771584985的博客

06-05

1932

在数字时代，数据成为了我们生活和工作中不可或缺的一部分。想象一下，如果你需要快速获取某个城市的天气信息，但又不希望打开繁琐的网页，这时Python爬虫就能派上用场了。今天，我们就来分享一个关于Python爬虫的实战案例——抓取天气信息。首先，我们需要选择一个提供天气数据的网站，比如中国天气网。然后，利用Python的requests库发送HTTP请求，获取网页的HTML内容。接下来，我们需要对HTML进行解析，以提取出我们需要的天气数据。

爬虫可以做什么？Python爬虫入门必看保姆级教程！（学习资源+学习路线）

最新发布

2301_78095812的博客

08-26

1699

Python爬虫，也称为Python网络爬虫或网页蜘蛛，是一种使用Python编程语言编写的程序，用于自动地抓取互联网上的信息。这种程序按照预设的规则，模拟浏览器请求站点的行为，从网站上抓取数据并进行分析提取。Python爬虫的工作原理可以大致分为以下几个步骤：1.发起请求：使用Python的HTTP库（如requests库）向目标网站发起请求，发送一个包含请求头、请求体等信息的Request。

常用Python爬虫库汇总（建议收藏）

2301_82275412的博客

04-12

1615

很多人学Python，都是从爬虫开始的，毕竟网上类似的资源很丰富，开源项目也非常多。Python学习网络爬虫主要分3个大的版块：当我们在浏览器中输入一个url后回车，后台会发生什么？简单来说这段过程发生了以下四个步骤：•查找域名对应的IP地址•向IP对应的服务器发送请求•服务器响应请求，发回网页内容•浏览器解析网页内容。

Python爬虫介绍

2301_82275412的博客

04-18

1015

爬虫：一段自动抓取互联网信息的程序，从互联网上抓取对于我们有价值的信息。

超牛逼！Python爬虫学习的完整路线推荐_爬虫三部曲

2401_84139697的博客

05-02

2163

商机发现：招投标情报发现、客户资料发掘、企业客户发现等进行爬虫学习，首先要懂得是，那些我们肉眼可见的光鲜亮丽的网页是由这些源码被浏览器所识别转换成我们看到的网页，这些源码里面必定存在着很多**。**无规矩不成方圆，就是爬虫中的规矩，它告诉爬虫和搜索引擎哪些页面可以抓取，哪些不可以抓取。通常是一个叫作robots.txt的文本文件，放在网站的根目录下。**“获取数据——解析数据——存储数据”**是爬虫的三部曲，大部分爬虫都是按这样的流程来进行，这其实也是模拟了我们使用浏览器获取网页信息的过程。

Python爬虫系列（一）——手把手教你写Python爬虫

lvaolan8888的博客

04-18

1777

根据百度百科的定义，网络爬虫，又称为网页蜘蛛，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。人们如今的生活，大都离不开网络，发一条微信，电子支付买一杯奶茶，刷一条微博，等等，都依赖于网络的便携性。但是，互联网茁壮成长的同时，海量的信息每天也会以指数级增长的方式充斥到网络环境中，那么如何快速高效地找到我们需要的信息，成为了很关键的功能，于是搜索引擎诞生了。搜索引擎替我们把很多网络信息做了筛选，当我们查询某项内容时，搜索引擎可以计算出一个排名，来展现查询相关的内容。

Python爬虫的基本概念、分类、学习路线以及爬取数据思路_python爬虫和数据分析方向

2401_84564025的博客

05-02

820

搜索引擎用的爬虫系统。

Python爬虫之美丽的汤——BeautifulSoup

weixin_72906726的博客

05-14

2108

本篇文章主要介绍利用Python爬虫之美丽的汤——BeautifulSoup，适合练习爬虫基础同学，文中描述和代码示例很详细，干货满满，感兴趣的小伙伴快来一起学习吧！

学习记录Python- 小练习，包含一个Python爬虫

02-02

让我们一起揭开Python爬虫的神秘面纱。首先，我们要了解什么是网络爬虫。网络爬虫是一种自动化程序，它按照一定的规则在网络上抓取信息。在Python中，我们通常使用requests库来发送HTTP请求获取网页内容，然后用...

一起学python爬虫第五天

program_Mr_lu的博客

12-28

150

今天将一下cookie和session 什么是 cookie 和 session？ cookie 是网站用来辨别用户身份，进行会话跟踪，存储在本地终端上的数据。 session（会话）本来含义是指有始有终的一系列动作和消息。在 web 中，session 主要用来在服务器端存储特定用户对象会话所需要的信息。 cookie 和 session 产生的原因： http 协议是一个无状态协议，在特定操作的时候，需要保存信息，进而产生了 cookie和 session cookie 原理： cookie 由服务器

__init__() got an unexpected keyword argument ‘options‘

program_Mr_lu的博客

11-26

9212

我们在学习爬虫中如果出现这个错误： Traceback (most recent call last): File “E:/pythonwork/第三阶段/day06/1.selenium结合Chrome浏览器.py”, line 18, in driver = webdriver.Chrome(executable_path=r’E:\软\chromedriver_win32\chromedriver.exe’, options=options) TypeError: init() got an une

每个进制之间的转换

program_Mr_lu的博客

12-10

1937

什么是进制？进制也就是进位计数制，是人为定义的带进位的计数方法（有不带进位的计数方法，比如原始的结绳计数法，唱票时常用的“正”字计数法，以及类似的tally mark计数）。对于任何一种进制—X进制，就表示每一位置上的数运算时都是逢X进一位。十进制是逢十进一，十六进制是逢十六进一，二进制就是逢二进一，以此类推，x进制就是逢x进位。我们常用的进制有：二进制、八进制、十进制、十六进制。 ** 进制转换** 　在数字后面加上不同的字母来表示不同的进位制。B（Binary)表示二进制，O（Octal）表示八进

异常报错：Message: Currently focused window has been closed.

program_Mr_lu的博客

11-26

1348

selenium.common.exceptions.NoSuchWindowException: Message: Currently focused 解决方案：第一步：打开IE，工具->Internet选项->高级->重置，弹出窗口，选项“删除个人设置”打上勾，确定重置，回到原始默认状态；（如果出现需要关闭打开的，就在资源管理器中找到你打开的相关文件，然后关闭再进行操作）第二部：打开IE，工具->Internet选项->安全四个图标都中的启用保护模式都勾选然后

Pyinstaller 打包程序出现.No module named 错误

program_Mr_lu的博客

06-24

1280

当我们使用Python打包成exe的时候，会出现 No module named 'xxxxx’，这个表示没有这个模块，有很多人就会安装，或者执行一下源代码，发现有这个模块或者可以执行源程序。我也是百度了很多遍终于把这个问题解决了。 pyinstaller -F xx.py --hidden-import sklearn.neighbors.typedefs 执行这条命令就可。 ...

ubuntu进入数据库报Can‘t connect to local MySQL server through socket ‘/var/run/mysqld/mysqld.sock‘ (2)的错误

program_Mr_lu的博客

04-23

1045

这个是我解决的办法：可能是权限的问题。首先在终端上： cd /var/lib/mysql 查看是否有mysql 再输入： chown -R mysql:mysql /var/lib/mysql 接着启动服务器，终端输入： /etc/init.d/mysql start 然后登录mysql 看看可以启动了吗？ mysql -u root -p 如果有更高的解决办法请留意评论。一起讨论！ ...

PyQt5基础学习

program_Mr_lu的博客

06-11

596

pyqt5-基础 PyQt5是一套来自Digia的Qt5应用框架和Python的粘合剂。支持Python2.x和Python3.x版本。 PyQt5以一套Python模块的形式来实现功能。它包含了超过620个类，600个方法和函数。它是一个多平台的工具套件，它可以运行在所有的主流操作系统中，包含Unix，Windows和Mac OS。PyQt5采用双重许可模式。开发者可以在GPL和社区授权之间选择。 PyQt5的类被划分在几个模块中，下面列出了这些模块： QtCore ：模块包含了非GUI的功能设计。这个

list index out of range错误

program_Mr_lu的博客

11-26

480

div_list = html.xpath('//div[@class="detail"]') for div in div_list: # 获取书名 title = div.xpath('./div[@class="title"]/a/text()')[0] # 获取评分 rating_nums = div.xpath('.//span[@class="rating_nums"]/text()')[0] #获取评论 pinglun = div.xpath('

如何学习PYTHON

02-14

学习Python是很容易的，你可以从以下几个方面入手： 1. 学习Python基础语法，包括数据类型、变量、控制语句、函数、模块等。 2. 尝试编写一些简单的Python程序，加深对基础语法的理解。 3. 学习Python的高级特性，如面向对象编程、迭代器、生成器、装饰器等。 4. 尝试使用Python解决一些实际问题，如数据处理、自动化测试、网络爬虫、数据可视化等。 5. 学习Python标准库和第三方库，扩展Python的功能。学习Python还可以通过以下方式获得帮助： 1. 通过在线视频课程、教程、文章等学习资源学习Python。 2. 参加线下Python培训课程或者Python社区的活动。 3. 加入Python QQ群或论坛，与其他Python爱好者交流学习经验。 4. 尝试参加Python相关的开源项目，与开发者一起工作学习。