python初学者的学习日记——初步爬取网页源代码【2021.1.29】

时隔两个月,今天重新又开始学习python,首先还是明确学习的目的,不是按部就班地学完课程进行考试,而是能够应用python进行数据挖掘和数据分析,因此在学习的过程中以目的导向,以完成一个小目标的形式进行学习(开始时可能也会掠略过一些细节性的东西,但后续遇到时反过来再学效果或许更好)。

今日的目标是利用python爬取百度新闻网页的源代码。

首先,先在pycharm中安装Requests库,Requests是一个基于Apache2协议开源的Python HTTP库,号称是“为人类准备的HTTP库”。
在这里插入图片描述
上图是已经安装好requests库了
在这里插入图片描述
在setting里点+号,进去搜索requests,然后点击install package,等待几分钟即可完成安装,然后退出,就可以开始调用requests库了。

安装好之后,进行一个简单的调用。
在这里插入图片描述
上述代码的运行结果如下:
在这里插入图片描述
这个结果看起来似乎有些乱

(注:在谷歌浏览器中用F12键可以查看网页源代码或者点击右键菜单查看网页源代码,如下图所示)
在这里插入图片描述
(ps.以后需要补一些HTML做网页之类的知识)

目前遇到了一些问题,明天再解决

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值