时隔两个月,今天重新又开始学习python,首先还是明确学习的目的,不是按部就班地学完课程进行考试,而是能够应用python进行数据挖掘和数据分析,因此在学习的过程中以目的导向,以完成一个小目标的形式进行学习(开始时可能也会掠略过一些细节性的东西,但后续遇到时反过来再学效果或许更好)。
今日的目标是利用python爬取百度新闻网页的源代码。
首先,先在pycharm中安装Requests库,Requests是一个基于Apache2协议开源的Python HTTP库,号称是“为人类准备的HTTP库”。
上图是已经安装好requests库了
在setting里点+号,进去搜索requests,然后点击install package,等待几分钟即可完成安装,然后退出,就可以开始调用requests库了。
安装好之后,进行一个简单的调用。
上述代码的运行结果如下:
这个结果看起来似乎有些乱
(注:在谷歌浏览器中用F12键可以查看网页源代码或者点击右键菜单查看网页源代码,如下图所示)
(ps.以后需要补一些HTML做网页之类的知识)
目前遇到了一些问题,明天再解决