Python学习第一课(不怕失败,爬虫就是要爬点东西回来)
基本知识
不知道多少人像我一样,技术底子还在,但是由于工作渐行渐远。Python大火的时候,也一股热情涌上心头,贼拉专业的部署了环境,然后不了了之。
在那之后很偶然的看到了Jack-Cui关于Python的内容,深入浅出,重燃了一下学习代码的热情。他的文章让人们看过后很快就能明白Python的运作机理(尤其爬虫部分)。
关于基础知识(到目前为止,关于环境、Python语法、库的相关知识都通过搜索即可)其实没必要去9.9的Python小课程,随便搜一下就能知道,这里还是推荐W3School。
如果示例代码有无法运行的情况,一般情况是没有安装对应的包,所以,只需要万能的pip install就可以解决。
炫酷一些,自己安装它:
Windows + R
输入:cmd,潇洒回车
看看缺失的包,输入:
pip install 包名称
再来一次潇洒回车,结束战斗。
第一课,第一个小爬虫
首先,爬虫就是要爬取互联网上的内容。鉴于目前互联网传输数据的方式,还是要科普一些知识:
- URL:要爬取的地址,一定要完善,善用浏览器的Ctrl+Shift+I;
- json:目前主流的数据格式,随便看一下明白它的结构;
- urllib库:Python爬虫必须要用到的库;
锁定目标
相信很多初学代码的同学,搞明白基础语法后,第一个学会的函数就是randmo。用它生成随机数可以做很多力所能及的小程序。
比如:猜数字、比大小、石头剪刀布
又或者,帮自己生成一注彩票号码,博个彩头。
所以,第一个爬虫,就试试彩票吧。