小叶入门之Python爬虫(一)
Python爬虫入门(一)
这是我第一次在CSDN社区发布博客,有不足之处请大佬们多多指点,thx:)
一、Python简洁的简介
Python是一种跨平台的计算机程序设计语言。它是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。(摘自百度Python)
Python的别名叫胶水语言,这个还是我们公司的技术钞钞告诉我的,我的理解是它就像一个中间处理模块,可以与多种程序组合使用,处理大批量数据等等。
二、什么是爬虫?
爬虫这个热门词汇至少这几年来很火,我也听过不下数十次,那么到底是爬虫?爬虫是否具有一定的危险性?网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。(摘自百度爬虫)
爬虫如果用在正确的方面上,我们就可以获得有效且准确的数据,拿来做数据分析或者找资源都是极棒的。
三、爬!需要几步?
- 找到需要爬取数据的网页URL ;
- 按下F12,就是你我都懂的那个键:)点击它,你就可以看到网页的真面目,飒 ;
- 在源码中寻找你要提取的数据,嘿嘿嘿;
- 写Python代码进行请求、解析;
- 存储爬到的数据。
以上是一般情况下的步骤…
这是我CSDN社区的第一篇,新起点,新征程!