又封ip了-CSDN博客

原创用python写爬虫（基础）（2）----了解网页构造，才能知道我究竟需要什么数据

知道了用requests去请求网页，这是爬取的第一步，当然了既然能够请求成功，自然我们可以知道了要进入网页去抓我们想要的数据。要知道我们是从网页源代码当中找寻数据，而并非像一般的复制粘贴一样从浏览器表面获得。网页的构成无非是HTML、CSS、JavaScript三种语言构成，HTML 负责为网页添加内容，CSS 负责美化网页，JavaScript 负责让网页动起来。当然我们爬虫不需要将三大语言全部弄会，只需要知道几个特殊的标识符即可，所以爬虫是一个全方位的领域。这是豆瓣网站的部分源代码：&

2022-01-06 14:50:16 503 1

原创用python写爬虫（基础）（1）----requests网站成功是第一准则

写爬虫的语言还是有比较多的，java也可以写，但是综合对比起来python拥有许多强大的第三方库，也是一个胶水语言，只要引用第三方库没有做不到的事情，所以我的爬虫就以python为基础撰写。写python的平台很多，我基本以pycharm和anaconda上面进行，学习爬虫的朋友可以先下载好这两个软件，尤其是pycharm我们会频繁的用到。所谓爬虫就是要模仿浏览器去向服务器请求查看网页，这才是爬虫要做的第一件事情，如果连请求网站都失败，那么...

2022-01-05 15:06:05 695

原创【无标题】

从今天开始，我将带大家了解python爬虫这一神奇领域，我将分为两部分去带大家认识，除了用python写爬虫代码，还要学会用数据库去存储数据，我介绍的是mysql。技术达到一定阶段我还会教大家爬虫最深层次的如JS逆向、安卓逆向，足以出去月薪20k起步！！（即便是只有python一点基础都能看懂）...

2022-01-04 23:54:15 669 1