- 博客(3)
- 收藏
- 关注
原创 用python写爬虫(基础)(2)----了解网页构造,才能知道我究竟需要什么数据
知道了用requests去请求网页,这是爬取的第一步,当然了既然能够请求成功,自然我们可以知道了要进入网页去抓我们想要的数据。要知道我们是从网页源代码当中找寻数据,而并非像一般的复制粘贴一样从浏览器表面获得。网页的构成无非是HTML、CSS、JavaScript三种语言构成,HTML 负责为网页添加内容,CSS 负责美化网页,JavaScript 负责让网页动起来。当然我们爬虫不需要将三大语言全部弄会,只需要知道几个特殊的标识符即可,所以爬虫是一个全方位的领域。这是豆瓣网站的部分源代码:&
2022-01-06 14:50:16 467 1
原创 用python写爬虫(基础)(1)----requests网站成功是第一准则
写爬虫的语言还是有比较多的,java也可以写,但是综合对比起来python拥有许多强大的第三方库,也是一个胶水语言,只要引用第三方库没有做不到的事情,所以我的爬虫就以python为基础撰写。写python的平台很多,我基本以pycharm和anaconda上面进行,学习爬虫的朋友可以先下载好这两个软件,尤其是pycharm我们会频繁的用到。所谓爬虫就是要模仿浏览器去向服务器请求查看网页,这才是爬虫要做的第一件事情,如果连请求网站都失败,那么...
2022-01-05 15:06:05 644
原创 【无标题】
从今天开始,我将带大家了解python爬虫这一神奇领域,我将分为两部分去带大家认识,除了用python写爬虫代码,还要学会用数据库去存储数据,我介绍的是mysql。技术达到一定阶段我还会教大家爬虫最深层次的如JS逆向、安卓逆向,足以出去月薪20k起步!!(即便是只有python一点基础都能看懂)...
2022-01-04 23:54:15 635 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人