爬虫入门(一)爬自己的CSDN博客
今天本来在搞人体识别模型的,emmm后来想搞一直想试的爬虫,于是我就来了!
我是用的软件是pycharm,这个软件是JetBrains开发的,我最近使用的连接数据库的软件datagrip也是JetBrains公司了,只不过我认为datagrip对新用户不太友好,很多功能都隐藏起来了,还要你自己去发现emmm。
pycharm简称pc;
pycharm的下载大家百度搜索一下就可以搜索到了。
pycharm是比较智能的开发工具,相对于python的解释器来说对新用户十分友好。
我用pycharm就是为了更加方便啦~
pycharm下载链接
大家注意下载community版本的,因为是免费的,professional版本的是需要缴费的,给你试用一下。
安装很好安装,直接点自己对应的多少位的操作系统就可以了。
安装完pycharm之后打开这个软件会让你选择下载插件。
(具体的我不太记得了,R语言然后vimxxx的我是安装了的)
然后就是建立自己的一个项目。
首先会让你把自己的项目放在哪个位置(这个位置你自己选择了)
注意:pc是建立在python解释器基础上的,所以你首先应该安装的是python
爬虫的准备是先要有一个请求的许可。
这里我用的是requests包。
具体下载方式就是在
查看自己有没有requests包。
没有的话就在这里查找下载:
点点点就可以了。
然后下载完成后他会提示你下载成功。
之后就是新建一个.py的file。
比如我本来想爬cf的,后来爬爬自己的博客。
输入以上代码:首先需要导入我们的requests包,然后爬取的网址。然后输出爬取的内容即可。
我得运行结果大致就是这样。
爬取成功~