veigsky_08-CSDN博客

原创 mysql命令

07-（重点）-数据库的操作连接数据库打开终端，运行命令mysql -uroot -p回车后输入密码，当前设置的密码为mysql退出登录quit 和 exit或ctrl+d登录成功后，输入如下命令查看效果查看版本：select version();显示当前时间：select now();prompt python>\D 完整日期\U 使用用户数据库的操作 -- 查看所有数据库...

2018-05-23 21:04:12 172

转载大规模爬虫的流程总结

爬虫是一个比较容易上手的技术，也许花5分钟看一篇文档就能爬取单个网页上的数据。但对于大规模爬虫，完全就是另一回事，并不是1*n这么简单，还会衍生出许多别的问题。系统的大规模爬虫流程如图所示。先检查是否有APIAPI是网站官方提供的数据接口，如果通过调用API采集数据，则相当于在网站允许的范围内采集，这样既不会有道德法律风险，也没有网站故意设置的障碍；不过调用API接口的访问则处于网...

2018-05-23 21:01:31 305

转载爬虫工程师的入门简介

互联网是由一个一个的超链接组成的，从一个网页的链接可以跳到另一个网页，在新的网页里，又有很多链接。理论上讲，从任何一个网页开始，不断点开链接、链接的网页的链接，就可以走遍整个互联网！这个过程是不是像蜘蛛沿着网一样爬？这也是“爬虫”名字的由来。作为爬虫工程师，就是要写出一些能够沿着网爬的”蜘蛛“程序，保存下来获得的信息。一般来说，需要爬出来的信息都是结构化的，如果不是结构化的，那么也...

2018-05-22 22:59:46 3352

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 mysql命令

转载 大规模爬虫的流程总结

转载 爬虫工程师的入门简介

空空如也

空空如也

转载大规模爬虫的流程总结

转载爬虫工程师的入门简介