【Python 爬虫】准备篇(零)Python 和 VS Code 下载及安装

本文介绍了Python爬虫的基本概念,强调了Python作为爬虫开发的便捷性,并详细阐述了Python和VS Code的下载安装过程,包括环境配置、Python扩展和VS Code的Jupyter Notebook支持。此外,还探讨了脚本与爬虫的区别以及如何编写Python爬虫的基本步骤。

浅谈

网络爬虫

网络爬虫是 可以 自动连接到互联网站点读取网页中的内容或者存放在网络上的各种信息,并 按照某种策略对目标信息进行采集一类程序

其实身边到处都是爬虫的产物。

  • 比如说搜索引擎 (Google,百度)。他们能提供这么多搜索结果,也都是因为它们爬了很多信息,然后展示给你。
  • 再来说一些商业爬虫,比如爬爬淘宝的同类商品的价格信息,好为自己的商品挑选合适的价格。
  • 爬虫的用途很多很多,如果搞机器学习,爬虫就是获取数据的一种途径,网上的信息成百上千,只要懂爬虫,都能轻松获取。

实际上 ,世界上最大的搜索网站——Google 搜索本身就建构在爬虫技术之上,像 Google、百度这样的 搜索引擎通过爬虫程序来不断更新自身的网站内容和对其他网站的网络索引。从某种意义上说,用户每次通过搜索引擎查询一个关键词,就是在搜索引擎服务者的爬虫程序所 “爬” 到的信息中进行查询

  • 搜索引擎服务者(比如百度、谷歌等)有一种叫做爬虫程序的软件,它 可以自动地从互联网上收集各种网页信息,并把这些信息 存储在搜索引
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值