python爬虫系列（〇）——写在前面

最新推荐文章于 2024-09-13 15:59:37 发布

whgiser

最新推荐文章于 2024-09-13 15:59:37 发布

阅读量349

点赞数 2

分类专栏： PYTHON爬虫文章标签：爬虫 python 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43092663/article/details/116210375

版权

PYTHON爬虫专栏收录该内容

3 篇文章 5 订阅

订阅专栏

记录写爬虫初衷

爬虫是什么
为什么要写爬虫
本系列文章的初衷

本系列皆为作者本人原创，转载请注明，谢谢。

爬虫是什么

按照百度的定义：网络爬虫是一种按照一定的规则，自动地抓取互联网信息的程序或者脚本。能够对结构化的网页信息和发送的数据包获取并解析成规则的数据。
那么python爬虫能干什么呢？理论上只要用户权限能看到的内容，都是可以通过爬虫获取的，如网页上的文字、表格、图片、视频等。

为什么要写爬虫

由于从事城市计算科学相关的研究，经常需要大量的数据开展工作，如分析城市的房价分布及演变、交通网络可达性、公共设施的覆盖率、城市活力特征、餐饮企业分布及评分特征、城市环境（空气质量、水、公园）演变等。大量的数据分散在各互联网门户上，需要通过一定的技术手段进行采集和处理，爬虫提供了方便快捷的手段。当然，目前爬虫还处在一个灰色地带，对数据的收集仅用于研究工作，对于商用需谨慎，爬虫也分善恶，要用之有度防止被吞噬。

本系列文章的初衷

本系列的爬虫都是在工作和研究中积累的，记录下来一是方便自己再回顾的时候能找到当初思考的一些技术细节，做更换的总结之用；二是与从事数据科学的同行们分享交流，通过交流不断完善技术体系，做到学有所长。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

whgiser CSDN认证博客专家 CSDN认证企业博客

码龄6年

12: 原创

73万+: 周排名

180万+: 总排名

6万+: 访问

: 等级

174: 积分

14: 粉丝

44: 获赞

11: 评论

441: 收藏

私信

关注

热门文章

分类专栏

最新评论

python利用百度/高德地图获取地理位置并转换
2301_79429955: 你好，有什么办法可以获得更加准确的位置信息吗，调用百度或高德，获取到的我的位置经纬度和我实际上的位置相差的有点多 +
python利用百度/高德地图获取地理位置并转换
码到成龚: 你好，文中的地理编码与逆编码部分的图片是不是有误，将详细地址转换成地理坐标的编码不是叫“地理编码”吗，为什么向右的箭头上是“逆编码”？
python利用百度/高德地图获取地理位置并转换
码到成龚: 你好，如果我就想要获取地址（比方说对方微信发我一个高德地图或者是百度地图，然后我该怎么将它转换成文本的形式保存在excel中），不转换成经纬度该咋搞？
python爬虫系列（二）——地图找房新楼盘信息获取
PINGLucky: 实际数据有541条，但是只能爬取300条，如何可以爬全这些数据呢？
python爬虫系列（二）——地图找房新楼盘信息获取
opticaloptical: # 'x1': -128.78107787736755, ##合肥 # 'x2': 128.78107787736755, # 'y1': -75.43079401028984, # 'y2': 75.43079401028984 请问这些坐标是不是windows的坐标？目的是不是取窗口范围？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。