学习爬虫的感想和心得

最新推荐文章于 2024-06-14 23:14:11 发布

weixin_34006965

最新推荐文章于 2024-06-14 23:14:11 发布

阅读量1.4w

点赞数 3

文章标签：爬虫 java python

原文链接：http://www.cnblogs.com/haoabcd2010/p/10219310.html

版权

本文分享了作者学习爬虫两个月的心得体会，从掌握Python基础和爬虫库，到应对网站反爬策略，再到项目部署的复杂性，揭示了爬虫并非易事。涉及的工具有requests、scrapy、selenium，遇到的问题包括同步与异步请求、反爬机制、登录与验证码等。

摘要由CSDN通过智能技术生成

写爬虫真不是件简单的事

　　学习了大概两个月的爬虫，渐渐感觉到写爬虫并不是件简单的事，有诸多的考虑，先简单的记录一下，有时间分部分做示例

一、学习爬虫知识

　　我是从python3开始做爬虫的，首先，python3的语法必须知道，不过python3并不难，语法也非常简洁。但是，写着发现有个毛病，就是比如一个形参，由于不确定类型，.无法像java那样补全，导致你如果忘了一个函数，必须查看代码或手册。。。不过这也是动态语言都有的问题，但好的IDE会帮你记录，所以使用好的编译器很有必要。。哈哈。

　　然后是学习python的各种库，为了打好基础，从基础的库开始学习会比较好，比如urlib，然后学习requests，这种是用来发请求的。返回的数据又是各种各样的类型，有html，js，json，字符串等，针对每种格式，当然都需要合适的解析器，当然，正则都能做。。。

最低0.47元/天解锁文章

weixin_34006965

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
学习爬虫的感想和心得

写爬虫真不是件简单的事　　学习了大概两个月的爬虫，渐渐感觉到写爬虫并不是件简单的事，有诸多的考虑，先简单的记录一下，有时间分部分做示例一、学习爬虫知识　　我是从python3开始做爬虫的，首先，python3的语法必须知道，不过python3并不难，语法也非常简洁。但是，写着发现有个毛病，就是比如一个形参，由于不确定类型，.无法像java那样补全，导致你如果忘了一个函数，必须查看...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。