![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫学习
以python为语言的爬虫记录
erxiong111
吉首大学软件学院的学子
展开
-
对于爬虫的小理解和小总结
爬虫为了更加好的理解web知识和网络知识 学习爬虫的一个很好的办法以下纯个人理解爬虫有点类似于黑客攻防了你通过模拟浏览器发送请求(仅指网页端)来获取到服务器的数据而服务器会有一定的反爬手段来防止数据的流失分享一下这几天学习到的爬虫知识request模块re模块有时间再写吧!...原创 2021-11-04 20:56:27 · 118 阅读 · 0 评论 -
python(re模块爬虫专用)贪婪匹配和惰性匹配
前言:在我们写爬虫时请求网页之后常要提取数据 那么使用re模块正则表达式来> 提取数据是一个很好的办法。这里只讲2中匹配技巧方法一些小说明:.(点):用来匹配任意非空格换行之类的字符*:一个量词匹配多个或0个 类似于尽可能多的匹配?: 一个量词匹配0个或1个 类似于尽可能少的匹配贪婪匹配.*: .后面加一个量词 * 那么就是尽可能多的匹配惰性匹配.? :当在 * 后面再加一个? 那么就是 ?修饰的前面. 那么就是说在 多出匹配的时候 我们取最近的说的可能不是很清楚推原创 2021-11-04 20:54:23 · 947 阅读 · 0 评论 -
python里面的request模块简单入门
requestsrequests是python第三方提供的一个库,可以用法模拟客户端(浏览器,app等)给服务器发送一个请求 来获取服务器的响应或者数据requests的一些用法import requestsif __name__ == '__main__': # 给服务器发送一个get请求 url=服务器的ip或域名(str) headers=请求头设置请求头(一个字典) params=附带数据(一个字典) requests.get() # 给服务器发送一个post请求原创 2021-11-04 20:25:01 · 391 阅读 · 0 评论