![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Alfred king
这个作者很懒,什么都没留下…
展开
-
正则表达式相关知识
前言:正则表达式不仅可以用于python中,其他类似JavaScript,C#同样可以用到,比如当我们需要提取“www.google.123.45"中的数字的时候便需要用到正则表达式。本篇将会介绍一些正则表达式的用法相关使用例子前言:提取字符串中的数字前期准备:检索和替换match()匹配提取字符串中的数字前期准备:需要导入re模块import re#re 模块使 Python 语言拥有全部的正则表达式功能。实例import re result1 = re.findall(r'\d+'原创 2020-09-17 12:45:11 · 204 阅读 · 0 评论 -
request,urllib的相关使用
首先使用这两个库以前,先通过pip安装或者通过anaconda进行安装。前提条件首先使用这两个库以前,先通过pip安装或者通过anaconda进行安装。获取网页源代码(获取服务器响应文本内容)获取请求获取网页源代码(获取服务器响应文本内容)如果需要获取网页源代码,则首先需要在开始的python文件中导入request库import request接着我们需要对我们所要获取网页源代码的网址进行赋值,接着通过request.get().text即可打印相关代码import requests#导入这原创 2020-09-16 17:22:05 · 95 阅读 · 0 评论 -
爬虫一般需要下载的库
pip install requestspip install urllibpip install BeautifulSoup原创 2020-09-16 16:32:52 · 494 阅读 · 0 评论 -
python爬虫从学习 1--什么是爬虫
本课程是从GitHub中文榜学习整理的详情可以点击这里当我们在我们的浏览器输入我们熟悉的www.baidu.com,一回车就看到我们的网页,ctrl+u我们就可以看到网页密密麻麻的代码。而爬虫就相当于一个自动化程序将网站的数据给搜索下来,比如我们想知道中国最好的大学的排名以及某一个行业未来的发展趋势。如何使用爬虫呢首先爬虫需要模拟一个请求,就像我们输入浏览器的地址回车爬虫可以用到一些 Http 库向指定的服务器偷偷摸摸的发起请求,这个时候爬虫可以假装自己是浏览器(添加一些header信息)大多数原创 2020-09-16 16:29:35 · 85 阅读 · 0 评论