自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

星博

初入茅庐

  • 博客(12)
  • 收藏
  • 关注

原创 使用urllib模块的百度实战演练

urllib.parse与urllib.request模块的综合运用**urllib.parse **加粗样式urllib.request.Request()urllib.request.urlopen()从百度上爬取一个链接,并下载保存这个网页数据import urllib.parseimport urllib.request#构造一个url的不变部分baseurl = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&amp

2020-08-08 10:51:19 179

原创 urllib.request.urlopen()与urllib.request.Request()

使用urllib.request.urlopen()与urllib.request.Request() 获得响应import urllib.requestr = urllib.request.urlopen('https://gzdaily.dayoo.com/pc/html/2020-08/04/content_132879_713872.htm')html = r.read().decode('utf-8')print(html)这便是一个简单向网站发请求的框架,这种时候经常遇到反爬,比如使用

2020-08-05 09:45:54 523 2

原创 简单地从网上爬取一张图片并保存到本地

标题 简单地从网上爬取一张图片使用requests常用框架——爬取一张图片并保存在当地文件文件(这里使用的工具——PyCharm)import requestsurl = '''https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1596561811183&di=350d12154f6efc3b5e05ed9b1a3b4ccd&imgtype=0&src=http%

2020-08-04 23:00:00 599

原创 认识爬虫

@认识、爬虫基础11.1URL 和 URI的区别:URI——(全称)Uniform ResourceIdentifierURL——(全称)UniversalResosource LocaterURI——统一资源标志符URL——统一资源定位符URL是URI的子集。1.2超文本(hypertext)什么是网页?答:简单来说,就是由超文本解析而成的,其网页源代码是一系列HTML代码,里面包含了一系列标签。例如:(像这样的)1.3HTTP 和 HTTPS1、URL的开头会有(h

2020-06-25 23:54:36 176

原创 bs4有感

@BeautifulSoup 的基础相关内容1.1 BeautifulSoup 的安装2.1 认识BeatifulSoup3.1 学习心得1.1 BeautifulSoup 的安装我这里介绍一下:pip install BeautifulSoup(1、在doc命令2、在pycharm 的控制的 Terminal 中安装。检测是否安装成功:这样的显示,就代表你安装成功!那如果说,没成功:你可能还需要先下载其他的包:比如lxml、又或者是wheel ,再这里小编只是已在表明,安

2020-05-20 10:12:29 331

原创 2019pyCharm环境配置(基本)

PyCharm的常规配置1.主题的修改 File-settings-apperance-theme2.代码字体(控制台)的修改 File-settings-Editer-Font3.关闭更新 File-settings-Appearance Behavior-System Settings-Updates4.快捷键的修改 File-settings-Keymap5.添加api文档悬浮提示 File-settings-Editer-General6.自动导包 File-settings-Edit

2020-05-17 23:09:28 1016

原创 2.1 python类

@初阶 类1.1 类的定义:类:指把具有相同特性(数据)和行为(函数)的对象抽象为类我们先来看一下如下例子:我们可以看出:我们的类有一个关键字class是固定不变的,而他后面的类名则是用户定义;我们的类,指把具有相同特性(数据)和行为(函数)的对象抽象为类;其中后面跟的self,self在实例使用时,用于传输实例对象(其实传递的是实例对象在内存中的一个一个地址)。如:我直接打印输出my_box1 结果是一个地址,所以self传递时实际上传递的时一个地址。如果我们缺少了self又会是怎

2020-05-10 13:47:05 181

原创 1.2 python 之 字符串

1.2 python 之 字符串1.2.1一、什么是字符串?字符串(string),由任意字节的字符串组成,用单引号(‘)、双引号(“)或三引号(’‘’)成对表示。二、字符串使用方式:1、逐行赋值2、错误赋值方式错误原因:引号使用不规范!三、注意(1)、只有引号(‘‘),没有字节内容的字符串也是合法的。(2)、在字符串中用反斜杠(\)开头的代表字符转义符号。(3)、引号不...

2020-05-04 10:34:17 307

原创 1.1 python之变量

1.1变量一、什么是变量?指计算机编程中与关联 的标识符配对的内存存储位置,在使用时含相关类型的值,其值可以修改。二、变量使用时,内存里将产生两个动作:1、开辟指定地址的空间2、赋予指定的变量值“ NameError:name ‘a’ is not defined——名字没有被定义,即赋值。”三、多个变量赋值Python允许同时为多个变量赋值。1、给三个变量赋值相同的地址...

2020-05-04 09:08:25 408

原创 补课——高阶函数

补课——  高阶函数有感首先,我们思考一下,我们调用函数是用来做什么的?调用函数对我们有什么帮助?这个答案不唯一,但有一点,我们笼统一点来说,调用函数就是为了帮助我们更好的解决问题。函数是什么?函数本质上,也是一段代码,有着自己固定的格式、变量部分,函数通过相关的函数名将相关的代码组织在一起,对输入的数据进行处理处理,然后返回特定的输出(称为返回值),即:这个函数,我们使用时,通过其...

2020-04-28 14:02:02 198

原创 学爬虫你就得了解这个(一)

补课—— 高阶函数有感 首先,我们思考一下,我们调用函数是用来做什么的?调用函数对我们有什么帮助?这个答案不唯一,但有一点,我们笼统一点来说,调用函数就是为了帮助我们更好的解决问题。 函数是什么?函数本质上,也是一段代码,有着自己固定的格式、变量部分,函数通过相关的函数名将相关的代码组织在一起,对输入的数据进行处理处理,然后返回特定的输出(称为返回值),即:这...

2020-04-28 13:56:58 589 1

原创 初识爬虫【第一课】

第一课:初识爬虫现在网络发达,数据横飞, 成了一个数据大爆炸的时代,而爬虫呢?简单说来,就是代替人去模拟浏览器进行网页操作。爬虫能够去锁定数据,并去抓取它。那,爬虫,又是怎样去抓取呢?就算抓取了,又如何保证抓取到的数据,就是你想要获取的数据呢?接下来便请听我详细道来。爬虫抓取的对象,实质上就是一堆数据。数据是什么?数据其实就是你想要找到对象的数据标识,我们为便于称呼,形象的给它取了个名字,端口...

2020-04-26 09:43:26 229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除