自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 第2关:JSON篇:使用json库

用于从 Python 的字符串中解析 JSON 数据。使用它的方法很简单,只需将含有 JSON 数据的字符串当做参数传递给它,它的返回值就是由 Python 中的。库是 Python 内置的一个用于操作 JSON 数据的库,提供了几个函数用于。注意:所有打开的文件,请在打开文件的函数内及时关闭,以免影响测试代码读取数据。文件内的内容,就会被当做 JSON 格式的数据来解析。,只要文件对象使用了正确的字符编码打开文件,的内容,并将其中的数据打印出来。也是用于解析 JSON 数据的,它与。

2024-01-22 16:30:00 959

原创 第2关:BeautifulSoup解析网页

BeautifulSoup 和 lxml 一样,BeautifulSoup 也是一个 HTML/XML 的解析器,主要的功能也是解析和提取 HTML/XML 数据。根据提示,在右侧编辑器 Begin-End 区间补充代码,完善函数 get_data(),使用 bs4 解析爬取古诗词网古诗的内容部分,并将内容以列表形式返回。为爬取网页的效果代码,可以使用开发者工具审查元素,查看古诗的内容部分位于哪个标签。,安装 BeautifulSoup 模块,如下图所示。平台会对你编写的代码进行测试,当。

2024-01-22 16:15:00 1126

原创 第1关:JSON篇:JSON基础知识

JSON 全称:JavaScript Object Notation(JavaScript 对象表示法),是一种轻量级的文本数据交换格式。与接下来要介绍的 XML 相比,拥有。测试代码会解析这个文件内的 JSON 字符串,并将其中的数据打印出来。本关任务:手动编写一个 JSON 格式的数据文件。中,值则有多种形式,多条数据之间用逗号。可以看到其结构和 Python 的。的形式表示,名称包括在一对双引号。这种表示方式与 Python 的。JSON 的数组用一对方括号。JSON 的对象用一对大括号。

2024-01-22 16:15:00 564

原创 第1关:XPath解析网页

XPath ,全称 XML Path Language ,即 XML 路径语言,它是一门在 XML 文档中查找信息的语言。XPath 的选择功能十分强大,它提供了非常简洁明了的路径选择表达式。另外,它还提供了超过 100 个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有想要定位的节点都可以用 XPath 来选择。实训中,介绍了 XPath 的基础知识,本关需要使用 XPath 技术来编写解析网页的程序。为爬取网页的效果代码,可以使用开发者工具审查元素,获取 XPath 的路径信息。

2024-01-22 15:45:00 1051

原创 第2关:requests 进阶

文件,得知你的相关信息,从而做出相应的动作,如在页面显示欢迎你的标语,或者让你不用输入。、密码、浏览过的网页、停留的时间等信息。协议是无状态的,也就是每个请求都是独立的。那么登录后的一系列动作,都需要用。来验证身份是否是登录状态,为了高效的管理会话,保持会话,于是就有了。相当于一个虚拟的浏览器,在这个浏览器上处于一种保持登录的状态。文件,它是一个非常小的文本文件,可以记录你的用户。是一种管理用户状态和信息的机制,与。平台会对你编写的代码进行测试,当。, 以百度搜索为例,在。登录成功后,会话会生成。

2024-01-22 15:30:00 708

原创 第1关:requests 基础

本关任务:编写一个requests请求网页的程序。

2024-01-22 11:04:52 1142

原创 第5关:HTML表格:日常消费账单表格展示网页

此例中,我们将列值的总和行作为表格的尾部。通常,我们都会建议大家使用这三种元素来定义表格,因为这样做表格的总体结构更为清晰。在日常生活中财务报表、日历等,都常使用表格展示。在第一个例子中,表格没有边框,看起来不太明显。一般情况下,我们都会指定表格的表头信息,可以使用。但是,这样的边框样式不太好看,我们可以通过编写。在之后的示例中,我们都默认添加了表格边框样式。为了使表格的整体结构更加的清晰,我们还能够使用。组成,每一行由单元格组成,单元格有标题单元格。其中的单元格,跨越了多行或者多列。

2024-01-19 16:00:00 2181

原创 第4关:HTML标题与段落:网络文章网页

类型 | 父元素 | 子元素| | ------------ | ------------ | | 有序列表 | ol | li| | 无序列表 | ul | li| | 描述列表 | dl| dt, dd|大家可以看到,虽然我们在段落内容中换行了,但是显示时是不会换行的。通常,列表都是由父元素和子元素构成的,父元素用于指定要创建的列表的类型,子元素用于指定要创建的列表项目类型。补充完代码后,点击测评,平台会对你编写的代码进行测试,当你的结果与预期输出一致时,即为通过;在HTML5中,更强调语义。

2024-01-19 15:45:00 915

原创 第3关:HTML链接:带超链接的网页

的含义取于船上的锚,船把锚沉在水底后,如果船随水飘移了,只要一拉锚的锁链就会回到抛锚的位置。补充完代码后,点击测评,平台会对你编写的代码进行测试,当你的结果与预期输出一致时,即为通过;页面,链接包含页面内导航链接和跳转其他网页的链接。属性是超链接最重要的属性,它用于指定超链接目标的 URL。超链接是网页互连的核心,网页之间通过超链接连接在一起。,这样做可以调起邮箱应用,发送邮件到对应地址。属性指定了超链接的目标,本例中即跳转到百度。,所以在点击之后,将在新标签中打开链接。属性,使得链接在新标签中打开;

2024-01-19 15:15:00 888 1

原创 第2关:HTML结构:自我简介网页

生活充实的含义,应是阅历得广,明白得多,有发现的能力,有推断的方法,性情丰厚,兴趣饶富,内外合一,即知即行,等等。补充完代码后,点击测评,平台会对你编写的代码进行测试,当你的结果与预期输出一致时,即为通过;但这个网页更容易被搜索引擎发现。属性来检索页面,所以当我们加入了合适的关键字和描述内容时,页面就更容易被搜索引擎发现。同理,关键词信息使用多个并行的关键词告知搜索引擎我们网页内容的关键词信息。网页的完整结构,并了解如何让搜索引擎更好的找到你的网页。元素的内容即网页标题,它是一个网页必需的元素之一。

2024-01-19 15:00:00 1099 1

原创 第1关:初识HTML:简单的Hello World网页制作

属性 | 值 | 含义 | ------------ | ----------- | class | 自定义的元素类名 | 元素的类名 | id | 自定义的元素id名 | 元素的唯一的id | style | 元素内联样式 | 元素的样式 | title | 额外信息内容 | 元素的额外信息。补充完代码后,点击测评,平台会对你编写的代码进行测试,当你的结果与预期输出一致时,即为通过;标签来编写⽹页,将文本、超链接、图片、语音、视频等各种内容整合起来,实现绚丽多姿的网页。标签之间输入"动手改变世界";

2024-01-19 10:38:13 1545 1

原创 第2关:Pandas缺失值类型

平台会对你的选择题答案结果进行测试,对比你的答案与实际正确的答案,只有所有答案全部正确才能进入下一关。掩码方法中掩码可能是一个与原数组维度相同的完整布尔类型数组,也可能是用一个比特(看作是一个数据类病毒——它会将与它接触过的数据同化。会为这个数组选择一个原生浮点类型,这意味着和之前的。表示缺失的整数),也可能是些极少出现的形式。标签方法中,标签值可能是具体的数据(例如用。自带的几个处理缺失值的工具的用法,该系列。表示缺失值,另一种方法是用一个**标签值。代码从而实现快速操作。原有的缺失值:浮点数据类型的。

2024-01-17 17:15:00 766

原创 第1关:Pandas数值运算方法

平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。中二维数组与一维数组的运算规则是一样的。从上面的例子可以发现,两个对象的行列索引可以是不同顺序的,结果的索引会自动按顺序排列。里默认也是按行运算的,如果想按列计算,那么就需要利用前面介绍过的运算符方法,通过设置。表示缺失值的方法(后面的关卡会介绍)。的运算与前面介绍的运算一样,结果的索引都会自动对齐。,然后让每一行都减去第一行的值,输出运算后的结果。内置的集合运算规则实现的,任何缺失值默认都用。

2024-01-17 17:00:00 930

原创 第7关:Numpy的结构化数组

平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。,其数据类型是由组成一系列命名字段的简单数据类型组成的,在定义结构化数据时需要指定数据类型。注意:尽管这里列举的模式对于简单的操作非常有用,但是这些操作场景也可以用。有的时候通过异构类型值组成的数组无法完全的表示我们的数据,这时候就需要。的结构化数组,并通过读取文件内容转换结构化数组操作。查看相应的值,并且可以进行快速的数据处理。的,异构的数据提供了非常有效的存储。结构化数组的方便之处在于,你可以通过。

2024-01-17 16:45:00 603

原创 第6关:Numpy的排序和条件筛选

说到排序想必你的脑海中会想到快速排序、插入排序、冒泡排序、选择排序等复杂的排序算法,所有的这些算法都是为了实现一个任务 ——平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。请先仔细阅读右侧上部代码编辑区内给出的代码框架,再开始你的编程工作!中已经封装了排序的函数,不需要我们再去造轮子了。的排序方法,并编写一个能筛选并排序的程序。处补充代码,先过滤数组中大于。的值,再对这些值进行排序。的更加高效,默认情况下。

2024-01-17 16:15:00 782

原创 第5关:Numpy 的拆分

的输出,然后将其与预期输出作对比,如果一致,则测试通过;数组的纵向拆分、横向拆分、深度拆分。,我们可以方便的对数组进行拆分,比如使用。深度拆分要求数组的秩大于等于。为了完成本关任务,你需要掌握:拆分数组。文件,并以标准输入方式提供测试输入;中的三个方法方法,平台获取。

2024-01-17 16:00:00 462

原创 第4关:Numpy 数组的堆叠

从深度看,数组既可以横向叠放,也可以竖向叠放。因此,我们我们对数组进行堆叠,的输出,然后将其与预期输出作对比,如果一致,则测试通过;数组对堆叠包含以下几个函数: 首先,创建两个数组。数组的垂直叠加、水平叠加、深度叠加。返回的是真实的数组,需要分配新的内存空间,而。,我们可以方便的更改数组的形状,比如使用。文件,并以标准输入方式提供测试输入;拆解,将多维数组变成一维数组。中的三个方法,平台获取。使用元组改变数组形状。

2024-01-17 15:45:00 412

原创 第3关:Numpy 数组的切片与索引

的输出,然后将其与预期输出作对比,如果一致,则测试通过;来选择数组的部分元素,这实际上就是提取数组中值为。为了完成本关任务,你需要掌握:数组的切片与索引。数组的索引功能的功能。文件,并以标准输入方式提供测试输入;本关任务:从数组中选择指定的元素。同时用下标选择元素,下标范围从。的数组,然后通过指定下标。对于二维数组的索引,类似与。

2024-01-17 15:15:00 412

原创 第2关:Numpy 数组的基本运算

的输出,然后将其与预期输出作对比,如果一致,则测试通过;的代码,以实现向量与标量相加和相乘的的功能。函数接受三个参数,然后进行向量与标量之间的运算;库可以直接进行一些四则运算,快速的处理两个。文件,并以标准输入方式提供测试输入;矩阵可逆的充要条件是矩阵满秩。二维数组的一些基本操作。本关的测试样例参见下文;

2024-01-17 15:00:00 573

原创 第1关:Numpy 创建数组

的输出,然后将其与预期输出作对比,如果一致,则测试通过;这个变量,这样我们就快速的创建了一个一维数组。函数接受两个参数,然后创建与之对应的的多维数组;从而达到了创建多维数组的目的。为了完成本关任务,你需要掌握:创建数组。中创建数组有许多的方法,这里我们使用。之所以取别名,是为了代码编写的方便。文件,并以标准输入方式提供测试输入;方法,将两个一维数组组合成一个。的一维数组,然后使用。的代码,以实现创建一个。本关的测试样例参见下文。

2024-01-17 10:35:19 502

原创 第6关:python数据库编程之删除数据

为了完成本关任务,你需要掌握:如何使用。从数据库中删除数据。

2024-01-16 21:00:00 497 2

原创 第5关:python数据库编程之修改数据

为了完成本关任务,你需要掌握:如何使用。从数据库中修改数据。

2024-01-16 20:45:00 495 1

原创 第4关:python数据库编程之查询数据

为了完成本关任务,你需要掌握:如何使用。从数据库中查询数据。

2024-01-16 20:30:00 495 1

原创 第3关:python数据库编程之插入数据

为了完成本关任务,你需要掌握:如何使用。的数据库下的用户表(

2024-01-16 20:15:00 527 1

原创 第2关:python数据库编程之创建数据表

如果需要对事务的完整性要求比较高(比如银行),要求实现并发控制(比如售票),那选择 InnoDB 有很大的优势。如果需要频繁的更新、删除操作的数据库,也可以选择InnoDB,因为支持事务的提交(commit)和回滚(rollback)。:所有的数据都在内存中,数据的处理速度快,但是安全性不高。如果需要很快的读写速度,对数据的安全性要求较低,可以选择 MEMOEY。的数据类型为 int(16),并且设置为自增主键(只有整形数据才能使用 AUTO_INCREMENT 来设置自增标识),的数据库创建一张用户表(

2024-01-16 20:00:00 1074

原创 第1关:python数据库编程之创建数据库

数据库( Database )是一个集合了各种数据结构来组织、存储以及管理的数据仓库。我们为什么不用文件的方式来储存数据呢?我们当然可以,但是在文件中的读写速度相对较慢,并且存在某部分数据无法直接提取等缺陷。所以我们使用关系型数据库来储存以及管理大量数据。所谓的关系型数据库是建立在关系模型基础上的数据库。

2024-01-16 16:09:57 2215 2

原创 如何使用Python解决数据表中数值带有单位的问题

当我们爬取数据的时候,需要对数据进行清洗,有时候可能会有格式不统一的问题,比如10000、1.3万、89万、20000等数值,因此我们可以使用下面的代码进行格式转换,从而解决数值格式不匹配的问题。以上就是解决数值中带单位或小数点的问题,可以不局限于万字,还可以是千、百、十等,主要是使用正则化将数据转换,从而获得。

2024-01-16 14:46:55 774 1

原创 解决在jupyternotebook中使用pyecharts绘制图形,.render_notebook()结果显示空白不出现图形

通过查阅资料,很多方法都用过了,也无济于事,甚至只能短暂解决问题。最后通过摸索才发现最终的解决方法。

2023-12-19 23:45:20 3887

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除