数据分析（第二天）

最新推荐文章于 2025-08-03 17:01:16 发布

原创最新推荐文章于 2025-08-03 17:01:16 发布 · 482 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#数据分析 #python #数据挖掘

数据分析专栏收录该内容

2 篇文章

订阅专栏

数据类型

我们使用 pandas 读取之后，它是什么类型的对象哪？接下来我们进行讨论

任务一：pandas中有两个数据类型DateFrame和Series，通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子?[开放题]

Series 是一维的数组型对象，它包含了一个值序列（与NumPy中的类型相似），并且包含了数据标签，称为索引（index）。最简单的序列可以仅有一个数组组成。

import pandas as pd

obj = pd.Series([4, 7, -5, 3])
obj

0    4
1    7
2   -5
3    3
dtype: int64

obj.index   # 获取索引
obj.values  # 获取对象的值
# 可以类比一维数组

array([ 4,  7, -5,  3], dtype=int64)

DataFrame 表示的是矩阵的数据表，它包含已排序的集合，每一列可以是不同的值类型（数值、字符串、布尔值等）。DataFrame 既有行索引也有列索引，它可以被视为一个共享相同索引的 Series 的字典。

# 方法一: 使用 [[]]  二维数组 按照行 初始化

data = pd.DataFrame([['C语言', 80],
                     ['数据结构', 90],
                     ['计算机组成原理', 88],
                     ['计算机网络', 92],
                     ['数据库系统概论', 86]],
                    columns=['课程名称', '成绩'])
data.index        # 行索引
data.columns      # 列索引  ： Index(['课程名称', '成绩'], dtype='object')
data

# 方法二：使用 字典 按照列 初始化
data = pd.DataFrame({'课程名称': ['C语言', '数据结构', '计算机组成原理', '计算机网络', '数据库系统概论'],
                     '成绩' : [80, 90, 88, 92, 86]})
data

	课程名称	成绩
0	C语言	80
1	数据结构	90
2	计算机组成原理	88
3	计算机网络	92
4	数据库系统概论	86

任务二：根据上节课的方法载入"train.csv"文件

data = pd.read_csv(r'data\train.csv')
data.head()

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	373450	8.0500	NaN	S

任务四：查看"Cabin"这列的所有值[有多种方法]

data['Cabin']

0       NaN
1       C85
2       NaN
3      C123
4       NaN
       ... 
886     NaN
887     B42
888     NaN
889    C148
890     NaN
Name: Cabin, Length: 891, dtype: object

data.loc[:, 'Cabin']    # 行切片, 列名 ,注意 loc()方法，使用的是列名

0       NaN
1       C85
2       NaN
3      C123
4       NaN
       ... 
886     NaN
887     B42
888     NaN
889    C148
890     NaN
Name: Cabin, Length: 891, dtype: object

data.iloc[:, 10]    # 行切片,列名，注意：iloc() 使用的是 索引。

0       NaN
1       C85
2       NaN
3      C123
4       NaN
       ... 
886     NaN
887     B42
888     NaN
889    C148
890     NaN
Name: Cabin, Length: 891, dtype: object

任务五：加载文件"test.csv"，然后对比"train.csv"，看看有哪些多出的列，然后将多出的列删除

# 这里数据列没有多余的，我们增加一列之后再删除
data = pd.read_csv(r'data\test.csv')
df = data['Embarked']
new_df = pd.concat([data, df], axis=1)
new_df

# 删除new_df重复的列
del new_df['Embarked']      # 改变了原始数据
new_df.head()  # 与该名称相同的列都别删掉

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN
2	894	2	Myles, Mr. Thomas Francis	male	62.0	0	0	240276	9.6875	NaN
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN

new_df.drop('Sex', axis=1) # 删除时不改变原来的对象 new_df 的值，返回删除的值为新的对象
new_df

	0	Age	Cabin	Fare	Name	Parch	PassengerId	Pclass	Sex	SibSp	Ticket
0	NaN	34.5	NaN	7.8292	Kelly, Mr. James	0.0	892.0	3.0	male	0.0	330911
1	NaN	47.0	NaN	7.0000	Wilkes, Mrs. James (Ellen Needs)	0.0	893.0	3.0	female	1.0	363272
2	NaN	62.0	NaN	9.6875	Myles, Mr. Thomas Francis	0.0	894.0	2.0	male	0.0	240276
3	NaN	27.0	NaN	8.6625	Wirz, Mr. Albert	0.0	895.0	3.0	male	0.0	315154
4	NaN	22.0	NaN	12.2875	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	1.0	896.0	3.0	female	1.0	3101298
...	...	...	...	...	...	...	...	...	...	...	...
413	S	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
414	C	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
415	S	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
416	S	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
417	C	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

2090 rows × 11 columns

任务六：将[‘PassengerId’,‘Name’,‘Age’,‘Ticket’]这几个列元素隐藏，只观察其他几个列元素

data = pd.read_csv(r'data\test.csv')
data.head()

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
2	894	2	Myles, Mr. Thomas Francis	male	62.0	0	0	240276	9.6875	NaN	Q
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S

data.drop(['PassengerId','Name','Age','Ticket'], axis=1).head()

	Pclass	Sex	SibSp	Parch	Fare	Cabin	Embarked
0	3	male	0	0	7.8292	NaN	Q
1	3	female	1	0	7.0000	NaN	S
2	2	male	0	0	9.6875	NaN	Q
3	3	male	0	0	8.6625	NaN	S
4	3	female	1	1	12.2875	NaN	S

data

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
2	894	2	Myles, Mr. Thomas Francis	male	62.0	0	0	240276	9.6875	NaN	Q
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...
413	1305	3	Spector, Mr. Woolf	male	NaN	0	0	A.5. 3236	8.0500	NaN	S
414	1306	1	Oliva y Ocana, Dona. Fermina	female	39.0	0	0	PC 17758	108.9000	C105	C
415	1307	3	Saether, Mr. Simon Sivertsen	male	38.5	0	0	SOTON/O.Q. 3101262	7.2500	NaN	S
416	1308	3	Ware, Mr. Frederick	male	NaN	0	0	359309	8.0500	NaN	S
417	1309	3	Peter, Master. Michael J	male	NaN	1	1	2668	22.3583	NaN	C

418 rows × 11 columns

如果想要完全的删除你的数据结构，使用inplace=True，因为使用inplace就将原数据覆盖了，所以这里没有用

筛选的逻辑

表格数据中，最重要的一个功能就是要具有可筛选的能力，选出我所需要的信息，丢弃无用的信息。

下面我们还是用实战来学习pandas这个功能。

任务一：我们以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。

data = pd.read_csv(r'data\test.csv')
data.head()

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
2	894	2	Myles, Mr. Thomas Francis	male	62.0	0	0	240276	9.6875	NaN	Q
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S

data[data['Age'] < 10]

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
21	913	3	Olsen, Master. Artur Karl	male	9.00	0	1	C 17368	3.1708	NaN	S
80	972	3	Boulos, Master. Akar	male	6.00	1	1	2678	15.2458	NaN	C
89	981	2	Wells, Master. Ralph Lester	male	2.00	1	1	29103	23.0000	NaN	S
117	1009	3	Sandstrom, Miss. Beatrice Irene	female	1.00	1	1	PP 9549	16.7000	G6	S
161	1053	3	Touma, Master. Georges Youssef	male	7.00	1	1	2650	15.2458	NaN	C
194	1086	2	Drew, Master. Marshall Brines	male	8.00	0	2	28220	32.5000	NaN	S
196	1088	1	Spedden, Master. Robert Douglas	male	6.00	0	2	16966	134.5000	E34	C
201	1093	3	Danbom, Master. Gilbert Sigvard Emanuel	male	0.33	0	2	347080	14.4000	NaN	S
203	1095	2	Quick, Miss. Winifred Vera	female	8.00	1	1	26360	26.0000	NaN	S
250	1142	2	West, Miss. Barbara J	female	0.92	1	2	C.A. 34651	27.7500	NaN	S
263	1155	3	Klasen, Miss. Gertrud Emilia	female	1.00	1	1	350405	12.1833	NaN	S
281	1173	3	Peacock, Master. Alfred Edward	male	0.75	1	1	SOTON/O.Q. 3101315	13.7750	NaN	S
283	1175	3	Touma, Miss. Maria Youssef	female	9.00	1	1	2650	15.2458	NaN	C
284	1176	3	Rosblom, Miss. Salli Helena	female	2.00	1	1	370129	20.2125	NaN	S
296	1188	2	Laroche, Miss. Louise	female	1.00	1	2	SC/Paris 2123	41.5792	NaN	C
307	1199	3	Aks, Master. Philip Frank	male	0.83	0	1	392091	9.3500	NaN	S
354	1246	3	Dean, Miss. Elizabeth Gladys Millvina""	female	0.17	1	2	C.A. 2315	20.5750	NaN	S
379	1271	3	Asplund, Master. Carl Edgar	male	5.00	4	2	347077	31.3875	NaN	S
389	1281	3	Palsson, Master. Paul Folke	male	6.00	3	1	349909	21.0750	NaN	S
409	1301	3	Peacock, Miss. Treasteall	female	3.00	1	1	SOTON/O.Q. 3101315	13.7750	NaN	S

任务二：以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage

# 方法一：
midage = data[(data['Age']>10) & (data['Age']<50)]   # 这里 交集 使用的 是 &
midage

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S
5	897	3	Svensson, Mr. Johan Cervin	male	14.0	0	0	7538	9.2250	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...
406	1298	2	Ware, Mr. William Jeffery	male	23.0	1	0	28666	10.5000	NaN	S
411	1303	1	Minahan, Mrs. William Edward (Lillian E Thorpe)	female	37.0	1	0	19928	90.0000	C78	Q
412	1304	3	Henriksson, Miss. Jenny Lovisa	female	28.0	0	0	347086	7.7750	NaN	S
414	1306	1	Oliva y Ocana, Dona. Fermina	female	39.0	0	0	PC 17758	108.9000	C105	C
415	1307	3	Saether, Mr. Simon Sivertsen	male	38.5	0	0	SOTON/O.Q. 3101262	7.2500	NaN	S

274 rows × 11 columns

data['Age']>10

0       True
1       True
2       True
3       True
4       True
       ...  
413    False
414     True
415     True
416    False
417    False
Name: Age, Length: 418, dtype: bool

data['Age']<50

0       True
1       True
2      False
3       True
4       True
       ...  
413    False
414     True
415     True
416    False
417    False
Name: Age, Length: 418, dtype: bool

(data['Age']>10) & (data['Age']<50)  # 注意：pandas 中 逻辑与：&， 逻辑或：|, 逻辑非：~ ，使用 and or not 则会报错

0       True
1       True
2      False
3       True
4       True
       ...  
413    False
414     True
415     True
416    False
417    False
Name: Age, Length: 418, dtype: bool

任务三：将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来

【提示】在抽取数据中，我们希望数据的相对顺序保持不变，用什么函数可以达到这个效果呢？

midage = data[(data['Age']>10) & (data['Age']<50)]
midage

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
3	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
4	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S
5	897	3	Svensson, Mr. Johan Cervin	male	14.0	0	0	7538	9.2250	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...
406	1298	2	Ware, Mr. William Jeffery	male	23.0	1	0	28666	10.5000	NaN	S
411	1303	1	Minahan, Mrs. William Edward (Lillian E Thorpe)	female	37.0	1	0	19928	90.0000	C78	Q
412	1304	3	Henriksson, Miss. Jenny Lovisa	female	28.0	0	0	347086	7.7750	NaN	S
414	1306	1	Oliva y Ocana, Dona. Fermina	female	39.0	0	0	PC 17758	108.9000	C105	C
415	1307	3	Saether, Mr. Simon Sivertsen	male	38.5	0	0	SOTON/O.Q. 3101262	7.2500	NaN	S

274 rows × 11 columns

观察以上数据，我们看到 midage 是筛选出来的数据，因此，它的索引是不连续的，我们使用iloc() 或者 iloc() 时，会因为索引不连续出问题。因此，我们使用 reset_index() 或者 reindex() 方法来重置索引。

When we reset the index, the old index is added as a column, and a new sequential index is used:

midage.reset_index() # 旧索引变成了一列, 生成新的对象，不改变原对象的值

	index	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
2	2	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
3	3	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S
4	4	897	3	Svensson, Mr. Johan Cervin	male	14.0	0	0	7538	9.2250	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...	...
269	269	1298	2	Ware, Mr. William Jeffery	male	23.0	1	0	28666	10.5000	NaN	S
270	270	1303	1	Minahan, Mrs. William Edward (Lillian E Thorpe)	female	37.0	1	0	19928	90.0000	C78	Q
271	271	1304	3	Henriksson, Miss. Jenny Lovisa	female	28.0	0	0	347086	7.7750	NaN	S
272	272	1306	1	Oliva y Ocana, Dona. Fermina	female	39.0	0	0	PC 17758	108.9000	C105	C
273	273	1307	3	Saether, Mr. Simon Sivertsen	male	38.5	0	0	SOTON/O.Q. 3101262	7.2500	NaN	S

274 rows × 12 columns

We can use the drop parameter to avoid the old index being added as a column:

midage.reset_index(drop=True)  # 去除旧索引

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892	3	Kelly, Mr. James	male	34.5	0	0	330911	7.8292	NaN	Q
1	893	3	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1	0	363272	7.0000	NaN	S
2	895	3	Wirz, Mr. Albert	male	27.0	0	0	315154	8.6625	NaN	S
3	896	3	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1	1	3101298	12.2875	NaN	S
4	897	3	Svensson, Mr. Johan Cervin	male	14.0	0	0	7538	9.2250	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...
269	1298	2	Ware, Mr. William Jeffery	male	23.0	1	0	28666	10.5000	NaN	S
270	1303	1	Minahan, Mrs. William Edward (Lillian E Thorpe)	female	37.0	1	0	19928	90.0000	C78	Q
271	1304	3	Henriksson, Miss. Jenny Lovisa	female	28.0	0	0	347086	7.7750	NaN	S
272	1306	1	Oliva y Ocana, Dona. Fermina	female	39.0	0	0	PC 17758	108.9000	C105	C
273	1307	3	Saether, Mr. Simon Sivertsen	male	38.5	0	0	SOTON/O.Q. 3101262	7.2500	NaN	S

274 rows × 11 columns

midage = midage.reindex(index=range(midage.shape[0])) # 这里 旧索引为 变成了一列

midage

	PassengerId	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	892.0	3.0	Kelly, Mr. James	male	34.5	0.0	0.0	330911	7.8292	NaN	Q
1	893.0	3.0	Wilkes, Mrs. James (Ellen Needs)	female	47.0	1.0	0.0	363272	7.0000	NaN	S
2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	895.0	3.0	Wirz, Mr. Albert	male	27.0	0.0	0.0	315154	8.6625	NaN	S
4	896.0	3.0	Hirvonen, Mrs. Alexander (Helga E Lindqvist)	female	22.0	1.0	1.0	3101298	12.2875	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...
270	1162.0	1.0	McCaffry, Mr. Thomas Francis	male	46.0	0.0	0.0	13050	75.2417	C6	C
271	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
272	1164.0	1.0	Clark, Mrs. Walter Miller (Virginia McDowell)	female	26.0	1.0	0.0	13508	136.7792	C89	C
273	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
274	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN

275 rows × 11 columns

midage.loc[[99], ['Pclass', 'Sex']]

	Pclass	Sex
99	3	male

midage.iloc[[99], [1, 3]]

	Pclass	Sex
99	3	male

注意：iloc(操作行, 操作列) 和 ioc() 方法的区别：iloc() 操作时只能是行索引(index), 和列索引, loc操作的是列名(cloumns)。

任务四：使用loc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

midage.loc[[100, 105, 108], ['Pclass', 'Name', 'Sex']]

	Pclass	Name	Sex
100	2	Lahtinen, Rev. William	male
105	1	Bird, Miss. Ellen	female
108	3	Peacock, Mrs. Benjamin (Edith Nile)	female

任务五：使用iloc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

midage.iloc[[100, 105, 108], [1, 2, 3]]

	Pclass	Name	Sex
100	2	Lahtinen, Rev. William	male
105	1	Bird, Miss. Ellen	female
108	3	Peacock, Mrs. Benjamin (Edith Nile)	female

第二天任务已完成！

复习：在前面我们已经学习了Pandas基础，知道利用Pandas读取csv数据的增删查改，今天我们要学习的就是探索性数据分析，主要介绍如何利用Pandas进行排序、算术计算以及计算描述函数describe()的使用。

数据分析（第二天）

数据类型

任务一：pandas中有两个数据类型DateFrame和Series，通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子?[开放题]

任务二：根据上节课的方法载入"train.csv"文件

任务四：查看"Cabin"这列的所有值[有多种方法]

任务五：加载文件"test.csv"，然后对比"train.csv"，看看有哪些多出的列，然后将多出的列删除

任务六： 将[‘PassengerId’,‘Name’,‘Age’,‘Ticket’]这几个列元素隐藏，只观察其他几个列元素

筛选的逻辑

任务一： 我们以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。

任务二： 以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage

任务三：将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来

任务四：使用loc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

任务五：使用iloc方法将midage的数据中第100，105，108行的"Pclass"，"Name"和"Sex"的数据显示出来

任务六：将[‘PassengerId’,‘Name’,‘Age’,‘Ticket’]这几个列元素隐藏，只观察其他几个列元素

任务一：我们以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。

任务二：以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage