数据分析——pandas作业3

最新推荐文章于 2024-04-09 12:48:58 发布

Seasons in the snow

最新推荐文章于 2024-04-09 12:48:58 发布

阅读量391

点赞数

分类专栏：数据分析文章标签：数据分析

本文链接：https://blog.csdn.net/m0_37940048/article/details/119446282

版权

数据分析专栏收录该内容

8 篇文章 0 订阅

订阅专栏

第一题

1.读取lianjia.csv文件里的数据
2.观察结构，调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
3.增加一个列关于目前状况（state），是否卖出状态随机设定
4.查找楼层低的房子（这里提取低楼层）
5.电梯这列存在缺失值,想办法处理下缺失值

1.读取lianjia.csv文件里的数据

代码

import numpy as np
import pandas as pd

lianjia_df = pd.read_csv('链家.csv')
print(lianjia_df.info())
print(lianjia_df.head())

运行结果

2.观察结构，调整列索引顺序

代码

lianjia_df = lianjia_df.reindex(columns=["Region","Garden","Layout","Floor","Year","Size","Elevator","Direction","Renovation","Price"])
print(lianjia_df)

运行结果

3.增加一个列关于目前状况（state），是否卖出状态随机设定

代码

lianjia_df['state'] = np.random.choice(['on sell','sold out'],size=(1710))
print(lianjia_df)

运行结果

4.查找楼层低的房子（这里提取低楼层）

代码

# 方法1
print(lianjia_df[lianjia_df['Floor'].str.contains('低楼层')])

# 方法2
lianjia_df['Floor_height'] = lianjia_df['Floor'].replace('\(.*?\)','',regex=True)
print(lianjia_df[lianjia_df['Floor_height'] == '低楼层'])

运行结果

5.电梯这列存在缺失值,想办法处理下缺失值

代码

lianjia_df.dropna(inplace=True)
print(lianjia_df.info())
print(lianjia_df)

运行结果

Seasons in the snow

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
数据分析——pandas作业3

目录第一题1.读取lianjia.csv文件里的数据2.观察结构，调整列索引顺序3.增加一个列关于目前状况（state），是否卖出状态随机设定4.查找楼层低的房子（这里提取低楼层）5.电梯这列存在缺失值,想办法处理下缺失值第一题1.读取lianjia.csv文件里的数据2.观察结构，调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)3.增加一个列关于
复制链接

扫一扫