pandas作业

最新推荐文章于 2024-07-18 16:43:18 发布

努力学python的新手小白

最新推荐文章于 2024-07-18 16:43:18 发布

阅读量235

点赞数 1

分类专栏：数据分析作业文章标签：数据分析

本文链接：https://blog.csdn.net/weixin_43024373/article/details/108457498

版权

数据分析作业专栏收录该内容

8 篇文章 0 订阅

订阅专栏

练习1

读取北向.csv 指定 trade_date 为行索引
查看数据的基本信息有无缺失值对其缺失值进行处理
删除缺失值所在行
查看数据的基本信息查看数据是否清洗完毕
标签为 index 这列没啥用将该列删除
观察数据是否有重复行
将重复行进行删除
将行索引进行升序
将处理好的数据保存至北向(副).csv

import pandas as pd
import numpy as np

# 读取文件
data = pd.read_csv("北向.csv",index_col= 1)
data

# 查看基本信息
data.info

# 去除缺失值所在的行
data = data.dropna()
data

# 删除index这列
del data["index"]
data

# 删除重复行
data.duplicated()
data.drop_duplicates(inplace = True)
data

# 将行索引进行升序排序
data = data.sort_index()
data

# 保存文件
data.to_csv("北向副1.csv")

练习2

读取 FoodFacts.csv 数据，该数据是全球食品数据，需分析每个国家添加剂的平均使用。
步骤分析
1.读取数据
2.数据质量考量
3.清洗数据
4.对各个国家的使用数量进行统计
1.清洗,统计国家数据
2.通过国家统计添加剂用量
5.保存统计结果

import numpy as np
import pandas as pd

origin_data = pd.read_csv("FoodFacts.csv",usecols=["countries_en","additives_n"])
origin_data

# 去重
origin_data = origin_data.dropna()
origin_data



# 获取国家数据
def get_country(data):
    country = []
    data1 = data[~data.str.contains(",")]
    for country_name in data:
        if country_name in country:
            pass
        else:
            country.append(country_name)
    return country
country_list = get_country(origin_data["countries_en"])


# 对每一个国家的数据进行汇总
additives_n_data = []
for country in country_list:
    data1 = origin_data[origin_data["countries_en"].str.contains(country,case=False)]


#     求各个国家使用添加剂的总剂量
#     a = 0
#     for i in data1["additives_n"]:
#         a = a + i


    a = data1["additives_n"].mean()
    additives_n_data.append(a)
    
# 创建新表保存数据
df = pd.DataFrame({"country" : country_list,"num" : additives_n_data}
df.to_csv("各过添加剂使用量")

在这里插入图片描述

努力学python的新手小白

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pandas作业

练习1读取北向.csv 指定 trade_date 为行索引查看数据的基本信息有无缺失值对其缺失值进行处理删除缺失值所在行查看数据的基本信息查看数据是否清洗完毕标签为 index 这列没啥用将该列删除观察数据是否有重复行将重复行进行删除将行索引进行升序将处理好的数据保存至北向(副).csvimport pandas as pdimport numpy as np# 读取文件data = pd.read_csv("北向.csv",index_col= 1)
复制链接

扫一扫