pandas作业

练习1

  • 读取北向.csv 指定 trade_date 为 行索引
  • 查看数据的基本信息 有无缺失值 对其缺失值进行处理
  • 删除缺失值所在行
  • 查看数据的基本信息 查看数据是否清洗完毕
  • 标签为 index 这列没啥用 将该列删除
  • 观察数据是否有重复行
  • 将重复行进行删除
  • 将行索引 进行升序
  • 将处理好的数据 保存至 北向(副).csv
import pandas as pd
import numpy as np

# 读取文件
data = pd.read_csv("北向.csv",index_col= 1)
data

# 查看基本信息
data.info

# 去除缺失值所在的行
data = data.dropna()
data

# 删除index这列
del data["index"]
data

# 删除重复行
data.duplicated()
data.drop_duplicates(inplace = True)
data

# 将行索引进行升序排序
data = data.sort_index()
data

# 保存文件
data.to_csv("北向副1.csv")

练习2

  • 读取 FoodFacts.csv 数据,该数据是全球食品数据,需分析每个国家添加剂的平均使用。
    步骤分析
  • 1.读取数据
  • 2.数据质量考量
  • 3.清洗数据
  • 4.对各个国家的使用数量进行统计
  • 1.清洗,统计国家数据
  • 2.通过国家统计添加剂用量
  • 5.保存统计结果
import numpy as np
import pandas as pd

origin_data = pd.read_csv("FoodFacts.csv",usecols=["countries_en","additives_n"])
origin_data

# 去重
origin_data = origin_data.dropna()
origin_data



# 获取国家数据
def get_country(data):
    country = []
    data1 = data[~data.str.contains(",")]
    for country_name in data:
        if country_name in country:
            pass
        else:
            country.append(country_name)
    return country
country_list = get_country(origin_data["countries_en"])


# 对每一个国家的数据进行汇总
additives_n_data = []
for country in country_list:
    data1 = origin_data[origin_data["countries_en"].str.contains(country,case=False)]


#     求各个国家使用添加剂的总剂量
#     a = 0
#     for i in data1["additives_n"]:
#         a = a + i


    a = data1["additives_n"].mean()
    additives_n_data.append(a)
    
# 创建新表保存数据
df = pd.DataFrame({"country" : country_list,"num" : additives_n_data}
df.to_csv("各过添加剂使用量")

在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值