天虎网上超市销售系统getdate.py 练习

本文介绍了使用Python的pandas库进行数据处理的实践,通过getdate.py脚本从天虎网上超市销售系统获取数据,为后续的机器学习分析做准备。
摘要由CSDN通过智能技术生成

 代码来自 echarts 数据可视化项目实践

​

import pandas as pd
from pandas import DataFrame

# 读取数据
df1 = pd.read_csv(r'file path', encoding='gbk')
df2 = pd.read_csv(r'file path', encoding='gbk')
# 异常数据处理
df1 = df1.dropna()
df2 = df2.dropna()
# 两表合并
df = df1.merge(df2, on='Goods')


# 创建h_task1来进行柱形图的数据处理
def h_task1():
    df_1 = df[df['Types'] == '非酒精饮料']
    df_2 = df_1.groupby(['Good']).count()
    df_3 = df_2['Types']
    # 将df_3的数据转换为DataFrame
    tmp1 = pd.DataFrame(df_3)
    # 将索引和值转换为列表
    v = tmp1.values.tolist()
    name = tmp1.values.tolist()
    # 列表v[[],[],[],[]......],再次处理转为新的列表格式
    value = []
    for i in v:
        value.append(i[0])
    # 返回字典格式数据
    return {
        # name是非酒精饮料类型商品的名称
        'name': name,
        'value': value}


def h_task2():
    df_1 = df.groupby(['Goods']).count()
    # 按照id降序排列
    df_2 = df_1.sort_values(by='ID', ascending=False)
    # 取出前十条数据
    tmp = df_2.iloc[0:10, 0:1]
    # 将索引和值转换为列表
    name = tmp.index.tolist()
    v = tmp.values.tolist()
    # 列表v[[],[],[],[]......],再次处理转为新的列表格式
    value = []
    for i in v:
        value.append(i[0])
        value.reverse()
        name.reverse()
    return {
        # name是非酒精饮料类型商品的名称
        'name': name,  # 商品名
        'value': value  # 商品数量
    }


def h_task3():
    # 按商品的类型统计数
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值