python数据分析案例简单实战项目(二)--新冠疫情数据分析

项目背景

2020 年 1 月新型冠状病毒(以下简称新冠)肺炎在极短时间内就在全球范围内大规模流行,据美国约翰斯·霍普金斯大学 11 月 8 日发布的新冠疫情最新统计数据显示,截至美国东部时间 11 月 8 日 11 时 24 分全球累计确诊人数超过 5000万,死亡人数超过125万。由于新冠病毒的传播速度快、致死率较高,世界卫生组织称新冠是百年一遇的人类公敌。自新冠肺炎爆发以来,面对社会对疫情信息的迫切需求,各级政府部门通过多种渠道及时发布第一手相关数据,许多组织和个人也迅速行动,利用多种分析手段为公众提供疫情数据的解读分析,以消除公众的恐慌情绪,提高人们的自我防护意识,配合政府的防疫措施,为我国最终打赢疫情防控阻击战发挥了巨大的推动作用。

项目目标

1.根据附件1中“城市疫情”的数据统计各城市自首次通报确诊病例后至 6 月 30日的每日累计确诊人数、累计治愈人数和累计死亡人数,将结果保存为“task3_1.csv”,第一行为字段名,按城市、日期、累计确诊人数、累计治愈人数、累计死亡人数的次序分别放在 A 列~E 列。在报告中给出实现方法的相关描述,并列表给出武汉、深圳、保定每月 10、25 日的统计结果。

实现思路:对城市进行分组,获得单个城市的所有数据,传入时间遍历处理函数,按照日期从1-10到6-30进行遍历,找到对应日期进行累加。

处理完之后判断是否是三城市之一,传输另外的处理函数,输出10、25日的统计结果,存在一个新的表中。

import pandas as pd
import datetime

fileName = '附件1.xlsx'


def opfile(fileName):
    data = pd.read_excel(fileName)
    return data


def rename(data):
    data.rename(columns={'新增确诊': '累计确诊人数'}, inplace=True)  # 更改列标签
    data.rename(columns={'新增治愈': '累计治愈人数'}, inplace=True)  # 更改列标签
    data.rename(columns={'新增死亡': '累计确诊死亡'}, inplace=True)  # 更改列标签


def special(data, city):
    data['日期'] = pd.to_datetime(data['日期'])
    da1 = data.set_index('日期')
    s1 = da1['2020-01-10':'2020-01-10']
    for i in range(1, 7):  # 数据是从20年1月到6月的 故range(1,7)
        s = da1['2020-0{}-15'.format(i):'2020-0{}-15'.format(i)]
        s1 = pd.concat([s1, s], axis=0, join='outer')  # 数据合并
        s = da1['2020-0{}-10'.format(i + 1):'2020-0{}-10'.format(i + 1)]
        s1 = pd.concat([s1, s], axis=0, join='outer')
    #print(s1)
    s1.to_csv(r"task3_1_1.csv", index=True, header=1 if city == '武汉' else 0, na_rep='0', encoding='GB18030', mode='a')


def calculate(data):
    for i in range(0, len(data["城市"].value_counts())):
        da = data[data["城市"] == data["城市"].value_counts().index[i]]#得到只有一个城市的数据
        ans = timefor(da).set_index('城市')
        ans.to_csv(r"task3_1.csv", index=True, header=1 if i==0 else 0, na_rep='0', encoding='GB18030', mode='a')


def timefor(data):
    begin = datetime.date(2020, 1, 10)
    end = datetime.date(2020, 6, 30)
    d = begin
    list1 = ['武汉', '深圳', '保定']
    city = data['城市'].iloc[0]

    print(city)
    delta = datetime.timedelta(days=1)#日期每天加1
    temp = pd.DataFrame(data=None, columns=['日期', '城市', '累计确诊人数', '累计治愈人数', '累计确诊死亡'])

    i = 0
    j = 0

    while d <= end:
        if d in data['日期'].values:
            if j == 0:
                temp.loc[j] = [d, city, data['累计确诊人数'].iloc[i], data['累计治愈人数'].iloc[i], data['累计确诊死亡'].iloc[i]]
            else:
                temp.loc[j] = [d, city, temp.loc[j-1]['累计确诊人数'] + data['累计确诊人数'].iloc[i], temp.loc[j-1]['累计治愈人数'] + data['累计治愈人数'].iloc[i], temp.loc[j-1]['累计确诊死亡'] + data['累计确诊死亡'].iloc[i]]
            i += 1
        else:
            if j == 0:
                temp.loc[j] = [d, city, 0, 0, 0]
            else:
                temp.loc[j] = [d, city, temp.loc[j-1]['累计确诊人数'], temp.loc[j-1]['累计治愈人数'], temp.loc[j-1]['累计确诊死亡']]
        j += 1
        d += delta
    if city in list1:
        special(temp, city)
    return temp


if __name__ == '__main__':
    data = opfile(fileName)
    rename(data)
    data['日期'] = pd.to_datetime(data['日期'], format='%Y-%m-%d').dt.date
    calculate(data)


  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python数据分析案例简单实战项目是指通过使用Python编程语言来进行数据分析,应用于实际生活中的项目。这些项目通常涉及数据的收集、清理、分析和呈现。通过这些实战项目,人们可以学习如何使用Python编程语言来处理和分析不同类型的数据,例如金融数据、交通数据、医疗数据等。同时,实战项目也帮助人们更好地理解数据分析的基本概念,如数据可视化、统计分析、机器学习等,从而提高数据分析的能力和水平。 ### 回答2: Python作为一门十分灵活的编程语言,在数据分析领域中也扮演着越来越重要的角色。Python数据分析案例简单实战项目意味着结合理论知识和实际案例,来帮助初学者更好地理解Python数据分析的应用。 以下是一些简单Python数据分析案例实战项目: 1. 电影票房分析 通过爬虫等方式获得某个时段内的电影票房数据,利用Pandas等Python数据处理库对这些数据进行清洗、筛选等操作,并可视化呈现。同时,还可以根据分析结果推断出不同电影类型的受欢迎程度,有助于电影公司继续推出受欢迎的影片。 2. 医院病人数据分析 通过分析医院病人的病历记录和医疗费用数据,可以挖掘出许多有用的信息,如病种与医疗费用的关系、病人就诊时间的分布等。这些分析结果对医院的改善管理和治疗质量提升都有很大帮助。 3. 网页访问量分析 通过分析网站的访问量数据,可以知道哪些文章和页面最受欢迎,用户在网站上的行为模式等,这些分析结果可以用来制定更好的网站内容策略,改善用户体验。 最后,Python数据分析案例简单实战项目不仅可以提供初学者熟悉Python数据分析的方法和流程,也能帮助他们提升数据分析的能力和理解。 ### 回答3: Python数据分析数据分析领域中最常用的语言之一,它具有简单易学、强大高效等特点,因此越来越受到数据分析师的青睐。本文将介绍一些Python数据分析简单实战案例项目,帮助初学者更好地掌握数据分析技能。 1. 股票市场分析 股票市场分析是使用Python进行数据分析的常见应用之一。通过数据分析,可以了解股票市场走势、分析相关因素对股票价格的影响、确定投资策略等。这里,我们可以使用Pandas库下载股票数据,使用Matplotlib库进行可视化展示,通过均线、RSI等技术指标进行分析。 2. 商品销售数据分析 对于电商平台来说,销售数据是非常重要的信息。通过商品销售数据分析,可以了解商品的销售情况、用户的购买习惯、商品的热门时段等。可以使用Pandas库读取销售数据,通过数据清洗、数据可视化等操作进行分析,帮助商家更好地制定产品策略和营销方案。 3. 网络爬虫分析 对于搜索引擎来说,网站的数据和内容是非常重要的。通过网络爬虫,可以获取海量的网站数据、文本、图片、视频等信息,进行分析和应用。使用Python搭建网络爬虫比较简单,可以使用Beautiful Soup、Requests等库进行操作,获取所需数据后,可以进行内容分析、情感分析、关键词提取等操作。 4. 新闻自动摘要生成 在文本领域,新闻自动摘要是一项重要的应用。新闻自动摘要是通过人工智能算法,对新闻文本进行分析和提取,生成简短、准确、可读性强的摘要。可以使用Python中的自然语言处理技术,对新闻文本进行分词、去停用词、词性标注等操作,使用TextRank、LDA等算法进行分析,生成摘要,并结合NLTK、SnowNLP等库进行情感分析。 总结来说,以上四个案例项目是Python数据分析的常见应用,对于数据分析入门者来说,尝试进行实践有助于掌握Python数据分析技能,提升分析能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值