数据分析之numpy实例

我在这里写了分析2013年北京城市污染情况,源文件我已经上传了,网址:[https://download.csdn.net/download/li_peipei/10709535],如果没有下载币的可以私聊我给你。

import numpy as np
#注释部分是我将原来的数据删除缺省值,因为for循环运行很耽误时间
#所以运行一次后就保存在了另外的文件中,接下来的代码就操作另外的文件
# a=np.loadtxt('./youtube_video_data/BeijingPM20100101_20151231.csv',delimiter=',',dtype='str',skiprows=1)
# beijingdata=np.array([[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18]])
# for i in a:
#     if i[6]!='NA' and i[7]!='NA' and i[8]!='NA':
#         beijingdata=np.append(beijingdata,[i],axis=0)
# np.savetxt('beijing.csv',beijingdata,fmt='%s',delimiter=',')
# print(beijingdata)
#读取文件,只读第1,2,6,7,8,且跳过第一行的标题
beijingdata=np.loadtxt('./beijing.csv',delimiter=',',dtype='int',skiprows=1,usecols=(1,2,6,7,8))
#所有的小时数
hours=beijingdata.shape[0]*3
#重度污染
heavy_count=np.sum(beijingdata[:,[2,3,4]]>150)
heavy_lu=heavy_count/hours
#中度污染
medium_count=np.sum(beijingdata[:,[2,3,4]]>75)-heavy_count
medium_lu=medium_count/hours
#轻度污染
light_count=np.sum(beijingdata[:,[2,3,4]]>35)-medium_count-heavy_count
light_lu=light_count/hours
#良好
good_count=np.sum(beijingdata[:,[2,3,4]]>0)-light_count-heavy_count-medium_count
good_lu=good_count/hours
print('不同程度的污染所占用的时间',heavy_lu,medium_lu,light_lu,good_lu)
monthdata=np.array([['时间','四环','四环东','农展馆']])
for i in range(3,13):
    t=beijingdata[:,1]==i
    hours_all=np.sum(t==True)
    first_monavg=np.sum(beijingdata[:,2][t])/hours_all
    second_monavg=np.sum(beijingdata[:,3][t])/hours_all
    third_monavg=np.sum(beijingdata[:,4][t])/hours_all
    time='2013-{}'.format(i)
    mon_list=np.array([time,str(first_monavg),str(second_monavg),str(third_monavg)])
    #print(mon_list)
    monthdata=np.vstack((monthdata,mon_list))
print('每月各个地区PM2.5的平均值:')
print(monthdata)

如果有错误或者问题请及时联系我

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
【为什么要学习NumpyNumPy是Python语言的一个扩展程序库。支持多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy是人工智能、数据分析从业者必备的知识和技能,也是学习后续Python扩展库(Matplotlib, SciPy, Pandas, Seaborn, Scikit-image等)的基础。【推荐你学习这门课的理由】(1)图文并茂:课程采用Jupyter Notebook讲解,图文并茂,讲述与Numpy代码对应。其文件将分享给学员,可作为交互式电子书使用。(2)案例丰富: 每个知识点均有Numpy代码示例说明;难点使用图解说明和讲述。另提供Numpy项目实战案例-鸢尾花数据集上的数据分析与计算。(3)内容全面系统:涵盖了Numpy的基础用法和高级用法,包括:ndarray、创建数组、复制数组、数组访问、数组运算、数组操作、迭代数组、maskedarray、结构化数组、通用函数、数学函数、统计函数、排序函数、条件查找、随机数、字节交换、线性代数、数据文件读写等。   玩转是一种境界,显示了对该领域有很大的兴趣,并非常了解和能娴熟使用。希望本课程能帮助大家玩转Numpy!【优惠说明】 课程正在优惠中! 备注:购课后可加入白勇老师课程学习交流QQ群:957519975【相关课程】《玩转Matplotlib数据绘图库》课程链接:https://edu.csdn.net/course/detail/28720 《Python编程的术与道:Python语言入门》课程链接: https://edu.csdn.net/course/detail/27845  《Python编程的术与道:Python语言进阶》课程链接: https://edu.csdn.net/course/detail/28618 【课程体系结构图】  

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值