气象分析

气象数据分析
首先将1920s.txt的文件导入到usr路径下,或者是自己随意自己的路径,
打开spark的sbin目录:
./start-all.sh 进行打开全部
退出到sbin目录,进入到bin目录 cd… cd bin
打印spark ./pyspark

问题1:file开始的时候后面没有加上:一直在报错。
问题2:总是找不到‘sc’。

解决方法2:重新启动虚拟机,进行上面的步骤,成功。


找到自己所存放的路径,我的是usr,
meteorologicalData = sc.textFile(“file:///usr/1920s.txt”) 注意:file后面是三个///,还要加上冒号,
不加冒号不会出来结果,来获取我们的静态数据;

然后进行打印第一行 meteorologicalData first() first后面要加上括号,如果打印出第一行
可以进行下面的步骤。

选取数据中我们需要的信息你(年份,温度)
temperatureData = meteorologicalData.filter(lambda line : line[87:92] != ‘+9999’ and line[50:51] in ‘01459’).map(lambda line : (line[15:19],line[87:92]))

根据气温进行排序,首先是最高气温
temperatureData.sortBy(lambda x : int(x[1]),False).take(10)

然后根据上面的数据进行温度排序,是最低气温
temperatureData.sortBy(lambda x : int(x[1])).take(10)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值