头歌-企业Spark案例--酒店数据分析实战

最新推荐文章于 2024-07-18 06:28:12 发布

自信喵 QAQ

最新推荐文章于 2024-07-18 06:28:12 发布

阅读量1.1k

点赞数 7

文章标签： spark 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bzzb52/article/details/138454498

版权

本文介绍了四个步骤，包括数据清洗（过滤和格式化字段）、数据分析（计算入住时间、离开时间、酒店入住次数和用户年度行为），展示了如何使用SparkSession和DataFrame在ApacheSpark中处理和分析CSV数据以提取有价值的信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第1关数据清洗–过滤字段长度不足的且将出生日期转换成指定格式

package com.yy


import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{
   DataFrame, Dataset, SparkSession}

object edu{
   
    /**********Begin**********/
    // 此处可填写相关代码
    case class Person(id:String,Name:String,CtfTp:String,CtfId:String,Gender:String,Birthday:String,Address:String,Zip:String,Duty:String,Mobile:String,Tel:String,Fax:String,EMail:String,Nation:String,Taste:String,Education:String,Company:String,Family:String,Version:String,Hotel:String,Grade:String,Duration:String,City:String)
    /**********End**********/
    def main(args: Array[String]): Unit = {
   
        val spark = SparkSession
        .builder()
        .appName("Spark SQL")
        .master("local")
        .config("spark.some.config.option", "some-value")
        .getOrCreate()
        val rdd = spark.sparkContext.textFile("file:///root/files/part-00000-4ead9570-10e5-44dc-80ad-860cb072a9ff-c000.csv"

最低0.47元/天解锁文章

博客等级

码龄5年

25
原创

120
点赞

138
收藏

84
粉丝

关注

私信

热门文章

分类专栏

最新评论

头歌 SparkSQL数据源粘贴复制即可
Joyه٥: 感谢感谢，有没有下一关呀
头歌 SparkSQL数据源粘贴复制即可
学李奶奶:
头歌 SparkContext初始化--Java篇
自信喵 QAQ: 为了找这个代码，我还特意关注了个奇葩公众号，需要订阅题目，第二天才可以看答案，而csdn上大多需要冲会员才能看答案。为此方便大家，免费将答案给出。
字符串哈希个人理解包括解决kmp问题
CSDN-Ada助手: 非常感谢CSDN博主分享了关于字符串哈希的个人理解及解决KMP问题的博客。我觉得这样的技术文章对其他用户也非常有帮助。下一篇博客，我建议你可以继续探讨字符串相关的算法和数据结构，比如字符串匹配算法的优化、后缀数组、AC自动机等等。相信这些主题会吸引更多读者的关注和学习。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。