自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Spark SQL编程初级实践

以自己学号(your student number)为第一条数据,生成20条数据(后面数据your student number依次递增1,name和age随机),详细格式如下。配置Spark通过JDBC连接数据库MySQL,编程实现利用DataFrame插入如表5-2所示的10行数据到MySQL中(学号递增,其他字段随机),最后打印出age的平均值。读取文件处理为RDD,接着转换为DataFrame,并按“id:1,name:Ella,age:36”的格式打印出DataFrame的所有数据。

2024-04-27 08:00:00 713

原创 RDD编程初级实践

已经预先将数据放在了/home/hadoop/mycode/ex2/实验2-数据.txt文件中,文件下载地址。

2024-04-24 12:00:00 1426

原创 Pandas数据分析

start指定起始日期,end指定结束日期,periods指定产生的数据数量# freq指定间隔,D表示天, W表示周, H表示小时# M表示月末最后一天,MS表示月初第一天# T 表示分钟,Y表示年末最后一天,YS表示年初第一天print("间隔5天".ljust(30, '='))print("间隔1周".ljust(30, '='))print("间隔2天,5个数据".ljust(30, '='))print("间隔3小时,8个数据".ljust(30, '='))

2024-04-24 09:00:00 517

原创 基本统计图绘制

基本统计图绘制。

2024-04-24 07:00:00 899

原创 Numpy操作及数据基本特征计算

Numpy操作及数据基本特征计算。

2024-04-23 18:00:00 229

原创 HDFS常用操作以及使用Spark读取文件系统数据

在HDFS中的“/user/hadoop”目录下,创建子目录input,把HDFS中“/user/hadoop”目录下的test.txt文件,复制到“/user/hadoop/input”目录下;删除HDFS中“/user/hadoop”目录下的test.txt文件,删除HDFS中“/user/hadoop”目录下的input子目录及其子目录下的所有内容。把HDFS中“/user/hadoop”目录下的test.txt文件,下载到Linux系统的本地文件系统中的“/home/hadoop/下载”目录下;

2024-03-16 11:50:13 1900 1

原创 安装Hadoop伪分布式及spark Local模式

在这里我也将hadoop用户密码设置为hadoop,虽然会提示密码不能少于8位,但是不用管这个提示,我们也将密码设置为hadoop就可以了。修改./conf/spark-env.sh配置文件(需要使用cp复制模板文件再进行修改)为hadoop用户添加使用sudo权限的权限(不然hadoop用户不能使用sudo)在终端输入下面命令,创建hadoop用户,并指定shell为/bin/bash。修改解压后的文件夹为spark,并修改内容所有者和所属组为hadoop。格式化NameNode名称节点。

2024-03-13 20:23:55 1737

原创 Python进行基本文件操作

编写程序,模拟生成某饭店自2020年1月1日开始连续100天试营业期间的营业额数据并写入CSV文件。文件中共两列,第一列为日期,第二列为营业额,文件第一行为表头或字段名称。假设该饭店第一天营业额基数为500元,每天增加5元,除此之外每天还会随机增加5到50元不等。合并两个.txt文件的内容,两个文件的多行内容交替写入结果文件,如果一个文件内容较少,则把另一个文件的剩余内容写入结果文件尾部。编写程序,读取并输出word文档中红色的文字。

2024-03-11 13:01:57 318

原创 Docker使用MySQL修改时区时遇到的问题

自从发现docke里面能拉MySQL后,就特别喜欢用docker里面的MySQL了,但是今天发现docker拉的MySQL使用的时区是UTC,和我们差了八个小时,我这种强迫症肯定不能忍啊,于是就开启了改时区之路。我们打算修改回来配置文件,结果发现进不去了,如下,必须要启动才能修改配置文件,但是启动不了,启动不了就是因为配置文件错误哦。下面是centos虚拟机查看时区的截图,Local time是CST,Universal time是UTC,没搞懂,先不管。,我的数据库里面的数据呢,怎么办。

2024-02-29 15:35:05 1217

原创 Android移动开发第二次作业

在第一次的作业源码基础上,丰富代码,实现RecycleView瀑布流和滑动,同时在列表页上点击跳到另一详情页面上。

2023-10-29 17:06:28 178 1

原创 Android移动开发第一次作业

【代码】Android移动开发第一次作业。

2023-10-15 20:20:14 168 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除