自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 centOS8 yum安装问题 Repository extras is listed more than once in the configurationCentOS-8 - Base - Al

由于CentOS 8的官方源已停止维护(EOL),导致yum无法下载软件包。为解决此问题,可以改用CentOS 8的存档仓库(vault.centos.org)。具体步骤包括:首先备份现有仓库配置,然后创建新的仓库文件,指向存档仓库的BaseOS和Extras路径。最后清理yum缓存并重建缓存,即可正常安装软件。

2025-05-21 14:13:18 184

原创 centOS8修改网络设置换成固定IP ping不同

解决ping百度不通 网关问题

2025-05-21 12:28:37 208

原创 0基础学习鸿蒙开发-HarmonyOS4

0基础学习harmonOS4

2025-05-06 11:57:17 1161

原创 0基础入门scrapy 框架,获取豆瓣top250存入mysql

python scrapy框架入门爬取豆瓣top250数据信息存入mysql中

2025-03-31 10:37:35 927

原创 大数据开发面试宝典

大数据面试宝典312个问题,问题涵盖广、从自我介绍到大厂实战、19大主题,一网打尽、真正提高面试成功率

2024-11-11 14:13:50 1206

原创 利用pyspark实现运行sql文件

【代码】利用pyspark实现运行sql文件。

2024-09-02 13:49:46 643

原创 PB级内存计算项目实战-富华保险

在保险行业中,最为核心技术就是精算,精算简单来说就是根据人的年龄来计算应交保费问题,通过精算,让整个保险行业更加专业化,精细化 从而取代之间依靠经验判断的方式精算到目前为止,并不仅仅计算保费,主要包含:确定保险费率、应付意外损失的准备金、自留限额、未到期责任准备金和未决赔款准备金等方面,都力求采用更精确的方式取代以前的经验判断保险精算学主要研究事故的出险规律损失的分布规律保费的厘定保险产品的设计准备金的提取偿付能力等保险具体问题。理赔数据Oracle数据源。

2024-09-02 13:47:34 1443 1

原创 请编写代码,针对words.txt文本(此文本已经存储在HDFS的/pydata/input/文件夹下)进行词频计算。要求1,将词频统计的结果存储在HDFS的/pydata/output5/路径下

请编写代码,针对words.txt文本(此文本已经存储在HDFS的/pydata/input/文件夹下)进行词频计算。前三:[('hadoop', 10), ('hello', 10), ('hive', 9)]要求2,统计词频前三的单词,统计词频最高的单词,统计词频最低的单词,呈现结果如下。最高:('hadoop', 10)最低:('world', 4)

2024-08-27 09:59:16 334

原创 0基础学习spark

0基础学习spark的一些笔记和总结

2024-08-26 15:45:04 1518

原创 JAVA_HOME is not setTraceback (most recent call last): File “/export/data/workspace/pyspark_paren

JAVA_HOME is not setTraceback (most recent call last): File "/export/data/workspace/pyspark_paren

2024-08-17 13:11:00 409 1

原创 需求一:统计每款的SPU(货号)数量,并按SPU数量降序排序。需求二:统计实际总销售额与客单价(结果保留两位小数)需求三:请你统计折扣率需求四:请你统计每款的动销率与售罄率统计连续2天及以上在该店铺购

需求一:统计每款的SPU(货号)数量,并按SPU数量降序排序。需求五:请你统计连续2天及以上在该店铺购物的用户及其对应的次数。需求二:统计实际总销售额与客单价(结果保留两位小数)需求四:请你统计每款的动销率与售罄率。需求三:请你统计折扣率。

2024-08-13 12:48:16 646

原创 项目:千亿级离线数仓项目

整个项目的数据源都是集中在MySQL中的,通过sqoop完成数据的导入操作,将数据导入到HDFS中使用HIVE构建相关的表,建立数仓体系,在HIVE进行分层处理,在进行统计分析的时候,采用presto提升分析的效率,将分析的结果导出到Mysql中,最后使用fineBi完成报表展示操作。整个项目基于c1oudera manager进行监控管理,使用oozie完成工作流的调度操作。

2024-08-12 15:06:40 1164 3

原创 hive练习:编写一个SQL查询来报告获胜候选人的名字(即获得最多选票的候选人),生成测试用例以确保只有一个候选人赢得选举。

【代码】hive练习:编写一个SQL查询来报告获胜候选人的名字(即获得最多选票的候选人),生成测试用例以确保只有一个候选人赢得选举。

2024-08-01 10:46:08 177

原创 hive 练习 :请编写一个SQL,用于查询每个玩家第一次登录游戏平台,用的那个设备。

【代码】hive 练习 :请编写一个SQL,用于查询每个玩家第一次登录游戏平台,用的那个设备。

2024-08-01 10:24:29 213

原创 0基础学习Hive

hive的入门和一些函数与优化

2024-07-30 17:10:01 1260

原创 解决Hive初始化报错:F4J: Found binding in [jar:file:/export/server/hadoop/share/hadoop/common/lib

原因是 guava-19.0.jar 这个包没删除导致hive不确定使用哪个包。

2024-07-26 16:48:55 560

原创 0基础学习-Hadoop

分为LInux基础以及Hadoop

2024-07-25 16:54:33 1174

原创 yum 安装时出现的问题 oaded plugins: fastestmirror Loading mirror speeds from cached hostfile Could not retri

yum 安装时出现的问题 oaded plugins: fastestmirror Loading mirror speeds from cached hostfile Could not retri

2024-07-22 16:23:12 2618 7

原创 对于每个员工,查询他除最近一个月(即最大月)之外,剩下每个月的近三个月的累计薪水(不足三个月也要计算),结果请按 Id 升序,然后按 Month 降序显示

Employee 表保存了一年内的薪水信息,请你编写 SQL 语句,对于每个员工,查询他除最近一个月(即最大月)之外,剩下每个月的近三个月的累计薪水(不足三个月也要计算),结果请按 Id 升序,然后按 Month 降序显示。

2024-07-20 23:11:56 294

原创 sql-练习:编写一个 SQL 查询,筛选出过去一年中订单总量 少于10本 的 书籍 ,不考虑 上架(available from)距今 不满一个月 的书籍。并且 假设今天是 2019-06-23

【代码】编写一个 SQL 查询,筛选出过去一年中订单总量 少于10本 的 书籍 ,不考虑 上架(available from)距今 不满一个月 的书籍。并且 假设今天是 2019-06-23。

2024-07-20 21:27:45 368

原创 sql-练习:编写一个 SQL 查询,选出每个销售产品 第一年 销售的 产品 id、年份、数量 和 价格。

【代码】sql-练习:编写一个 SQL 查询,选出每个销售产品 第一年 销售的 产品 id、年份、数量 和 价格。

2024-07-20 21:05:46 431

原创 0基础学SQL(SQL+Kettle+FineBl)

SQL基础包含SQL+Kettle+FineBl

2024-07-18 16:29:18 1178

原创 0基础学Python-进阶编程

python:闭包、装饰器、前端基础、socket网络编程、tcp、http、进程与线程、fast

2024-07-16 15:39:53 1316

原创 0基础学Python-面向对象

包含 面向对象和面向过程的区别和三大特性,类的定义以及继承

2024-07-12 16:34:33 929

原创 0基础学Python-Python基础

0基础学习Python过程中的一些总结和案例

2024-07-09 23:44:31 900 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除