自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python学习---基于多线程的TCP服务端聊天框架搭建案例

【代码】Python学习---基于多线程的TCP服务端聊天框架搭建案例。

2024-05-22 15:28:52 145

原创 Python学习---基于HTTP的服务端基础框架搭建案例

整体功能:整体功能:1 创建框架构建相关的文件夹2 创建app,模块文件3 在 app模块文件中创建application函数(用于处理请求)4 将request_handler()中的处理逻辑交由app模块的application函数完成5 app模块的 application函数返回响应报文6 在application 文件夹中创建一个utils 模块7 utils 模块中创建 create_http_response() 函数,专门用来拼接响应报文。

2024-05-22 01:31:05 107

原创 Python学习---基于HTTP协议的Web服务器请求响应案例

1 Web服务器能够绑定固定端口2 Web服务器端能够接收浏览器请求3 Web服务器遵守HTTP协议﹐并返回"HelloWrold""字符串给浏览器4 当浏览器关闭后,Web服务器能够显示断开连接5 Web服务器短时间内重后,不会提示 address already in use错误。

2024-05-21 23:00:02 65

原创 Python学习---基于TCP的模拟浏览器请求响应案例

【代码】Python学习---基于TCP的模拟浏览器请求响应案例。

2024-05-21 18:54:24 129

原创 Python学习---基于TCP协议的文件下载器案例

【代码】Python学习---基于TCP协议的文件下载器案例。

2024-05-21 15:47:57 230

原创 Python学习---基于TCP协议的网络通信程序案例

●TCP 面向连接、可靠的、基于字节流的传输控制协议●TCP的特点○面向连接○可靠传输■应答机制■超时重传■错误校验■流量管控●TCP通信模型TCP严格区分客户端、服务端。

2024-05-21 14:00:16 260

原创 Python学习---基于UDP协议的多任务网络通信程序案例

【代码】Python学习---基于UDP协议的socket应用案例。

2024-05-21 11:12:21 207

原创 Java学习---面向对象基础之电影信息系统案例

【代码】Java学习---面向对象基础之电影信息系统案例。

2024-05-10 22:01:58 156

原创 Java学习---模拟双色球案例

2.随机生成一组中奖号码。1.用户投注一组号码。

2024-05-10 18:42:12 127

原创 hadoop学习---基于Hive的教育平台数据仓库分析案例(三)

hadoop学习---基于Hive的教育平台数据仓库分析案例(三)

2024-05-08 15:13:48 1041

原创 hadoop学习---基于Hive的教育平台数据仓库分析案例(二)

hadoop学习---基于Hive的教育平台数据仓库分析案例(二)

2024-05-07 13:37:08 851

原创 hadoop学习---基于Hive的数据仓库相关函数机制及其优化方案

基于Hive的数据仓库相关函数机制及其优化方案

2024-05-07 13:21:10 1392 1

原创 hadoop学习---基于Hive的索引机制及其优化方案

基于Hive的索引机制及其优化方案

2024-05-06 22:47:11 1065

原创 hadoop学习---基于Hive的数仓搭建增量信息拉链表的实现

基于hive的数仓搭建增量信息拉链表的实现

2024-05-06 20:41:36 471 1

原创 hadoop学习---Hive分桶表的机制及其查询优化方案

分桶是将数据集分解成更容易管理的若干部分的一个技术,是比分区更为细粒度的数据范围划分。主要是用于分文件的,在建表的时候,指定按照那些字段执行分桶操作,并可以设置需要分多少个桶,当插入数据的时候,执行MR的分区的操作,将数据分散各个分区(hive分桶)中,默认分发方案: hash 取模。

2024-05-05 10:45:37 1062

原创 hadoop学习---基于Hive的教育平台数据仓库分析案例(一)

基于hive的数据仓库搭建项目,主题是关于在线教育平台数据仓库搭建。

2024-05-04 17:37:22 1859 2

原创 hadoop学习---基于Sqoop的文件导入导出操作

譬如ID的范围是0-800,那么Sqoop默认运行4个进程,通过执行ISELECTMIN(id),MAX(id) FROM emp找出id的范围,然后把4个任务的id设置范围是(0-200),(200-400)(400-600).(600-800)但请注意,这样做的前提是这些文件的结构和内容必须是一致的,即它们应该都是同一份数据的切片或者是完全相同结构的数据。6. 带有主键约束的mysql表,要注意导出的数据的主键约束的情况,不能重复。4. 导出时,mysql的表的字段数与hdfs上的列数可以不相同。

2024-05-02 11:45:52 945

原创 hadoop学习---基于Hive的航空公司客户价值的LRFCM模型案例

在客户分类中,RFM模型是一个经典的分类模型,模型利用通用交易环节中最核心的三个维度——最近消费(Recency)、消费频率(Frequency)、消费金额(Monetary)细分客户群体,从而分析不同群体的客户价值。在某些商业形态中,客户与企业产生连接的核心指标会因产品特性而改变。如互联网产品中,以上三项指标可以相应地变为下图中的三项:最近一次登录、登录频率、在线时长。

2024-05-01 10:46:04 2158 5

原创 hadoop学习---基于Hive的聊天数据分析报表可视化案例

聊天平台每天都会有大量的用户在线,会出现大量的聊天数据,通过对。

2024-04-30 21:18:57 1326 1

原创 Linux配置MySQL数据库报错---ERROR 1193 (HY000): Unknown system variable ‘policy‘解决

【代码】Linux配置MySQL数据库报错---ERROR 1193 (HY000): Unknown system variable ‘policy‘解决。

2024-04-28 13:02:46 250

原创 Linux安装MySQL报错ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost‘ (using password: YES)

在[mysqld]后面任意一行添加“skip-grant-tables”用来跳过密码验证的过程。如果在数据库中刷新权限后会失效,需要重新启动MySQL服务后再进入数据库,还是建议设置密码。1.输入密码错误,注意大小写,空格特殊字符串。要输入密码的时候直接回车进入即可。

2024-04-28 12:53:28 365

原创 File contains parsing errors: file:///etc/yum.repos.d/nginx.repo报错解决,文件配置出现问题

解决方案:yum的配置文件出现问题,.repos.d目录下所有文件。

2024-04-28 12:07:29 391

原创 hadoop的webUI页面

http://主节点ip地址:8088。http://主节点ip地址:9870。

2024-04-27 20:36:24 72 1

原创 PySpark学习---销售情况数据统计分析案例

其中所有的服务都要开启,尤其注意hive的元数据存储服务和远程jdbc连接服务,看看9083端口,可能是集群中的任何一个节点,所有节点试着找一遍。导包的时候最好一个一个功能的导,不要用import * ,这个可能会导致未知错误,一些重复命名等问题。4.TOP3省份中,各个省份的支付类型。2.TOP3销售省份中,有多少家店铺。3.TOP3省份中各个省份的。1.将需求结果写出到。

2024-04-25 17:55:54 468 1

原创 Spark学习---连接hive直接用sql语句更新数据

测试代码:确保有可查询的表存在。连接数据库需要导入jar包。

2024-04-25 08:45:32 265

原创 SparkSql学习---执行sql语句到hive报错

【代码】SparkSql学习---执行sql语句到hive报错。

2024-04-24 21:17:19 75 1

原创 SparkSql学习---链接MySQL数据库并更新数据

要先向环境中添加mysql的jar包:数据库端口:3306用户:root密码:root数据库:spark。

2024-04-24 11:37:23 318

原创 SparkSql学习---数据清洗API

【代码】SparkSql学习---数据清洗API。

2024-04-24 09:57:45 96

原创 SparkSql学习---电影评分数据分析案例

【代码】SparkSql学习---电影评分数据分析案例。

2024-04-24 09:15:44 393

原创 SparkSql学习---单词词频统计案例

【代码】SparkSql学习---单词词频统计案例。

2024-04-23 22:42:49 126

原创 SparkSQL学习

1.和 Hive同样,都是用于大规模SQL分布式计算的计算框架,均可以运行在YARN本上,在企业中广泛被应用2. SparkSQL的数据抽象为:SchemaRDD(废弃)、DataFrame (Python、R、Java、Scala ) .DataSet (Java、scala)。3. DataFrame同样是分布式数据集,有分区可以并行计算,和RDD不同的是,DataFrame中存储的数据结构是以表格形式组织的,方便进行SQL计算。

2024-04-23 22:39:02 213

原创 spark学习---面试题

3.一个阶段的内部都是窄依赖,窄依赖内,如果形成前后1:1的分区对应关系,就可以产生许多内存迭代计算的管道。5.一个Task是一个具体的线程,任务跑在一个线程内,就是走内存计算了.4.这些内存迭代计算的管道,就是一个个具体的执行Task。2.DAG图会基于分区和宽窄依赖关系划分阶段。1.Spark会产生DAG图。

2024-04-23 15:01:52 84 1

原创 PySpark学习---广播变量和累加器之单词计数案例

由driver处理的变量给每个进程发送一份,而无需给每个task线程发送,节约网络。

2024-04-23 10:35:45 242

原创 Spark学习---RDD应用之新闻网站案例

【代码】Spark学习---RDD应用之新闻网站案例。

2024-04-23 09:17:14 296

原创 PySpark学习---RDD应用之搜索引擎日志分析案例

安装jieba分词库。

2024-04-22 22:42:57 140

原创 hadoop学习-----webUI界面和文件命令

http://主机地址:9870/explorer.html

2024-04-22 22:40:51 111

原创 PySpark学习----RDD副本cache和checkpoint

Cache是轻量化保存RDD数据,可存储在内存和硬盘,是分散存储,设计上数据是不安全的(保留RDD血缘关系)CheckPoint是重量级保存RDD数据,是集中存储,只能存储在硬盘(HDFS)上,设计上是安全的(不保留RDD血缘关系)

2024-04-22 20:11:56 203

原创 PySpark学习----RDD算子(API)学习记录

RDD--------弹性分布式数据集,分布式计算的实现载体(数据抽象)

2024-04-22 13:58:47 453

原创 PySpark学习---通过spark-submit提交到yarn运行

Linux上提交文件命令。

2024-04-22 13:41:01 260

原创 PySpark学习---RDD应用之商品分析案例

任务:提取北京的商品种类。

2024-04-22 12:52:18 283

服务器搭建所需资源:static文件夹

服务器搭建所需资源:static文件夹

2024-05-22

学生出勤模块sql文件

hadoop学习---基于Hive的教育平台数据仓库分析案例(三)学生出勤模块sql文件

2024-05-07

hadoop学习-基于Hive的教育平台数据仓库分析案例(二)意向用户模块sql文件

将文件导入创建好的数据库即可

2024-05-07

访问和咨询用户数据模块sql文件

访问和咨询用户数据模块sql文件

2024-05-04

hadoop学习-基于hive的航空公司客户价值的LRFCM模型案例数据源

hadoop学习-基于hive的航空公司客户价值的LRFCM模型案例数据源

2024-05-01

hadoop-基于hive的聊天数据分析报表可视化案例数据源

有30w条数据

2024-04-30

PySpark学习-销售情况数据统计分析案例数据源

PySpark学习---销售情况数据统计分析案例数据源

2024-04-25

【考研制胜法宝】‘408全科思维导图’:一键解锁知识迷宫,点亮考研通关之路

【考研必备】倾力打造的“408全科思维导图”现已耀目登场,为计算机考研的您带来前所未有的学习体验。这套导图深度契合统考大纲,对操作系统、计算机组成原理、计算机网络与数据结构四大板块的知识进行了系统性归纳与精炼概括,旨在引领您轻松穿越知识丛林,精准把握各科核心。 第一,全景展示:思维导图以直观的视觉化形式,将纷繁复杂的知识点有机串联,形成逻辑清晰、层次分明的知识脉络,助您瞬间把握各科整体框架,消除复习盲点。 第二,精准聚焦:针对各科重难点,导图特别标注关键知识点与典型例题,辅以精炼注解,让您在短时间内迅速锁定复习重点,高效攻克难关。无论是进程调度算法、Cache命中率计算,还是TCP三次握手过程、二叉树遍历方式,皆能一图掌握,了然于心。 第三,高效记忆:遵循认知科学原理,导图利用色彩、图形与层级关系,激发大脑联想记忆,使枯燥的知识点生动立体,大幅提升记忆效果。无论是短期突击还是长期巩固,都能助您轻松记忆,显著提高复习效率。 第四,灵活运用无论是课堂笔记整理、课后复习梳理,还是考前冲刺回顾、答题策略规划,均可灵活运用此思维导图,调整学习策略,确保备考全程游刃有余。

2024-04-21

决胜期末&考研:精选离散数学全章习题集

诚意献上“期末&考研高频离散习题集”,依据课程大纲,严选涵盖各章节的历年期末及考研真题,题型多样,难度适中,旨在全方位助力考生精准把握考点、提升应试技能。习题集强调理论与实践结合,通过解题训练培养严谨逻辑与抽象思维,助您融会贯通离散数学知识,高效备战期末考试与考研复试。 深化拓展,本习题集不仅局限于单一知识点的考察,更注重跨章节综合问题的呈现,模拟真实考试情境,强化知识间的关联与应用。每道题目均附详细解析,解析过程逻辑清晰、语言精炼,便于您对照自查、快速纠错,深化理解。此外,我们特别关注离散数学在计算机科学中的实际应用,融入相关实例,使抽象理论生动具象,提升您解决实际问题的能力。 为了适应不同备考阶段与个体差异,习题集设计了由易到难的梯度,满足您巩固基础、挑战自我、冲刺高分的多元需求。无论是梳理知识框架、查漏补缺,还是提升答题速度、锻炼解题思路,都能在此找到合适的练习素材。

2024-04-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除