![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 80
冰露可乐
勤能补拙
展开
-
大数据:sql,数据挖掘刷题
大数据:sql,数据挖掘刷题原创 2023-12-05 23:10:55 · 757 阅读 · 0 评论 -
大数据:Hadoop刷题
大数据:Hadoop刷题原创 2023-12-01 21:23:00 · 2040 阅读 · 2 评论 -
软考:2024年软考高级:软件工程
软考:2024年软考高级:软件工程原创 2023-11-30 22:47:14 · 926 阅读 · 0 评论 -
Python大数据考题
刚刚睡醒原创 2023-11-26 13:56:03 · 707 阅读 · 0 评论 -
Python pandas数据分析
Python pandas数据分析原创 2023-11-25 22:45:59 · 1082 阅读 · 0 评论 -
大数据:SAS数据分析1,数据步,和过程步
大数据:SAS数据分析1,数据步,和过程步原创 2023-11-21 20:10:38 · 214 阅读 · 0 评论 -
决策树,sql考题,30个经典sql题目
决策树,sql考题,30个经典sql题目原创 2023-11-16 20:41:11 · 1528 阅读 · 1 评论 -
数据挖掘:关联规则,异常检测,挖掘的标准流程,评估指标,误差,聚类,决策树
数据挖掘:关联规则,异常检测,挖掘的标准流程,评估指标,误差,聚类,决策树原创 2023-11-12 19:00:18 · 2739 阅读 · 0 评论 -
数据挖掘:分类,聚类,关联关系,回归
数据挖掘:分类,聚类,关联关系,回归原创 2023-11-11 22:11:01 · 1794 阅读 · 0 评论 -
数据的属性与数据集,相似度,数据的质量,OLAP
数据的属性与数据集,相似度,数据的质量,OLAP原创 2023-11-11 19:50:38 · 189 阅读 · 0 评论 -
zookeeper
zookeeper原创 2023-11-10 23:15:21 · 1039 阅读 · 0 评论 -
Hadoop原理,HDFS架构,MapReduce原理
Hadoop原理,HDFS架构,MapReduce原理原创 2023-11-09 21:50:05 · 1913 阅读 · 1 评论 -
软考:中级软件设计师:2022年下半年上午软件设计师考题
软考:中级软件设计师:2022年下半年上午软件设计师考题原创 2023-11-07 23:02:28 · 818 阅读 · 0 评论 -
处理大数据的基础架构,OLTP和OLAP的区别,数据库与Hadoop、Spark、Hive和Flink大数据技术
处理大数据的基础架构,OLTP和OLAP的区别,数据库与Hadoop、Spark、Hive和Flink大数据技术原创 2023-10-28 20:58:05 · 1791 阅读 · 0 评论 -
软考:中级软件设计师:多媒体基础,音频,图像,颜色,多媒体技术的种类,图像音频视频的容量计算,常见的多媒体标准
软考:中级软件设计师:多媒体基础,音频,图像,颜色,多媒体技术的种类,图像音频视频的容量计算,常见的多媒体标准原创 2023-09-03 22:56:00 · 445 阅读 · 0 评论 -
软考:中级软件设计师:程序语言基础:表达式,标准分类,法律法规,程序语言特点,函数传值传址
软考:中级软件设计师:程序语言基础:表达式,标准分类,法律法规,程序语言特点,函数传值传址原创 2023-09-03 21:24:52 · 531 阅读 · 0 评论 -
软考:中级软件设计师:大数据
软考:中级软件设计师:大数据原创 2023-08-27 15:31:31 · 862 阅读 · 0 评论 -
软考:中级软件设计师:数据库恢复与备份,故障与恢复,反规范化
软考:中级软件设计师:数据库恢复与备份,故障与恢复,反规范化原创 2023-08-27 09:49:04 · 1565 阅读 · 0 评论 -
软考:中级软件设计师:关系代数:中级软件设计师:关系代数,规范化理论函数依赖,它的价值和用途,键,范式,模式分解
软考:中级软件设计师:关系代数:中级软件设计师:关系代数,规范化理论函数依赖,它的价值和用途,键,范式,模式分解原创 2023-08-26 22:05:40 · 370 阅读 · 0 评论 -
大数据:sparkSQL编程语法,DSL风格,SQL风格,select,filter,where,groupBy,createTempView,sql.functions
大数据:sparkSQL编程语法,DSL风格,SQL风格,select,filter,where,groupBy,createTempView,sql.functions原创 2023-06-08 11:27:04 · 794 阅读 · 0 评论 -
大数据:sparkSQL,DataFrame,schema,toDF,createDataFrame,pandas,读取read.format.schema.load
大数据:sparkSQL,DataFrame,schema,toDF,createDataFrame,pandas,读取read.format.schema.load原创 2023-06-08 11:00:08 · 244 阅读 · 0 评论 -
大数据:sparkSQL,历史,DataSet,DataFrame,sparkSession
大数据:sparkSQL,历史,DataSet,DataFrame,sparkSession原创 2023-06-06 22:28:58 · 576 阅读 · 0 评论 -
大数据:spark新特性,shuffle,hashshufflemanager,sortshufflemanager,spark新特性,AQE,动态分区,koalas实现pandas库
大数据:spark新特性,shuffle,hashshufflemanager,sortshufflemanager,spark新特性,AQE,动态分区,koalas实现pandas库原创 2023-06-06 12:09:05 · 152 阅读 · 0 评论 -
大数据:spark任务调度,DAGscheduler,Taskscheduler
大数据:spark任务调度,DAGscheduler,Taskscheduler原创 2023-06-05 19:08:59 · 670 阅读 · 0 评论 -
大数据:spark内核调度,DAG,job,宽窄依赖,stage阶段,内存计算管道,并行度task数量
大数据:spark内核调度,DAG,job,宽窄依赖,stage阶段,内存计算管道,并行度task数量原创 2023-06-05 13:24:46 · 804 阅读 · 0 评论 -
大数据:spark共享广播变量,累加器
大数据:spark共享广播变量,累加器原创 2023-06-05 12:28:49 · 601 阅读 · 0 评论 -
大数据:RDD持久化,RDD数据是过程数据,缓存,checkpoint,
大数据:RDD持久化,RDD数据是过程数据,缓存,checkpoint,原创 2023-06-04 17:31:03 · 152 阅读 · 0 评论 -
大数据:RDD action算子:foreach,saveAsText,mapPartitions,foreachPartition,partitionBy,repartition,
大数据:RDD action算子:foreach,saveAsText,mapPartitions,foreachPartition,partitionBy,repartition,原创 2023-06-04 16:21:49 · 165 阅读 · 0 评论 -
大数据:wordcount案例RDD编程算子,countByKey,reduce,fold,first,take,top,count,takeSample,takeOrdered
大数据:wordcount案例RDD编程算子,countByKey,reduce,fold,first,take,top,count,takeSample,takeOrdered原创 2023-06-04 15:50:40 · 217 阅读 · 0 评论 -
大数据:RDD算子,filter,distinct,union,join,intersection,glom,groupByKey,sortBy,sortByKey
大数据:RDD算子,filter,distinct,union,join,intersection,glom,groupByKey,sortBy,sortByKey原创 2023-06-04 10:59:22 · 148 阅读 · 0 评论 -
大数据:spark RDD编程,构建,RDD算子,map,flatmap,reduceByKey,mapValues,groupBy,
大数据:spark RDD编程,构建,RDD算子,map,flatmap,reduceByKey,mapValues,groupBy,原创 2023-06-04 10:40:13 · 614 阅读 · 0 评论 -
大数据:pyspark模块,spark core的RDD,RDD是弹性分布式数据抽象对象,RDD五大特性,wordcount案例展示RDD
大数据:pyspark模块,spark core的RDD,RDD是弹性分布式数据抽象对象,RDD五大特性,wordcount案例展示RDD原创 2023-06-03 18:01:55 · 441 阅读 · 0 评论 -
大数据:spark环境搭建,local模式,standalone模式,zookeeper standby,yarn模式
大数据:spark环境搭建,local模式,standalone模式,zookeeper standby,yarn模式原创 2023-06-03 17:20:08 · 536 阅读 · 0 评论 -
大数据:软考
大数据:软考原创 2023-06-03 15:42:50 · 408 阅读 · 0 评论 -
大数据:数据表操作,分区表,分桶表,修改表,array,map, struct
大数据:数据表操作,分区表,分桶表,修改表,array,map, struct原创 2023-06-03 10:43:10 · 655 阅读 · 0 评论 -
大数据:hive数据库的操作语法,数据表,内部表,external外部表,数据导入导出load,insert
大数据:hive数据库的操作语法,数据表,内部表,external外部表,数据导入导出load,insert原创 2023-06-02 23:43:31 · 707 阅读 · 0 评论 -
大数据:Apache hive分布式sql计算平台,hive架构,hive部署,hive初体验
大数据:Apache hive分布式sql计算平台,hive架构,hive部署,hive初体验原创 2023-06-02 18:12:26 · 543 阅读 · 0 评论 -
大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI
大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI原创 2023-06-02 10:49:35 · 600 阅读 · 0 评论 -
大数据:分布式计算,MapReduce,hadoop的计算组件,hive是sql分布式计算框架,底层就是基于MapReduce的
大数据:分布式计算,MapReduce,hadoop的计算组件,hive是sql分布式计算框架,底层就是基于MapReduce的原创 2023-06-01 11:12:34 · 646 阅读 · 1 评论 -
大数据:HDFS存储原理,fsck命令查看文件副本状态,namenode元数据,edits流水账,fsimage合并,hdfs读取数据
大数据:HDFS存储原理,fsck命令查看文件副本状态,namenode元数据,edits流水账,fsimage合并,hdfs读取数据原创 2023-06-01 10:53:17 · 1645 阅读 · 0 评论