
大数据和数据仓库
文章平均质量分 72
大数据学习和报错解决分享
woshinsy
println("19届计科在校生 2022自学大数据 机器学习")
展开
-
大数据系列 | Spark MLlib矩阵基本数据类型
本地矩阵具有整型的⾏、列索引值和双精度浮点型的元素值,它存储在单机上。MLlib⽀持稠密矩阵DenseMatrix和稀疏矩阵Sparse Matrix两种本地矩阵,稠密矩阵将所有元素的值存储在⼀个列优先(Column-major)的双精度型数组中,⽽稀疏矩阵则将⾮零元素以列优先的CSC(Compressed SparseColumn)模式进⾏存储。原创 2022-10-24 19:32:37 · 884 阅读 · 0 评论 -
大数据系列 | 全国职业院校技能大赛大数据应用技术赛项笔记分享-离线抽取模块
写在前面:此笔记是本人在备战2022年大数据赛项整理出来的,不涉及国赛涉密内容,如点赞收藏理想,我将会把所有模块的笔记开源分享出来,如有想询问国赛经验的可以关注私聊我,我会一一回复。Scala 是一门满足现代软件工程师需求的语言;它是一门静态类型语言,支持混合范式;它也是一门运行在 JVM 之上的语言,语法简洁、优雅、灵活。Scala 拥有一套复杂的类型系统,Scala方言既能用于编写简短的解释脚本,也能用于构建大型复杂系统。3. 类和对象创建类创建对象apply方法伴生类和伴生对象注意点:重原创 2022-09-13 11:44:56 · 3382 阅读 · 0 评论 -
大数据系列 | Hive实战影音数据分析
hive实战原创 2022-08-10 14:49:48 · 2237 阅读 · 8 评论 -
大数据系列 | Spark安装与配置
Spark安装与配置原创 2022-08-02 08:44:00 · 1127 阅读 · 0 评论 -
大数据系列 | Hive安装与配置
Hive安装与配置原创 2022-08-02 08:33:45 · 772 阅读 · 0 评论 -
大数据系列 | Hadoop完全分布式安装与配置
大数据系列 | Hadoop完全分布式安装原创 2022-08-02 08:19:40 · 508 阅读 · 0 评论 -
大数据系列 | SparkSQL&HiveSQL报错解决方法
问题报错提示:Distinct window functions are not supported: count(distinct xx) windowspecdefinition(name#9, _w4#39, ROWS BETWEEN UNBO问题报错原因:查阅资料后发现sparksql中的窗口函数不支持COUNT(DISTINCT xxx)导致报错原创 2022-06-23 16:20:24 · 1498 阅读 · 0 评论 -
vmware虚拟机ubuntu18.04桌面版安装教程
vmware虚拟机ubuntu18.04桌面版安装教程一. 安装环境:VMware Workstation: 15.5ProUbuntu: 18.04桌面版二. 安装教程:创建虚拟机选择【自定义(高级)】并点击【下一步】硬件兼容性选择Workstation一致选择【稍后安装操作系统】点击【下一步】客户机操作系统选择【Linux】版本选择【ubuntu 64位】点击【下一步】点击【浏览】可自定义安装位置(建议不要安装在C盘)点击【下一步】分配处理器数量和内核数原创 2022-04-13 16:55:41 · 4121 阅读 · 0 评论 -
大数据系列 | 解决Hadoop不能打开端口8088的网页问题(50070可以打开)
解决Hadoop不能打开端口8088的网页问题(50070可以打开)原因:本地hosts文件没有添加集群ip集群环境没有开放8088端口hadoop的配置文件yarn-site.xml问题解决方法:首先检查一下使用集群ip:8088是否可以访问 可以访问即是本地hosts配置问题以管理员身份打开WindowsPowershellC:> CD C:\Windows\System32\drivers\etcC:\Windows\System32\drivers\etc>原创 2022-03-29 12:03:53 · 18791 阅读 · 4 评论 -
Linux系列 | Linux 离线安装配置MySQL5.7.25教程(附mysql命令大全)
linux 离线安装配置mysql5.7.25最详细教程(附mysql命令大全)原创 2021-12-05 16:07:12 · 1029 阅读 · 1 评论