python
文章平均质量分 59
wuzd
这个作者很懒,什么都没留下…
展开
-
Spark的数据存储目录HDFS
Spark主要在内存中运算,最终的运算结果可以通过Hive存入到Mysql(MariaDB)和HDFS系统的。 1.spark和Hive集成,2.通过Spark来建表,和插入数据,3.在DB和DHFS中查看插入的数据。一、项目环境 Linux:centos7 JDK: java version 1.8 Python:3.8 Spark:spark-3.2.1 Hadoop:2.7.3 Hive:2.1.1 MariaDB:5.5.64...原创 2022-05-22 22:21:18 · 2175 阅读 · 0 评论 -
IDEA2020中PySpark的两表关联(字段名相同)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容: 使用GROUPLENS的电影评价的大数据集,Windows中IDEA2020环境中SPARK做两表关联测试学习。 个人用户学习大数据,一般会搭建的基于Linux虚拟机的HDFS集群。而SPARK主要运行在内存中,若在虚拟机的内存中运行没有...原创 2022-05-15 17:51:41 · 1353 阅读 · 0 评论 -
IDEA2020中测试PySpark的运行出错
IDEA中测试PySpark py4j.protocol.Py4JJavaError: An error occurred while calling z Cannot run program "python3": CreateProcess error=2, 系统找不到指定的文件。原创 2022-04-03 13:33:52 · 2516 阅读 · 0 评论 -
python的turtle绘制科赫曲线
科赫曲线是一种像雪花的几何曲线科赫曲线是一种分形。其形态似雪花,又称科赫雪花、雪花曲线。 1.给定线段AB,科赫曲线可以由以下步骤生成: 2.将线段分成三等份(AC,CD,DB) 3.以CD为底,向外(内外随意)画一个等边三角形DMC 4.将线段CD移去, 分别对AC,CM,MD,DB重复1~3。import turtle#科赫曲线(size 科赫曲线的每一个直线的长度,n 绘制的阶数)def koch(size,n): if n==0:#递归出口画一条一...原创 2021-05-16 17:14:39 · 2639 阅读 · 0 评论