大数据
文章平均质量分 65
我要回月球
我键也未尝不利https://www.jyshare.com/office/
展开
-
python连接Mysql数据库并使用pyEcharts绘图
ECharts是一款基于JavaScript的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。ECharts最初由百度团队开源,并于2018年初捐赠给Apache基金会,成为ASF孵化级项目。pyEcharts库是一个用于生成 ECharts 图表的类库。开始来绘制你的第一个图表。原创 2023-10-31 11:57:38 · 1310 阅读 · 0 评论 -
Hive分区分桶
分区和分桶最大的区别就是分桶随机分割数据库,分区是非随机分割数据库。因为分桶是按照列的哈希函数进行分割的,相对比较平均;而分区是按照列的值来进行分割的,容易造成数据倾斜。其次两者的另一个区别就是分桶是对应不同的文件(细粒度),分区是对应不同的文件夹(粗粒度)。提示:以下是本篇文章正文内容,下面案例可供参考当Hive在进行select操作时,正常会扫描整个表内容。而随着系统运行的时间增加,表的数据量也越来越大,而hive查询做全表扫描,会消耗很多时间,降低效率。原创 2023-08-28 20:23:35 · 162 阅读 · 1 评论