- 博客(3)
- 收藏
- 关注
原创 k-means++代码示例
文章目录模拟解决问题代码全部样本数据Mall_Customers.csv:运行结果: 模拟解决问题 利用K-Means++对会员用户进行分类,例如工资高又舍得花钱的人,工资高但不舍得花钱的人 代码 # K-Means Clustering # Importing the libraries import numpy as np import matplotlib.pyplot as plt im...
2019-11-01 00:44:08 3659 2
原创 Hive性能调优之Mapper和Reducer
这里写自定义目录标题Hive背后的Mapper调优Hive背后的Reducer调优 Hive背后的Mapper调优 1,Mapper数过大,会产生大量的小文件,由于Mapper是基于虚拟机的,过多的Mapper创建和初始化及关闭虚拟机都会消耗大量的硬件资源; Mapper数太少,并发度太小,Job执行时间过长,无法充分利用分布式硬件资源 2,Mapper数由什么决定呢? 输入文件数目 输入文件大小...
2019-09-27 18:17:20 1374
原创 脚本服务处理逻辑流程图
脚本服务处理逻辑流程图 目录前言整体流程图服务端程序设计客户端程序设计 前言 脚本服务用python开发,是基于公司另一个高可用rpc开源项目 https://github.com/baifendian/harpc,并可以动态更新自定义函数、接口脚本和数据源,数据源目前只支持mysql和mongodb,程序设计图是包含harpc的。该文档是根据公司项目上的内部git代码整理,与标准产品的代码差别不...
2019-08-15 18:27:05 760
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人