- 博客(3)
- 收藏
- 关注
原创 k-means++代码示例
文章目录模拟解决问题代码全部样本数据Mall_Customers.csv:运行结果:模拟解决问题利用K-Means++对会员用户进行分类,例如工资高又舍得花钱的人,工资高但不舍得花钱的人代码# K-Means Clustering# Importing the librariesimport numpy as npimport matplotlib.pyplot as pltim...
2019-11-01 00:44:08 3750 2
原创 Hive性能调优之Mapper和Reducer
这里写自定义目录标题Hive背后的Mapper调优Hive背后的Reducer调优Hive背后的Mapper调优1,Mapper数过大,会产生大量的小文件,由于Mapper是基于虚拟机的,过多的Mapper创建和初始化及关闭虚拟机都会消耗大量的硬件资源;Mapper数太少,并发度太小,Job执行时间过长,无法充分利用分布式硬件资源2,Mapper数由什么决定呢?输入文件数目输入文件大小...
2019-09-27 18:17:20 1477
原创 脚本服务处理逻辑流程图
脚本服务处理逻辑流程图目录前言整体流程图服务端程序设计客户端程序设计前言脚本服务用python开发,是基于公司另一个高可用rpc开源项目 https://github.com/baifendian/harpc,并可以动态更新自定义函数、接口脚本和数据源,数据源目前只支持mysql和mongodb,程序设计图是包含harpc的。该文档是根据公司项目上的内部git代码整理,与标准产品的代码差别不...
2019-08-15 18:27:05 913
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人