![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kylin
颠沛流漓
这个作者很懒,什么都没留下…
展开
-
基于CDH6.2kylin2.6.2安装部署
kylin安装前提是CDH6.2需要正常安装,hbase、hive、hdfs、spark(虽然官网是说spark可选安装,但是在kylin启动脚本中包含对spark环境的检测,所以建议CDH添加spark服务)需要正常启动,且没有报错信息影响。安装kylin过程中,需要切换到hdfs用户下去安装,不可以用root管理员。hdfs用户默认是不可登录的,需要处理下:usermod ...原创 2019-04-26 14:07:46 · 1620 阅读 · 0 评论 -
协同过滤算法始末记录
测试环境:mysql 5.7.25python 3.6.5本机 内存16G一 、原始数据准备1.sql准备抽样测试 原始数据(txt格式)因数据量巨大(单日10G),不适合于算法初期阶段。故将数据进行抽样获取样例数据进行分析之后再用于原始数据。利用txt分割工具分割为100份,选取其中1份作为kettle原始数据进行处理,去掉无意义字段,抽样获取10000行原始...原创 2019-05-31 15:10:59 · 309 阅读 · 0 评论