描述:
继ALS矩阵推荐,数据矩阵作为ALS项目的输入,输入之前需要进行数据校验,例如是否是数字,或者规定长度等。
附上相关文档链接
https://blog.csdn.net/qq_34597894/article/details/94406707
详细描述如上都已说明。
记录:
看过上面链接,基本就明白了输入的格式如下:
以上文件行数如下:
大概300W的LINE数据
那么既然是程序输入,就有可能存在异常的情况,如果发生了异常类似
的数据肯定是处理不了,为何?
1 用户ID不可能有这个长(业务决定)
2 暂时ALS定的可接受参数类型为INT(11)所以肯定太长,
流程需求: