人工智能
文章平均质量分 72
Moutai码哥
广漂一枚,认真做好技术,等混不下去就回家卖酒,哈哈...
展开
-
推荐系统-基于领域的协同过滤算法选择(一文足矣)
为什么新闻推荐使用UserCF算法,而购物网站使用ItemCF算法?原创 2023-03-12 13:26:39 · 576 阅读 · 1 评论 -
基于容器云提交spark job任务
spark提交Kind=Job类型的任务,首先需要申请具有Job任务提交权限的rbac,然后编写对应的yaml文件,通过spark-submit命令提交任务到集群执行。原创 2023-03-04 19:21:41 · 1741 阅读 · 0 评论 -
记一份Cassandra中间件生产调优实践
-server##JVM configurationHeap size-Xms16G-Xmx16G-XX: SurvivorRatio=4GC configuration#禁用CMS,使用U1禁止使用Xmn,U1会自动扩展分配-XX+UseG1GC-XX:G1RSetUpdatingPauseTimePercent=5-XX.MaxGCPauseMillis=500-XX:InitiatingHeapOccupancyPercent=80-XX:ParallelGCThreads=1原创 2022-03-12 12:33:07 · 425 阅读 · 0 评论 -
在Alluxio上运行Apache Hive
The Apache Hive ™ 数据仓库软件使用SQL,方便读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。我们都知道,Hive作为数据仓库工具,传统文件数据处理大都是搭配Hadoop使用。此处将描述如何搭配Alluxio内存加速使用,让你的批处理任务速度飞起来。本节将使用apache-hive-3.1.2与alluxio2.3|2.4结合,验证数仓功能使用。1.Hive部署1.1.前期准备先下载Hi原创 2021-05-02 12:20:46 · 518 阅读 · 0 评论