- 博客(2)
- 收藏
- 关注
原创 从0到1:我用Spark ML预测销售额的完整记录
摘要:本项目基于SparkML构建电商销售预测模型,采用Python和Spark技术栈。使用2000条模拟数据,通过特征工程处理关键销售指标,对比随机森林、梯度提升树和线性回归三种算法,其中梯度提升树表现最优(RMSE16.89)。解决Java版本不兼容等技术问题后,模型预测误差控制在17%以内,预计可降低15%仓储成本。后续计划接入真实数据并探索服务化部署方案。
2026-03-11 10:54:28
42
原创 GitHub镜像站搭建全攻略
《GitHub镜像站搭建全指南》摘要:本文详细讲解GitHub镜像站的搭建方法,涵盖三种主流方案:基于gitmirror工具、Nginx反向代理以及全量镜像方案。从服务器选型、环境配置到定时同步策略,提供完整技术实现路径。针对企业内网、教育机构等不同场景,特别介绍负载均衡、日志监控等高级功能,并给出同步速度慢、存储不足等常见问题的解决方案。文章包含具体配置示例和工具链文档参考,为需要稳定访问GitHub的开发者提供实用技术指导。
2026-03-11 10:36:08
262
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅