
Project
文章平均质量分 81
StarPrayers.
靡不有初,鲜克有终。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Tensorboard学习记录
Tensorboard是机器学习实验的可视化工具,支持PyTorch和TensorFlow。核心功能包括标量可视化(如损失值、准确率)、图像展示(输入/输出/中间层)、模型结构可视化等。使用流程:1)安装tensorboard库;2)通过SummaryWriter写入日志数据;3)启动服务查看结果。进阶用法包括多指标对比、特征图可视化、权重分布跟踪、高维数据降维等。需注意路径处理、端口占用等问题。该工具通过直观展示实验过程,帮助开发者优化模型,是机器学习工作流中的重要组件。原创 2025-09-22 20:02:47 · 891 阅读 · 0 评论 -
PySpark基础例题(包含map、reduceByKey、filter、sortBy等算子)
本文介绍了使用PySpark处理商品销售数据的基本操作。通过读取JSON格式的销售数据文件,实现了三个数据处理需求:1)按城市统计并降序排列总销售额;2)提取所有不重复的商品类别;3)筛选北京地区的商品类别并去重。代码展示了RDD的map、reduceByKey、filter、sortBy和distinct等核心算子的使用,包括数据清洗、类型转换和聚合计算等关键步骤。该案例为PySpark初学者提供了处理结构化数据的典型范例,涉及数据读取、转换、过滤和统计分析等常见场景。原创 2025-09-14 11:28:45 · 310 阅读 · 0 评论 -
通过PySpark单词计数案例带你学习map、flatMap、reduceByKey方法(Python)
本文介绍了使用PySpark实现单词计数的案例,重点讲解了map、flatMap和reduceByKey三个核心RDD转换算子。原创 2025-09-14 09:30:14 · 1010 阅读 · 0 评论 -
面向对象数据分析实战编程题:销售数据导入MySql数据库(Python、DBeaver)
所需1.2.原创 2025-09-11 05:45:00 · 219 阅读 · 0 评论 -
Python异常-模块-包综合案例实践
本文介绍了Python模块化开发实践,主要包含以下内容:1.创建my_utils包,包含__init__.py文件;2.开发字符串处理模块str_util.py,实现字符串反转(str_reverse)和切片(substr)功能;3.开发文件处理模块file_util.py,实现文件内容打印(print_file_info)和追加写入(append_to_file)功能;4.演示了模块的导入和使用方法。两个模块均包含测试代码,使用if name == 'main'保护测试逻辑。该案例展示了Python模块化原创 2025-09-08 10:00:00 · 698 阅读 · 0 评论 -
面向对象数据分析实战编程题:销售数据统计与可视化(Python)
本案例实现了一个面向对象的电商销售数据分析系统,主要功能包括:1)使用Record类封装销售数据;2)通过抽象类设计文件读取框架,支持文本和JSON格式;3)合并1-2月数据后统计每日销售额;4)利用PyEcharts生成可视化柱状图。系统采用多态和模板方法设计模式,具有良好的扩展性,可轻松支持新数据格式。完整代码包含数据定义、文件读取和主业务逻辑三部分,最终输出交互式HTML图表展示每日销售趋势。原创 2025-09-10 10:30:00 · 1164 阅读 · 0 评论