美林数据 大数据数据实训 优秀小组报告

实训过程:

1.实训目的和要求

实训目的:

理解商业智能(BI)技术和数据可视化的基本概念,掌握 BI 可视化工具的使用方法。学习如何收集、整理和分析出租汽车平台的运营数据,包括车辆分布、车检次数、安全公里数、司机信息等。学习如何运用 BI 可视化系统进行驾驶员管理和车辆管理,提高整体服务水平。

实训要求:

(1)能够运用 BI 可视化系统进行服务质量监测,实时了解平台运营状况,为管理层提供决策支持。

(2)学员在实际工作中运用 BI 可视化技术解决实际问题的能力,提高学员的数据分析和决策能力。

(3)要求学员作图美观化,更加完善。

(4)掌握如何通过 BI 可视化系统展示服务质量指标,提高平台的运营效率和乘客满意度。

2. 实训内容和基本理论

实训内容:

    出租汽车行业是我国重要的交通运输行业之一,为广大市民提供了便捷的出行服务。然而,近年来,出租汽车安全问题日益突出,乘客人身及财产安全事件时有发生。为进一步提升出租汽车行业的安全水平,构建和谐稳定的出行环境,有必要开发一套出租汽车安全平台BI,以实现对出租汽车运营安全的全方位监控和管埋。

基本理论:

    1.数据收集:首先需要收集出租汽车平台的运营数据,包括车辆分布、保险信息、所属公司、所在区域、检查次教、事故情況等。

2.数据预处理:对收集的原始款据进行清法、 转换和标准化,以便后续的分析和可视化。这一步可能包括处理缺失值、异常值,以及将数据转换为统一的数据格式和单位。

3.业务分析:分析出租汽车平台安全平台业务相关的指标,比如车检达标率,事故发生率,隗患公析等,及相关维度,比如司机、车辆等。

4.可视化设计:根据分析结果,选样合适的可视化图表和布局,将数据呈现出来。

5.可视化呈现:将分析结果以清晰、直观的可视化图表展示出来,帮助平台管理者和相关人员更好地理解数据,发现问题,制定相成改进措施。

6.结果评估与优化:根据可视化结果,评估服务质量的现状和问题,制定相应的改进措施。这可能包括加强车翻检查、优化驾驶员培训计划、改进车辆检查频次等。

7.持续监测与迭代:将分析和可视化过程形成闭环,持续监测平台服务质量,根据实际情况进行优化和迭代。这有助于确保平台始终保持高水平的服务质量, 提开乖客满意度。

    通过以上理论,可以掌握如何运用BI可视化技术对出租车平台安全质量进行深入分折,为平台提供有针对性的改进建议,提高整体服务水平。

3.操作步骤

步骤一:

点击添加数据,选择从数据源中添加,选择数据源“某出租汽车平台安全质量数据”。

步骤二:

选择翻牌器拖拽至设计区,将字段“车辆总数”拖拽至指标,聚合方式选择“计数”,得到车辆总数。按照同样方式,将车辆状况_分组进行操作,并将车辆状况分组拖拽至过滤,选择过滤信息中的常规,勾选“正常”,点击“确定”,得到正常车辆数。

步骤三:

选择环形图,将字段“所属公司”拖拽至颜色,将字段“车辆总数”拖拽至大小。

步骤四:

选择柱形图,将字段“车辆年限”拖拽至X轴,将字段“车辆总数”拖拽至Y轴。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤五:

选择饼形图将字段“保险情况__年”拖拽至颜色,将字段“车辆总数”拖拽至Y轴。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤六:

选择列表点击图形,在左侧数据栏中,将所需展示的字段拖拽至列。

步骤七:

选择柱形图,将字段“购入时间”拖拽至X轴,格式选择“年月”,将字段“检查次数”拖拽至Y轴,聚合方式选择“计数”。将字段“存在隐患”拖拽至颜色。

步骤八:


选择线形图,将字段“投诉时间”拖拽至X轴,格式选择“年月”,将字段“检查次数”拖拽至Y轴,聚合方式选择“合计”。将字段“事故次数”拖拽至Y轴,聚合选择“合计”。

步骤九:

选择KPI,将字段“事故次数”拖拽至指标将字段“检查次数”拖拽至目标,聚合方式选择“合计”。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤十:

选择翻牌器,将字段“安全公里数”拖拽至指标完成“安全公里数”合计的展示。

步骤十一:

选择翻牌器将字段“安全公里数”拖拽至指标,将字段“所在区域”拖拽至过滤,过滤信息勾选“未央区”,完成“未央区安全公里数”合计的展示。

步骤十二:

点击图形,选择左上角“视觉交互”,点击“启用联动”、“启用钻取”,其他图形同样选择,完成整个页面图形的联动与钻取效果。

   

4.实训结论与小结

经过对出租汽车平台安全质量数据的深入分析,我们得出了一系列详尽的改善建议。以下是对平台安全质量现状的总结及未来改进方向的详细描述:

(1)在车辆安全性方面,平台已经建立了较为完善的车辆维护体系,并注重驾驶员的安全培训,确保车辆和驾驶员均符合安全标准。车辆安全设施如灭火器、三角架等配备齐全,为乘客提供了基本的安全保障。然而,车辆安全隐患的排查和处理仍需进一步加强。平台应建立更为严格的车辆安全检查制度,定期对车辆进行全面检查,及时发现并处理潜在的安全隐患,确保车辆始终处于最佳状态。

(2)乘客安全方面,平台通过优化乘客安全教育内容,提高了乘客的安全意识。同时,平台也加强了对驾驶员的安全监管,确保他们具备高度的安全意识和专业的操作技能。然而,乘客安全教育仍需深化。平台可以进一步丰富安全教育内容,通过线上线下相结合的方式,向乘客普及更多的安全知识和应急处理技能。此外,平台还应加强对驾驶员的培训和考核,确保他们始终具备高度的安全意识和专业的操作技能。

(3)在车辆质量方面,平台已经建立了严格的车辆质量监控体系,定期对车辆进行维护和保养。然而,车辆质量的持续监控和管理仍需加强。平台应建立更为完善的车辆质量管理制度,加强对车辆质量的持续监控和管理,及时发现并处理潜在的质量问题。同时,平台还应加强对车辆零部件的采购和质量管理,确保车辆零部件的质量和性能符合标准。

综上所述,出租汽车平台在安全质量方面已经取得了显著成效,但仍需继续加强车辆安全隐患排查和处理力度,深化乘客安全教育和培训,并加强对车辆质量的监控和管理。通过不断优化和改进,平台将能够为乘客提供更加安全、舒适、可靠的出行体验。未来,平台应持续关注安全质量问题,不断完善安全管理体系,为乘客提供更加优质的出行服务。

实训过程:

1. 实训目的和要求

实训目的:

理解商业智能(BI)技术和数据可视化的基本概念,掌握 BI 可视化工具的使用方法。学习如何收集、整理和分析出租汽车平台的运营数据,包括订单处理、派单、接单、乘客满意度等。学习如何运用 BI 可视化系统进行驾驶员管理和车辆管理,提高整体服务水平。

实训要求:

(1)能够运用 BI 可视化系统进行服务质量监测,实时了解平台运营状况,为管理层提供决策支持。

(2)培养学员在实际工作中运用 BI 可视化技术解决实际问题的能力,提高学员的数据分析和决策能力。

(3)掌握如何通过 BI 可视化系统展示服务质量指标,提高平台的运营效率和乘客满意度。

2.实训内容和基本理论

实训内容:

    随着共亭经济和移动互联网的快速发展,出相汽车平台已经成为人们日常出行的重要选择。为了提高乘容的满意度,平台需要关注服务质量,并持续优化服务休验。在这个背景下,借助商业智能(BI)技术和数据可视化,某出租汽车平台希望建立一个服务质量分析BI可视化系统,以便更好地监控、分析和管理服务质量。

基本理论:

    (1)从数据上看,所提供的数据主要有某出租汽车平台数据表这张表,包括了车牌号码、证件情况、所属公司、所在城市、所在区域、购入时间、司机姓名、性别、籍贯、投诉类型、投诉数量;需要对这些表信息进行分析,所以根据不同的表分别制作一个可视化看板。

    (2)通过设计,可以初步构建-个功能完善、界面美观的出租汽车服务平台可视化大屏,为企业管理和决策提供有力的支持。在后续的开发过程中,还需根据用户反馈和实际需求进行不断的优化和改进。

3. 操作步骤

步骤一:加载数据

本案例数据在mysql数据库中,所以在关系数据库中输入某出租汽车平台数据表进行数据读取并测试sql读取语句是否成功。

步骤二:数据准备

预览数据,选择列“投诉对象(0:司机,1:车)”点击字段角标,在【数值分组】界面对投诉对象按数值进行分组,0-1:司机,1-2:车,组内区间选择“左闭右开”,并重新命名新列名为“投诉对象_分组”,完成”投诉对象“数值分组。选择列“投诉类型”点击字段角标,选在【数值分组】界面对投诉对象按数值进行分组,0-1:服务态度差,1-2:绕路,2-3:乱收费,3-4:违约,4-5:违规操作,5-6:车内环境差,6-7:车辆状况差,组内区间选择“左闭右开”,并重新命名新列名为“投诉类型_分组”,完成“投诉类型”数值分组。

步骤三:

选择环形图点击图形,将字段“投诉对象_分组”拖拽至颜色,将字段“投诉类型”拖拽至大小。

步骤四:

选择条形图点击图形,将字段“所属公司”拖拽至Y轴将字段“投诉类型”拖拽至X轴。

  

步骤五:

选择筛选器将字段“所属公司”拖拽至参数。在左侧图表中,点击“修饰”,选择样式。

步骤六:

分别完成“投诉对象”与“投诉类型”的图表设计,图形样式可自定义选择。

步骤七:

选择组合图,点击图形,将字段“投诉日期”拖拽至X轴,在弹出的选择日期格式界面选择“年月”勾选。点击图形,将字段“投诉类型”拖拽至Y轴,将字段“投诉类型_分组”拖拽至分组

步骤八:

选择自由式报表点击图表,进入报表设计界面。自定义填写表头字段名称信息。点击“司机姓名”,在右侧“属性”下的“单元格元素”中聚合方式选择“分组”。同理,其他字段选择以下对应单元格元素聚合方式:“身份证号码”:“最大值”,“司机性别”:“分组”,“司机年龄”:“最大值”,“驾龄”:“最大值”,“司龄”:“最大值”,“车牌号码”:“分组”,“所属公司”:“分组”,“培训次数”:“合计”,“投诉类型”:“分组”,“投诉次数”:“合计”。

步骤九:

点击图形,选择左上角“视觉交互”,点击“启用联动”、“启用钻取”,其他图形同理选择进行设置,完成整个页面图形的联动与钻取效果

4.实训结论与小结

  1. 投诉类型分析:服务态度差是用户投诉的显著问题,其余投诉涉及绕路等问题。这表明,提升司机的服务态度是改善服务质量的重中之重。
  2. 投诉对象分析:司机作为直接服务提供者,成为用户投诉的主要对象,占比73.44%。因此,加强对司机的管理和培训,提升其专业素养和服务态度,是减少投诉的关键。
  3. 投诉时间分布:数据显示,2022年5月和10月为投诉高峰期。平台应针对这些时段加强服务管理,如增加客服人员、优化调度策略等,以应对投诉高峰。
  4. 改进建议:

强化司机培训:定期举办服务态度与专业技能培训,提升司机整体素质。

司机考核与评估:建立科学的考核机制,对司机进行定期评估,确保服务质量达标。

车辆维护升级:加强车辆日常维护和保养,确保乘客的乘车安全与舒适。

优化客户服务:提升客服响应速度和处理效率,及时解决用户投诉,增强用户满意度。

综上所述,通过实施上述建议,出租汽车平台可望显著提升服务质量,降低投诉率,进而提升用户满意度和忠诚度。未来,平台应持续关注用户反馈,不断优化服务流程和管理策略,推动服务质量持续提升。

实训过程:

1.实训目的和要求

实训目的:

理解商业智能(BI)技术和数据可视化的基本概念,掌握 BI 可视化工具的使用方法。学习如何收集、整理和分析出租汽车平台的运营数据,包括车辆分布、车检次数、安全公里数、司机信息等。学习如何运用 BI 可视化系统进行驾驶员管理和车辆管理,提高整体服务水平。

实训要求:

(1)能够运用 BI 可视化系统进行服务质量监测,实时了解平台运营状况,为管理层提供决策支持。

(2)学员在实际工作中运用 BI 可视化技术解决实际问题的能力,提高学员的数据分析和决策能力。

(3)要求学员作图美观化,更加完善。

(4)掌握如何通过 BI 可视化系统展示服务质量指标,提高平台的运营效率和乘客满意度。

2. 实训内容和基本理论

实训内容:

    出租汽车行业是我国重要的交通运输行业之一,为广大市民提供了便捷的出行服务。然而,近年来,出租汽车安全问题日益突出,乘客人身及财产安全事件时有发生。为进一步提升出租汽车行业的安全水平,构建和谐稳定的出行环境,有必要开发一套出租汽车安全平台BI,以实现对出租汽车运营安全的全方位监控和管埋。

基本理论:

    1.数据收集:首先需要收集出租汽车平台的运营数据,包括车辆分布、保险信息、所属公司、所在区域、检查次教、事故情況等。

2.数据预处理:对收集的原始款据进行清法、 转换和标准化,以便后续的分析和可视化。这一步可能包括处理缺失值、异常值,以及将数据转换为统一的数据格式和单位。

3.业务分析:分析出租汽车平台安全平台业务相关的指标,比如车检达标率,事故发生率,隗患公析等,及相关维度,比如司机、车辆等。

4.可视化设计:根据分析结果,选样合适的可视化图表和布局,将数据呈现出来。

5.可视化呈现:将分析结果以清晰、直观的可视化图表展示出来,帮助平台管理者和相关人员更好地理解数据,发现问题,制定相成改进措施。

6.结果评估与优化:根据可视化结果,评估服务质量的现状和问题,制定相应的改进措施。这可能包括加强车翻检查、优化驾驶员培训计划、改进车辆检查频次等。

7.持续监测与迭代:将分析和可视化过程形成闭环,持续监测平台服务质量,根据实际情况进行优化和迭代。这有助于确保平台始终保持高水平的服务质量, 提开乖客满意度。

    通过以上理论,可以掌握如何运用BI可视化技术对出租车平台安全质量进行深入分折,为平台提供有针对性的改进建议,提高整体服务水平。

3.操作步骤

步骤一:

点击添加数据,选择从数据源中添加,选择数据源“某出租汽车平台安全质量数据”。

步骤二:

选择翻牌器拖拽至设计区,将字段“车辆总数”拖拽至指标,聚合方式选择“计数”,得到车辆总数。按照同样方式,将车辆状况_分组进行操作,并将车辆状况分组拖拽至过滤,选择过滤信息中的常规,勾选“正常”,点击“确定”,得到正常车辆数。

步骤三:

选择环形图,将字段“所属公司”拖拽至颜色,将字段“车辆总数”拖拽至大小。

步骤四:

选择柱形图,将字段“车辆年限”拖拽至X轴,将字段“车辆总数”拖拽至Y轴。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤五:

选择饼形图将字段“保险情况__年”拖拽至颜色,将字段“车辆总数”拖拽至Y轴。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤六:

选择列表点击图形,在左侧数据栏中,将所需展示的字段拖拽至列。

步骤七:

选择柱形图,将字段“购入时间”拖拽至X轴,格式选择“年月”,将字段“检查次数”拖拽至Y轴,聚合方式选择“计数”。将字段“存在隐患”拖拽至颜色。

步骤八:


选择线形图,将字段“投诉时间”拖拽至X轴,格式选择“年月”,将字段“检查次数”拖拽至Y轴,聚合方式选择“合计”。将字段“事故次数”拖拽至Y轴,聚合选择“合计”。

步骤九:

选择KPI,将字段“事故次数”拖拽至指标将字段“检查次数”拖拽至目标,聚合方式选择“合计”。在修饰-更多配置中合理选择相关的配置项来修改展现效果。

步骤十:

选择翻牌器,将字段“安全公里数”拖拽至指标完成“安全公里数”合计的展示。

步骤十一:

选择翻牌器将字段“安全公里数”拖拽至指标,将字段“所在区域”拖拽至过滤,过滤信息勾选“未央区”,完成“未央区安全公里数”合计的展示。

步骤十二:

点击图形,选择左上角“视觉交互”,点击“启用联动”、“启用钻取”,其他图形同样选择,完成整个页面图形的联动与钻取效果。

   

4.实训结论与小结

经过对出租汽车平台安全质量数据的深入分析,我们得出了一系列详尽的改善建议。以下是对平台安全质量现状的总结及未来改进方向的详细描述:

(1)在车辆安全性方面,平台已经建立了较为完善的车辆维护体系,并注重驾驶员的安全培训,确保车辆和驾驶员均符合安全标准。车辆安全设施如灭火器、三角架等配备齐全,为乘客提供了基本的安全保障。然而,车辆安全隐患的排查和处理仍需进一步加强。平台应建立更为严格的车辆安全检查制度,定期对车辆进行全面检查,及时发现并处理潜在的安全隐患,确保车辆始终处于最佳状态。

(2)乘客安全方面,平台通过优化乘客安全教育内容,提高了乘客的安全意识。同时,平台也加强了对驾驶员的安全监管,确保他们具备高度的安全意识和专业的操作技能。然而,乘客安全教育仍需深化。平台可以进一步丰富安全教育内容,通过线上线下相结合的方式,向乘客普及更多的安全知识和应急处理技能。此外,平台还应加强对驾驶员的培训和考核,确保他们始终具备高度的安全意识和专业的操作技能。

(3)在车辆质量方面,平台已经建立了严格的车辆质量监控体系,定期对车辆进行维护和保养。然而,车辆质量的持续监控和管理仍需加强。平台应建立更为完善的车辆质量管理制度,加强对车辆质量的持续监控和管理,及时发现并处理潜在的质量问题。同时,平台还应加强对车辆零部件的采购和质量管理,确保车辆零部件的质量和性能符合标准。

综上所述,出租汽车平台在安全质量方面已经取得了显著成效,但仍需继续加强车辆安全隐患排查和处理力度,深化乘客安全教育和培训,并加强对车辆质量的监控和管理。通过不断优化和改进,平台将能够为乘客提供更加安全、舒适、可靠的出行体验。未来,平台应持续关注安全质量问题,不断完善安全管理体系,为乘客提供更加优质的出行服务。

实训过程:

1.实训目的和要求

实训目的:     

本课程旨在通过一个实际的业务案例,介绍数据挖掘和机器学习在煤矿领域中的应用。以矿用卡车的缸温预测为例,学习如何基于历史数据建立预测模型,实现对卡车发动机故障的提前预警,从而降低维修成本,提高运输效率。

实训要求:

(1)基于提供的业务场景和相关的数据,建立模型;

(2)通过缸温预测模型,及时发现卡车发动机即将故障,减少维修成本;

(3)通过对所建立模型的部署,实现模型应用,并对结果进行可视化展示;

(4)了解数据挖掘和机器学习知识在煤矿领域中的实际应用,能够将所学知识应用到其他行业领域的实际案例中。

  1. 实训内容和基本理论

实训内容:

构建一种基于梯度提升树算法的矿用卡车发动机缸温预警方法,提前发现缸温异常,减少设备维修成本。有效保障矿用卡车的正第运行,提前发现卡车发动机缸温过高,导致卡车瘫痪的可能,减少卡车报废,减少成本,提开卡车的使用寿命。也可应用于其他汽车的发动机缸温预测方面,有效预测车辆的缸温情况,减少车辆的维修成本及报废的可能。

    在需天矿的开采中,需要高强底的运输方式。卡车运输因其具有灵活机动、调运方便、爬坡能力强、受地形限制小等特点,已成为露天煤矿主要的一种运输方式。有80%-90%的露天矿山用卡车运输矿岩。卡车运输的成本占矿山成本的35%-45%,而其能耗占矿山总能耗的40%-70%。作为露天矿生产的重要组成部分和降低成本的主要方向,卡车的运行状况,直接关系到露天矿企业效益的好坏。

    一辆大型矿用卡车,维护成本高昂,尤其发动机系统是卡车的核心部位,出现问题会直接导致卡车瘫疾,无法运行,带来高昂的维修成本。而通常靠人工发现问题时已经为时已晚。因此,基于数据挖据及机器学习知识,在卡车运行过程中进行实时缸温的监测,并甚于历史数据对缸温进行预测。提前发现缸温异第,减少设备维修成本。

基本理论:

    本次采用数据为:卡车缸温预测(tt_truck_temperature)

  (1)对于预测发动机缸温,由于缸温预测属于连续型数据,因此采用机器学习中的回归型方法。

    (2)数据预处理主要包括:属性生成、属性过滤、设置角色、数据拆分。

    (3)模型构建利用梯度提升树回归模型,该模型是一种迭代的决策树算法,该算法由多棵决策树组成。它基于集成学习中boosting的思想,每次迭代都在减少残差的梯度方向上建立一颗决策树,迭代多少次就生成多少棵决策树。该算法的思想使其具有天然优势可以发现多种有区分性的特征以及特征组合。

    (4)建立的模型为回归模型,因此采用的回归评估。对自变量相同和因变量相同的数据集,比较一种回归算法一组参数、不同参数组合或者多种回归算法之间的分析性能,检验回归模型的可靠性;最终根据一些评价的指标(如相对误差等指标)或者图表展示,获得质量最佳的回归模型。

2.操作步骤

步骤一:数据读取


点击【添加数据】,选择【从数据源中添加】,选择数据源“卡车缸温”,点击【确定】。

步骤二:属性生成

预处理主要包括:属性生成、属性过滤、设置角色、数据拆分。将属性生成节点,通过右侧的+号按钮,添加新的属性,分别并校验生成均值,标准差,梯度,最值。操作完成后,如下图所示:

          

         

          

       

        

         

          

            

         

          

       

        

         

          

 


步骤三:属性过滤

将需要保留的属性,添加至右侧。包括X1—X9原始数据(9条)、增加时间滞后值(9*4条)、滚动窗口统计值(9*5条)和因变量K+1#温度(data2)。共91个变量。

步骤四:设置角色

选择完进行建模的属性之后,需要对各属性设置对应的角色,以进行模型的建立。【设置角色】节点,设置角色支持用户选择需要分析的属性/列,并对属性/列进行变量的角色定义,包含的角色有自变量、因变量、ID列、分词列。如下图所示。

步骤五:数据拆分

数据拆分节点,该节点是将原始样本集拆分2个(训练集和测试集)拆分后各个子集的比例总和小于等于100%。如下图所示。以按照比例进行训练集和测试集的拆分,这里设置的比例为70:30

步骤六:模型评估

建立的模型为回归模型,因此采用的回归评估。对自变量相同和因变量相同的数据集,比较一种回归算法一组参数、不同参数组合或者多种回归算法之间的分析性能,检验回归模型的可靠性;最终根据一些评价的指标(如相对误差等指标)或者图表展示,获得质量最佳的回归模型。

用户在数据挖掘界面左侧的【模型管理】—【评估】菜单下,将【回归评估】节点托至设计区,打开节点最优模型依据选择“R方”:

步骤七:梯度提升树回归模型

梯度提升树(GBDT)是一种迭代的决策树算法,该算法由多棵决策树组成。在数据挖掘界面的将梯度提升树节点托至设计区,双击节点,如下图所示。

4.实训结论与小结

(1)模型性能:梯度提升树回归模型在本实验中表现出色,R方值达到0.9995,调整的R方值也为0.9995,显示出模型具有极高的解释力和预测精度。

(2)误差分析:模型的MSE为11.4826,RMSE为3.3886,MAE为2.0532,表明模型预测误差较小,预测结果可靠。

(3)变量重要性:通过模型输出的变量重要性,可以识别出对缸温预测影响最大的特征,为进一步的模型优化和特征选择提供依据。

本实验通过低代码平台成功实现了卡车缸温的预测,梯度提升树回归模型以其高精度和稳定性成为了解决此类预测问题的有效工具。实验结果表明,通过精心设计的特征工程和模型调优,可以显著提高预测模型的性能。此外,实验还验证了低代码平台在快速实现数据分析和模型构建方面的优势,为非技术人员提供了便捷的数据分析工具。

后续工作建议:

(1)模型优化:尽管当前模型已经取得了较好的预测效果,但仍有进一步优化的空间,如尝试其他算法或对模型参数进行更细致的调整。

(2)特征探索:探索更多可能影响缸温的特征,如卡车的维护历史、驾驶习惯等,以进一步提高模型的预测能力。

(3)实际应用:将模型部署到实际的卡车监控系统中,实时监控缸温和预测潜在故障,以减少停机时间和维护成本。

实训过程:

1.实训目的和要求

实训目的:

本案例涉及煤矿中矿用卡车安全效率领域,具体包括司机利用矿用卡车运输煤、矿用卡车自身工作效率。司机通过矿用卡车运煤的过程中,可能存在一些违规操作,例如:急加速、急减速等,影响矿用卡车的寿命及维修成本。

通过学习本案例,让学生了解汽车运输中,如何能有效减少车辆故障、维修成本及提高工作效率。通过实际的业务背景及案例,一方面让学生将所学习的理论知识应用到实际的生活中;另一方面,可以增强学生的建模思维,加深数据挖掘知识。讲解业务背景及解决方案,将学生的思维带入到实际的业务场景中,让学生在实际遇到问题时,能够运用机器学习的方法,提供解题问题的思路。

实训要求:

(1)基于提供的业务场景和相关的数据,建立模型;

(2)利用综合评价方法分析卡车调度效率及司机工作效率,利用机器学习的方法进行合理的评价;

(3)通过对所建立模型的部署,实现模型应用,并对结果进行可视化展示;

(4)了解数据挖掘和机器学习知识在汽车领域中的实际应用,能够将所学知识应用到其他行业领域的实际案例中。

2.实训内容和基本理论

实训内容:

    利用卡车运输过程中的各个指标,对基于层次分析的综合评价方法进行了有益的探索,对卡车运行效率系统进行评估提供了一种有效方式,TOPSIS的综合评价方法对司机违规操作进行评价,可以将其评分值与司机的个人绩效进行结合。评价司机在工作过程中存在的问题,可针对不同的司机,有效减少违规操作的次数,提高司机的工作效率,延长车辆的使用寿命。从数据中建立模型,以解决煤矿行业中的车辆故障、维修成本和工作效率等问题,从而提高企业运营效率。

此外,煤矿行业的竞争日益激烈,提高运输效幸和降低成本己成为企业保持竞争优勢的重要课题。

    为了解决这些问题,需要进行数字化方案分析和政革。利用数据挖掘和机器学习技术,可以对矿用卡车的运输效率和司机的工作效率进行综合评估和优化。通过建立预测模型,可以提前发现矿用卡车可能出现的故障风险,降低维修成本。同时,对司机的驾驶行为进行监控和评估,可以有效预防事故的发生,提高安全性。数字化方案的引入还可以实现运输过程的智能化管理和优化,提高运输效率,隆低运营成本,进而推动煤矿行业的可持续发展。

基本理论:

    (1)采用的数据主要分为俩个部分,分别为卡车效率评估数据、司机违规操作评价数据。

    (2)层次分析法(AHP)是将与决策相关的元素分解成目标、准则、方案等层次,进行定性和定量分析的决策方法。

    (3)TOPSIS模型根据有限个评价对象与理想化目标的接近程度排序的方法,是在现有对象中进行相对优劣的评价,TOPSIS法是一种逼近于理想的排序法,该方法只要求各效用函数具有单调性就行。

  1. 操作步骤

模型一:卡车运行效率评价模型

步骤一:点击【添加数据】,选择【从数据源中添加】,选择数据源“司机违规操作评价数据”,点击【确定】。

步骤二:数值型属性转换,如下图所示:

步骤三:层次分析法

步骤四:将最终的结果通过输出节点,可以对结果数据进行利用.

模型二:司机违规操作评价模型

    步骤一:与模型一中步骤一相同。

步骤二Topsis法根据有限个评价对象与理想化目标的接近程度排序的方法,将TOPSIS节点拖至设计区,双击节点,将评价因素、评价目标添加到指定的区域内,并设置最优方向,如下图所示:

步骤三:用户在数据挖掘界面的左侧【特征工程】下,将【属性生成】节点拖至设计区,双击节点,将需要的新属性名称及表达式添加,如下图:

步骤四:将最终的结果通过输出节点,可以对结果数据进行利用。文件输出节点支持将流程结果数据以csv、 excel、txt格式输出。保存到本地。如下图所示:

 

总流程如图所示:

4.实训结论与小结

车辆运输效率小结:

(1)数据预处理:实验开始前,对  tt_course_data.tt_ai_transport  数据集进行了数值型属性变换,以确保数据的一致性和可分析性。

(2)通过属性生成步骤,增加了卡车编号列,这有助于后续对每辆卡车的效率进行单独评估。

(3)层次分析法(AHP)的应用:利用层次分析法确定各个评价因素的相对重要性,煤量、里程、怠速时间和驾驶时间的重要性等级均为1,表明这些因素在评估运输效率时同等重要。

(4)权重分配结果显示,每个因素的权重均为0.25,意味着在综合评分计算中,每个因素对最终结果的影响是均衡的。

(5)综合评分计算:根据层次分析法的结果,计算了每辆卡车的综合评分,评分结果标准化为0-100分,这有助于直观地比较不同卡车的运输效率。

(6)TOPSIS模型的应用:TOPSIS模型用于评估司机的违规操作,通过考虑预热时长、双轮速度差距、急加速和紧急停车等因素,对司机的驾驶行为进行评分。

结果显示,不同卡车的综合评分差异较大,这可能与卡车的性能、驾驶习惯或路线选择有关。通过分析得分高的卡车,可以识别出提高运输效率的最佳实践。

司机违规操作评价小结:

(1)数据预处理和属性生成:在属性生成步骤中,除了基本的违规操作指标外,还增加了  prediction和评分列,这有助于对司机的违规行为进行量化评估。

(2)TOPSIS模型的应用:TOPSIS模型通过考虑预热时长、双轮速度差距、急加速和紧急停车等因素,为每位司机的违规操作提供了一个综合评分。每个评价因素的权重均为0.1,表明在评估司机违规操作时,这些因素被认为同等重要。

结果分析:结果显示,不同司机的违规操作评分差异显著,这可能与司机的驾驶技能、经验或对安全规则的遵守程度有关。通过分析得分高的司机,可以识别出需要额外培训或干预的个体。             

综合总结本次实验通过结合层次分析法和TOPSIS模型,对车辆运输效率和司机违规操作进行了全面评价。实验不仅提供了定量的数据支持,还通过综合评分的形式,为管理者提供了直观的决策依据。通过分析这些评分,可以识别出效率低下的卡车和违规操作频繁的司机,从而采取相应的改进措施。

关于实训答辩

我们主要通过数据挖掘找的其中的隐藏属性升功率,通过对比升功率和保值率的关系,来使我们组有更多的特色,能面对评委老师可以临危不乱,并且引入的这个属性满足我们对响应国家政策碳达峰的一个理念,再结合实际,联系到最近新兴行业无人驾驶出租车,并分析对比国际层面,可以很好的指出我国出租车发展的优势以及方向,我的评委提出过数据是先分析还是先要结果,正确的回答是数据结果是从分析中来的,而并非在分析之前就要有一个确定的方向

而且关于队友给我做的一个抽象的像收音机一样的图,我就只能反方向寻找设计理念,正好满足了,两个环形图吸引眼球的特征,其中右侧图标展示了投诉类型更多的是司机,又可以点名无人驾驶汽车的优势理念,进而更加稳固的取得优秀小组奖项

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值