机器学习目录

一篇关于机器学习的全面指南,涵盖统计学基础、各类机器学习算法、实战项目、大数据竞赛以及行业应用。从理论推导到项目落地,帮助读者从入门到精通,包括KNN、决策树、SVM、集成学习等算法,以及泰坦尼克号预测、交通路况预测等实战案例。
摘要由CSDN通过智能技术生成

        在未来几个月时间里,将会逐步针对先前整理的博客文章进行分类归纳,并建立成为学习专栏区。内容将会重点从理论算法,推导过程,应用阶段,项目实战几个维度进行整理。本专栏会从理论到项目落地,从手撕算法源代码到调用机器学习算法库的各种实操应用都会涵盖到。

        目前专栏的更新进度还缺落地项目的分享,敬请各位朋友们耐心等待,因为工作原因,整理项目包括排版分享等工作太耗时间,但作者相信,大家的等待一定是值得的,本专栏一定不会让大家失望,一定可以让大家从一个机器学习领域的小白蜕变到大神级别。

如下为整理的机器学习的查阅目录

一、统计学基础

1、浅谈傅里叶级数与变换的理解(一)

2、浅谈傅里叶级数与变换的理解(二)

3、傅里叶变换的解释与推导(三)

4、特征值与特征向量几何意义

5、正交变换与坐标系的关系

6、协方差与皮尔逊相关系数

7、线性判别分析(LDA), 主成分分析(PCA)、奇异值分解(SVD)

8、梯度与梯度下降法

9、数据清洗常用的函数汇总

10、待更新一些基础的数理统计知识,也会在后续完善起来。

二、机器学习算法

1、机器学习算法一览表

2、机器学习算法(1)之逻辑回归算法

3、机器学习算法(2)之K近邻算法

4、机器学习算法(3)之决策树算法

5、机器学习算法(4)之支持向量机的简易版

6、机器学习算法(5)之支持向量机的详细版

7、机器学习算法(7)之朴素贝叶斯

8、机器学习算法(8)之多元线性回归分析理论详解

9、机器学习算法(9)之聚类算法

10、机器学习算法(10)之数据挖掘算法之Apriori详解

11、机器学习算法(11)之推荐系统库--Surprise

12、机器学习算法(12)之集成学习之模型融合

13、机器学习算法(13)之bagging与随机森林算法

14、机器学习算法(14)之boosting算法之Adaboost、GBDT

15、机器学习算法(15)之Xgboost算法

16、数据预处理与特征工程

17、模型评估和验证【1】——过拟合、欠拟合、学习曲线、验证曲线

18、模型评估和验证【2】——交叉验证、网格搜索与模型评估

19、超参数的选择、格点搜索与交叉验证

20、正则化的理解

三、机器学习实战

机器学习实战的所有源代码分享《KNN、决策树、朴素贝叶斯、Logistic回归、SVM、AdaBoost、回归、K-means》等

1、机器学习实战之KNN实现mnist手写数字分类

2、机器学习实战之逻辑回归实现预测病马的死亡率

3、K近邻算法实战

4、泰坦尼克号预测案例

5、朴素贝叶斯实战

6、随机森林调参示例

7、推荐系统实战

8、Xgboost参数调优

9、Sklearn中的StratifiedKFold与stacking模型的融合方法

10、Sklearn包含的常用算法(汇总)

11、 Stacking模型融合方法(2)

四、机器学习项目

        机器学习项目从0-1实战(含数据探索分析、数据特征工程、数据采样、特征提取、模型训练、模型调参、模型融合)

        ①初级项目

                泰坦尼克号生存预测分析

                房价预测

        ②中级项目

                基于随机森林算法实现电信用户流失预测任务

                基于RFM模型和响应率预测进行金融产品精准营销

        ③高级项目

                交通路况时空预测

                基于协同过滤进行金融产品个性化推荐

                基于XGB构建多层次用户画像及标签体系

五、大数据竞赛项目

        本阶段为机器学习专栏项目中最后一个且也是最值得分享的一个项目,为真实企业场景下的大数据竞赛项目。本人曾参与过几个项目,有的成为炮灰了,有的也取得了不错的成绩。这里分享几个大数据项目。

1、光伏发电预测的大数据竞赛项目。该项目的主办方为:国家电力投资集团有限公司。 最终获得第二名的成绩。

赛题背景:在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。

比赛链接光伏电站人工智能运维大数据处理分析。使用的方法包括Xgboost,Lstm以及lightgbm,最终也将源码有偿分享出来。

光伏电站人工智能运维大数据处理分析项目(奖金¥220,000)--二等奖,最终荣获上万元的奖金。

2、GOC仓储网络智能库存管理竞赛。本人不才,仅参加了初赛(初赛奖金池¥60,000),受限于当时水平有限,并未闯进决赛(决赛奖金池¥300,000),没记错的话,该项目当年的冠军是由华中科技大学秦虎教授带领的团队所荣获的,哎大佬还是大佬,我也好希望有这样一位大神级别的导师带带,只能眼巴巴羡慕。下面分享下赛题的相关信息:

赛题背景:大赛将提供基于京东真实场景的用户订单、仓储与物流的海量数据、算法库和模型(脱敏),参赛队伍需要通过大数据分析和优化算法,寻求最优解决方案。大赛共设置两道赛题:

①. GOC仓储网络智能库存管理(偏向机器学习领域)

        基于京东区域仓与前置仓的两级仓库网络,根据历史数据对各仓库服务区域的销量进行预测,并通过运筹优化算法,制定补货与调拨政策,降低库存与缺货成本,准确地预测不同地区对商品的需求,将顾客需要的货品配置到最合适的仓库,并在保障时效的前提下降低运营成本。

②. 城市物流运输车辆智能调度(偏向运筹领域)

        “城市物流运输车辆智能调度”,可溯源于京东的真实业务场景,具体为京东物流城市A的城配物流中心B目前平均每天为分布在本城区的1000余个客户提供城市配送服务,服务对象为B2B或者大宗商品客户,运力资源充足,期望综合各种因素使得综合成本(包括运输成本、等待成本、充电成本和固定使用成本)最低。参赛者需要使用京东提供的数据,巧妙设计高效算法求解上述问题。评测算法将针对参赛者提交的结果,计算得分。关于“城市物流运输车辆智能调度”,该问题属于运筹优化的路径规划问题,题目要求综合成本最少,综合成本是运输成本,等待成本, 充电成本和固定成本的总和,即为目标函数。对于约束条件,这里有VRP中常见的最大容量约束、时间窗口约束、混合车辆约束、多循环约束、带充电站的电车里程约束。无论怎样,这里还是分享下该赛题的数据集以及配套的解决方案。

数据集:JDGOC初赛数据(仓储网络智能库存管理),暂不提供解决方案。主要是没脸分享给大家。

请注意,这里的这个项目不是GOC仓储网络的比赛项目,是另一个相似的项目。

相似的一个项目:菜鸟-需求预测与分仓规划,这个项目应该也是(¥300,000)

同步反馈的解决方案:菜鸟-需求预测与分仓规划

六、行业落地应用讲解

        1、智能供应链预测的应用

  • 2
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

且行且安~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值