机器学习笔记

        机器学习是一门入门容易但精通难的学科
机器学习分析人员需要掌握行业知识以了解业务流程、理解数据背后的隐含信息以合理解
读数据、从变化的角度和时间维度把握需求以确定使用哪些数据,这是数据分析的基础
机器学习的主要流程是 明确分析目标、数据收集、数据预处理、建模分析、结果评估、部
署使用以及学习更新
      明确数据分析目标是机器学习首要的重要步骤,这个步骤需
要与用户进行充分的沟通。 项目主题:中国移动客户细分模型
项目范围:本期项目以乐山市为试点城市
项目目的:按用户行为进行细分,客观反映用户需求。通过
对各类人群的深入分析,为相关部门制订资费、服务、市场
策略提供基础。
项目内容:
建立客户细分模型
结合各部门需求对客户细分群进行详细分析
协助市场经营部进行相关服务、市场活动的策划
        算法本身没有绝对的好坏,不同的机器学习算法都有各自的
使用范围。
选择合适的建模方法或算法,算法的好坏需要实验比较确定。
此阶段是机器学习的核心部分,使用精巧复杂的分析方法从
数据中提取知识,包括选择建模技术、生成测试设计以及构
建和评估模型。
算法调优(包括参数或结构等方面)
机器学习算法是科学,应用是艺术
        有效的机器学习结果会改善客户业务决策的效果,给客户带
来价值。
因为业务可能发生变化,在部署过程中需要更新机器学习的
模型等。
机器学习不是一劳永逸的事情(递增式学习)。
        回归分析是分析一个变量与其他一个(或几个)
变量之间的相关关系的统计方法。
分类 就是通过分析训练集中的数据,为每个类
别做出准确的描述或建立分析模型或挖掘出分
类规则,然后用这个分类规则对其它数据对象
进行分类。
决策树、支持向量机、神经网络、朴素贝叶斯、
Bayes网络、k-最近邻 等是几种常用的分类方法。
          统计学习理论强调从数据中学
习,通过估计数据的概率分布 来构建预测模型,实现知识发 现。 较大的样本规模能够提供更多
的信息,使得学习到的模型更 为准确和泛化能力强。
         生成模型 如朴素贝叶斯、隐马尔可夫模型等,通过学习数据的 联合概率分布来生成新数据,能揭示数据间的内在关系。决策 边界
判别模型如支持向量机、逻辑回归等,直接学习不同类别间的 最优决策边界,对分类问题高效且准确。者各有适用场景 生成模型适用于数据生成、异常检测等场景, 而判别模型在分类任务中表现优越,具体选择需基于数据特性 和任务需求
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值