人工智能 之 机器学习---初学笔记

1---基本概念:

  • Machine LearningA computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
  • 对于某给定任务T及合理的性能度量p,某计算机程序在T上以P衡量的性能随着经验E 自我完善。那么我们称这个计算机程序在从经验E学习。
  • 简单的讲,机器学习就是让计算机程序利用已知数据,发现数学模型,然后再使用模型对未知数据进行预测的一门学科。

 

2----机器学习流程:

  • 需求理解-》数据收集-》数据预处理-》特征工程-》数据建模

 

3----常见经典机器算法学习:(一句话概括)

  • 监督学习:

(1)K-NearstNeighbor(K-近邻算法)

对于一个需要分类的物品A,找出与该物品最相似的k个有已知类别的物品,这k个物品中出现最多的类别即为物品A的类别。(“近朱者赤,近墨者黑”。)

 

(2)线性回归

评估变量之间关系的统计过程,即当自变量发生改变时因变量如何发生改变,评估的自变量与因变量之间是一种线性关系。

 

(3)逻辑回归

处理因变量为分类变量的回归问题,处理二分类或者多分类问题,实际为一种分类方法。

 

(4)支持向量机

对数据进行二分类,目标是寻找一个超平面对样本进行间隔最大化的分割。

 

(5)决策树

对样本数据进行树形分类,由节点和有向边组成。

 

(6)朴素贝叶斯

基于概率论的分类方法。“朴素”即做了样本的特征之间相互独立的假设。

 

  • 非监督学习:

(1)K-Means(K-均值)

最基础常见的聚类算法,即由质心决定形成簇,反复计算直到质心不再变化或变化范围达到指定的阈值。

(聚类是在事先并不知道任何样本类别标签的情况下,通过数据之间的内在关系把样本划分为若干类别,使得同类别样本之间的相似度高,不同类别之间的样本相似度低。)

 

(2)PCA

利用降维的思想,把多指标转化为少数几个综合指标。

(3)Apriori

关联分析方法,先验算法。

如果某个项集是频繁项集,那么它所有的子集也是频繁的

 

4---jupyter notebook使用问题及解决:

(1)plt.show()没有出现图像而是输出<Figure size ... with 5 Axes>

解决办法:添加----%matplotlib inline

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值