人工智能复习

L1 Introduction
1、有监督学习和无监督学习(supervised study and unsupervised study):区别在于自己是否知道正确答案,对于数据集来说也就是有没有标签(label)
比如对于KNN,训练数据的每一个属性值都已经知道,这个就是有监督的学习,而K-means算法事先是不知道每个点是属于哪一类的,所以是无监督的学习。
讲到这里再说两个概念的区别:分类和回归(来自知乎https://www.zhihu.com/question/21329754/answer/18004852 )分类是根据训练数据推出测试数据的类别,所以最后的输出只能是两个值。比如PLA和LR,它们都是分类的算法,而回归是根据训练数据输出最后的y(实数)是多少,比如KNN和NB是可以做回归的,不过它们也可以用来做分类。但是分类的算法,比如前面说的两种以及DT(决策树),一般就只能做分类。
至于无监督学习用到的K-means和Apriori等,就可以做复分类了,分出更多的类。
2、分类与回归
分类就是根据训练数据推测出测试数据属于哪一类。比如推测是什么花、这个物种是不是鸟。(相关数据的网址:http://archive.ics.uci.edu/ml/datasets.html )
而回归就是根据训练和测试数据的关系退出测试数据的取值。比如啤酒和尿布同时购买的概率、产量和销量的关系。

L2 数学基础
1、条件概率
1.1 乘法法则:
这里写图片描述
1.2 几个小题目
这里写图片描述
答案是1。可以把G理解成“明天出门还是在家”,L就是“明天下雨”,所以整个公式的计算结果就是如果明天下雨(注意是前提),明天出门、在家待的概率之和。所以结果是1。
这里写图片描述
这道题要从最后的结果入手:假设最后选的是水果j,那么前面的n-1次选的都不是水果j,所以概率就是P(1-j)^(n-1)*Pj。最后求个和就行了。

1.3 方差(Variance)
这里写图片描述
1.4 协方差(Covariance)
这里写图片描述
1.5 相关系数(Correlation)
这里写图片描述
相关系数反映的是一种相关关系,比如x和y之间的关系,如果是下图这样,那么它们的相关系数就是0
这里写图片描述
1.6 正态随机分布(Normal)
这里写图片描述
1.7 距离
这里写图片描述

习题:
这里写图片描述
这里写图片描述
首先我们要知道协方差矩阵是一个什么东西:
这里写图片描述
而cov(x, x)=var(x),所以如果算出了第一题的结果,第二题算相关系数直接用第一题的数据就行了。
这里写图片描述
这里写图片描述

L3 Logic(To be continue…)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值