大家好,我是Mac Jiang,今天和大家分享Coursera-Stanford University-Machine Learning-Week 8:Anomaly Detection的课后习题解答。注意:每个同学的习题的参数和选项都是不同的,在参考时不要照抄,避免带来错误!我的分析也不一定是正确的,如果各位博友发现错误,请留言联系,谢谢。希望我的博客能给你带来一些学习上的帮助!
1.第一题
(1)题意:异常检测算法适合解决下列哪些问题?
1.给定一张人脸图片,辨别他是不是一个名人
2.从大量初级保健病人记录,确定谁可能有不正常的健康问题
3.从信用卡交易中得到的数据,按购买类型进行分类(食品,运输,服装)
4.从信用卡的交易数据中,确定不正常的交易,因此我们可以确定它们是不是被盗刷了
(2)分析:异常检测是从大量正确的样本中找出明显偏离的错误样本,绝大多数的样本都是正确的,是一个偏斜类。而有监督学习的各种类别的样本数都较多,一般不是偏斜类。
1.错误。名人也是人,名人并不是错误样本,而且名人非常多,不能说每个名人都是错误的吧
2.正确。这些保健人群大多数是健康人,很少是有不正常的健康问题,这些不健康的就是异常点,可以用异常检测