Learning from Data-A short course 我的中文翻译及练习题解答还有生物信息的实际应用2

第一章
关于学习
如果你给一个三岁的孩子看一张图片然后问他里面是否有一棵树,你非常可能得到正确的回答。如果你问一个三十岁的成年人树的定义是什么,你可能得到一个模糊的答案。我们认识树并不是通过树的数学定义公式,而是靠亲眼所见。换句话说,我们是从数据学习的。

从数据学习的使用环境是我们没有解析式,但我们有很多数据可以用来得出经验性的解决。这个假定覆盖了很多领域,而且从数据学习确实在科学,工程,经济学等领域广泛使用。

在本章中,我们呈现了很多从数据学习等例子而且使学习问题模式化。我们也探讨了关于学习的主概念,许多学习的典范也被发展开来。

1.1 构建问题

金融预测,医疗诊断,电脑视觉,还有搜索引擎,这些的共同点在哪里?他们都是从数据学习的成功例子。这些应用的表现是让人印象深刻的。让我们以一个现实生活中的例子来展开从数据学习是怎么发挥作用的讨论。

现在思考一下预测电影观看者如何评价电影的问题。如果你是一个电影租赁公司,你会很想预测,因为你非常想推荐给观众他们喜欢的电影。一个好的电影推荐系统对公司的生意非常重要以至于像Netflix这样的公司愿意给予1百万美元的奖励到能使他们的推荐率提高10%。

这个问题的主要难度是不同观众对电影评分对标准非常复杂。试图去建立模型不是容易的事,所以想得到一个解析式应该不太可能。然而,我们知道评分数据揭示了人们如何给电影打分,所以我们很有可能构建一个好的经验解决方案。对于电影租赁公司有大量的数据可用,因为他们经常询问观众对电影的评价。

在这里插入图片描述
图片里描述的是一种在百万美元大赛中经常使用的途径。你形容一部电影使用包括里很多因素的长长的Array,比如有多少喜剧元素,剧情有多复杂,主演有多好看。现在,你形容观众用对应的因素。观众有多喜欢喜剧,他们喜欢简单还是复杂的剧情,他们对主演的外貌有多看重等等。现在这位观众如何评价这部电影是根据这些因素匹配与否来计算的。例如,如果电影只是纯喜剧但是观众讨厌喜剧,那么他不喜欢这部电影的几率会很大。如果你使用很多这些因素来形容电影的内容和观众的胃口,根据很多匹配得出来的结果会是一个观众评价电影很好的预测。

从数据学习的力量是整个的过程可以自动化,不需要分析电影的内容和观众的喜好。为了这样做,学习算法以之前的评分逆向工程这些因素。开始时使用随机因素,然后调整这些因素使他们与观众之前如何评价电影更加匹配,直到他们最终能预测大多观众如何评价电影。我们最终得到的因素可能像喜剧内容一样直观,事实上也可能更加微妙或者难以理解。毕竟,这个算法只是为了试图寻找如何最好的预测观众对电影对评价,不一定需要解释它对原理。这个算法是百万美元大赛获奖者对一部分。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值