再看机器学习

一点想法,和你分享一下,不一定对:

目前的人工智能就是分析某种数据。比如,图像、视频、文本、三维模型、地理信息、健康数据、社交数据、浏览数据、铁路客运数据等等不胜枚举。

不知道你有没有发现,其实每个领域都有自己的数据。所谓处理,往往伴随某种目的,但总的来说都是让信息从被处理数据流出来。对于一个数组,能提出的问题很有限,就是“某某位置的元素是什么”,答案无非 {某某,未定义,越界}。但对上面提到的数据,能提出的问题就很多了。

如何从非结构化数据(不是数据结构课程里那种数据就是非结构化数据)里找到问题的答案呢?机器学习的思路往往是现硬生生把 问题->答案 看成一个复杂的函数,再用神经网络自动求导的特点拟合这个函数(当然,这里面也有一些门道,很多研究在这里,比如用卷积运算就能更快更好地拟合图像,就是矩阵,作为输入的函数),拟合就需要样本点,也就是数据,所谓数据驱动。

为什么说“硬生生”呢?图像 -> {猫,狗} 倒是简单,直接用矩阵表示作为函数输入就可以了,多层的卷积神经网络会自动地在中间层学到一些表示(所以深度学习也叫表示学习),效果不错,大家就不深究了,所谓“没有可解释性”。

但换个问题,“为什么我女友最近心情不好? + {她一个月的消费记录、聊天记录、浏览记录}”就不简单了吧。直接塞进循环神经网络(它特殊的结构可以更好地学习有时间顺序依赖的数据,类似于卷积可以更好地学习有相邻位置依赖的数据)不好用了,毕竟只有一个女友,数据量不太够,于是你不得不开始参考别人的女友……更不走运的是,原来最影响女友心情的因素是家里那只猫的心情,而你根本没有采集猫的心情。

所以大家开始动知识图谱的脑筋,能不能让计算机不仅仅把我的问题当成字符串,而是某种更高级的数据结构。你可能有个问题:神经网络直接拟合问题与答案,怎么图像灵,文字就不那么灵了呢?有专家说文字里有人的常识、体验、感情,有专家说文字里有因果逻辑所以不能当成函数拟合……总之,只要不仅仅当成函数拟合,就又走了表示学习的老路,一条极其艰辛的老路,意味着要把语义上的东西给形式化了(形式化就类似编译原理讲的那些符号演算,符号演算就是计算的本质。你说数字计算不是符号演算,其实数字计算只是特殊的符号演算,被冯诺伊曼用二进制补码的表示巧妙地加速了(你看,这也是表示))。

所以,总的来说目前还是会依靠信息论的想法来看待这些智能问题。从科研讲,想办法把一部分人类对问题的理解融入函数拟合过程,来加速拟合过程或提高拟合质量,这当然只对特定的问题有效,因为相当于加入了更多信息,不过是用一种聪明一些的办法。从企业应用的角度讲,更充分(指维度更多、量更大)的原始数据比算法改进厉害,因为算法改进是在用一种更麻烦的方法把信息融进去。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值