再看机器学习

最新推荐文章于 2024-05-02 21:46:15 发布

__Lysias__

最新推荐文章于 2024-05-02 21:46:15 发布

阅读量109

点赞数

分类专栏：机器学习文章标签：人工智能机器学习神经网络数据结构算法

本文链接：https://blog.csdn.net/weixin_42156883/article/details/107071027

版权

机器学习专栏收录该内容

8 篇文章 2 订阅

订阅专栏

一点想法，和你分享一下，不一定对：

目前的人工智能就是分析某种数据。比如，图像、视频、文本、三维模型、地理信息、健康数据、社交数据、浏览数据、铁路客运数据等等不胜枚举。

不知道你有没有发现，其实每个领域都有自己的数据。所谓处理，往往伴随某种目的，但总的来说都是让信息从被处理数据流出来。对于一个数组，能提出的问题很有限，就是“某某位置的元素是什么”，答案无非 {某某，未定义，越界}。但对上面提到的数据，能提出的问题就很多了。

如何从非结构化数据（不是数据结构课程里那种数据就是非结构化数据）里找到问题的答案呢？机器学习的思路往往是现硬生生把问题->答案看成一个复杂的函数，再用神经网络自动求导的特点拟合这个函数（当然，这里面也有一些门道，很多研究在这里，比如用卷积运算就能更快更好地拟合图像，就是矩阵，作为输入的函数），拟合就需要样本点，也就是数据，所谓数据驱动。

为什么说“硬生生”呢？图像 -> {猫，狗} 倒是简单，直接用矩阵表示作为函数输入就可以了，多层的卷积神经网络会自动地在中间层学到一些表示（所以深度学习也叫表示学习），效果不错，大家就不深究了，所谓“没有可解释性”。

但换个问题，“为什么我女友最近心情不好？ + {她一个月的消费记录、聊天记录、浏览记录}”就不简单了吧。直接塞进循环神经网络（它特殊的结构可以更好地学习有时间顺序依赖的数据，类似于卷积可以更好地学习有相邻位置依赖的数据）不好用了，毕竟只有一个女友，数据量不太够，于是你不得不开始参考别人的女友……更不走运的是，原来最影响女友心情的因素是家里那只猫的心情，而你根本没有采集猫的心情。

所以大家开始动知识图谱的脑筋，能不能让计算机不仅仅把我的问题当成字符串，而是某种更高级的数据结构。你可能有个问题：神经网络直接拟合问题与答案，怎么图像灵，文字就不那么灵了呢？有专家说文字里有人的常识、体验、感情，有专家说文字里有因果逻辑所以不能当成函数拟合……总之，只要不仅仅当成函数拟合，就又走了表示学习的老路，一条极其艰辛的老路，意味着要把语义上的东西给形式化了（形式化就类似编译原理讲的那些符号演算，符号演算就是计算的本质。你说数字计算不是符号演算，其实数字计算只是特殊的符号演算，被冯诺伊曼用二进制补码的表示巧妙地加速了（你看，这也是表示））。

所以，总的来说目前还是会依靠信息论的想法来看待这些智能问题。从科研讲，想办法把一部分人类对问题的理解融入函数拟合过程，来加速拟合过程或提高拟合质量，这当然只对特定的问题有效，因为相当于加入了更多信息，不过是用一种聪明一些的办法。从企业应用的角度讲，更充分（指维度更多、量更大）的原始数据比算法改进厉害，因为算法改进是在用一种更麻烦的方法把信息融进去。