任何事物之间有种内在的联系,同类(相似)事物在某些方面必然有共同的地方,或特征的某种维度上相似(从一个侧面看一个事物)。只是这种相似没有被我们挖掘出来罢了。这也是我们研究的一个很重要方面,发掘出事物的相关性。
任何机器学习的东西都得经过学习,尤其是高维空间的事物,也就是至少是监督型的才算可靠(我个人是这样认为的,至少最初的学习过程是这样)。就像人类学习汉字一样,我们应该让计算机慢慢地学习,而不是快速地学习。也就是说,这个学习过程分成很多个阶段,而不是把一大堆的数据扔给计算机让其一下子计算出来。小学生学习写字都历经了好几个过程呢,先是拼音的,再笔画,先易后难。这就是一个阶段学习的问题,大脑里形成的东西都是分层,分工,分类地进行。所以,计算机也应该这样做。
当然,这里关键的问题是可计算的问题。研究人员要做的是把这个学习的过程可计算化!至于到底问题是否可计算,即可通过数学的方式来解决,这是一个数学问题还是一个哲学问题呢?如果我们不能把问题数学化,公式化,那是否意味着电子计算机解决不了这个问题呢?是否要通过将来的量子计算机或生物计算机去解决呢?这个问题真的很关键。