《眨眼之见》、机器学习、名教与刑名学

题图:落日 | 摄影:欧阳

《眨眼之间:不假思索的决断力》(《Blink:The Power of Thinking Without Thinking》),首次出版于2005年一月份。那时候,机器学习和人工智能还远没有如今这么如火如荼。它原是一本心理学畅销书,但是随着机器学习的方兴未艾,书中的一些场景开始被计算机占领,反而成为了一本“机器学习的入门读物”。

本书主要讲:1. 瞬间决断的秘密;2. 瞬间决断的缺陷及如何避免;3. 如何培养和控制瞬间决断力。但是作者不经意间透露了,眨眼之间的瞬间决断力也许更适合计算机:

人类大脑中执行瞬间决断的部分被称为适应性潜意识。这一新概念,被人们看成一台伟大的计算机,迅捷且安静地处理着海量的数据,以便于我们人类执行各种功能。

瞬间决断力,在人,是薄片分析法;在计算机,是模式识别与机器学习。归根结底,是一种删繁就简的能力。

本文将以机器学习的视角来打开薄片分析法。如果你恰好从事人工智能相关的研究,希望你能更加学以致用;如果不是,你也可以借本文或《眨眼之间》简单了解。人工智能,不应该只有阿老师(AlphaGo)教我们下围棋;计算机的判断又快又准,同样值得学习。当然,还有更多。

薄片分析法与机器学习

什么是薄片分析法呢?根据书中的定义,它是“快速认知的一个组成部分,指人们通过极少经验即可理解事物和行为规律的潜意识能力”。通俗地说,潜意识有种删繁就简的能力,能够从大量信息中忽视无用信息、提取出关键信息,并根据这些关键信息来做判断。

我们可以通过书中所举的例子来感受一下薄片分析法:

  1. 通过对私人空间的短暂一瞥,快速了解一个人;

  2. 观看一位素昧平生的教师两秒钟的无声影像,学生就能判断他的教学水平的高低;

  3. 观看一对夫妻15分钟的对话录像,专家能以90%的准确率预测他们是否会离婚,如果是1小时的录像,准确率将达到95%;

  4. 表情识别;

  5. ……

看到第四个例子,想必一些同学会“懂了得一笑”,因为表情识别正是人工智能/计算机视觉的一个研究方向。而书中介绍的人类专家的水平,应该已经被计算机超越了。

我们以上述的第三个例子来理解一下薄片分析法。

当观看一对夫妻15分钟的对话录像,情感专家在意和着眼的是,正面与负面的情绪比例。他们的先验知识是:一段婚姻若想延续,则婚姻中的积极情绪与消极情绪之比至少要达到5:1

普通人摒弃其他细节,关注对话中双方的情绪,算是得其门而入了。情感专家则会更有选择性。他们会细化消极情绪,并重点关注其中的四个因素:戒备、一言不发、指责与蔑视。把握了这四个要素,婚姻问题十有八九就能迎刃而解了(此处仅转述书中的观点)。

四个要素中,蔑视更是重中之重。当夫妻双方或一方对另一方表现出了蔑视情绪,这将是婚姻出现危机的最重要标志。

下面,让我们从机器学习的视角来解析这个例子与薄片分析法,会更加形象一些。

关于是否的问题是一个二分类问题。问题简化之后,可以使用逻辑回归模型来求解。

我们要做的就两步:

  1. 构造模型的输入特征,即 x 们;

  2. 更新模型的参数,即 theta 们 。

在外行看来,15分钟的录像蕴含的信息看似不少,却是一团浆糊,难以从中抽离出用于决断的有用特征,一种情况是只能举出个别特征,另一种情况是哗啦啦罗列出许多特征,但是使用时却一筹莫展了。一遍又一遍地反复观看,也无济于事。

受过训练的情感专家的优势在于,他们已经知道哪些特征是有效的以及特征的权重几何,于是随着录像的看罢甚至在观看过程中,就已经有了决断。哪有什么眨眼之间的瞬间决断力,不过是千锤百炼的火眼金睛罢了

机器学习的过程同样如此:起于浆糊,终于专家,中间的过程是千百次的训练迭代。

具体来说,最初的机器学习模型与普通人一样,预测(判断)全靠蒙,准确率只有50%。但是每一次预测错误,模型都会得到一个反馈,它据此来调整对应不同特征的权重(模型参数)。比如,有一组特征记录了夫妻双方各自的说话时长,这组特征如果无效,它们的权重将随着训练不断降低,即它们并不重要;而表征谈话中情绪的特征,它们的权重越来越高,成为最关键的特征。

机器学习的过程,符合二八原则:用20%的时间,能将预测的准确率从50%提高到90%;剩下10%的提升空间(假设模型的准确率上限接近100%),需要80%的时间,不断地调整细节。

以上,我们对问题做了简化。实际上,机器学习(深度学习)模型能够从录像中自动地提取特征,做到像人类专家一样,一边看录像一边就有了结论。

值得注意的是,模型自动提取的特征数量是预先设置好的,比如10个、100个。特征千变万化,有效的特征被选用,无效的特征被剔除,留下的特征只是权重不同。

写到这,我还想到一个例子。特征提取的过程,其实像浇水,花洒的孔数是固定的,每个孔都能出水,单孔的出水量、流速、水滴落点,水流来自壶中的哪一股水都无法确定。但是花洒作为一个整体,通过不断地位置与姿态,就完成了一次精准的浇灌。水,是录像,是输入;花洒,是从录像中提取特征的深度模型;提着花洒的手,是做出最终预测的逻辑回归模型;一次浇灌,就是一次预测。

通过上述例子,想必你已经了解薄片分析法了。万一还没有,且记住:删繁就简,就是弱水三千,只取一瓢饮

名教与刑名学

薄片分析法,顾名思义,它包含了一层“切割”的意思。对于不擅长或不热衷的事物,我们的感受与评价是流于表面的、难以解释的、笼统而模糊的,通常只有好坏美丑。普通人看到晚霞满天,会感慨:好美啊!诗人王勃则会说:落霞与孤鹜齐飞,秋水共长天一色。在他看来,这是一幅动静相宜的画面,按意象切割,其中又有:落霞、孤鹜(野鸭子)、秋水、长天。

现在的社会分工越来越细。当我们谈论分工、分专业的时候,其实也是对世界做了一次“切割”。不同行业、不同专业的人看到世界的不同切面。电影《超强台风》有这样一幕:风很大,气象学家盯着在空中飘荡的塑料袋看。旁人问她,在看什么?她说,我在看上升气流

说到术业有专攻,各行各业都有自己的术语和黑话。更多的时候,不是贫穷限制律我们的想象力,是语言人选择了专业,术语设置了壁垒。当经济学人谈论钱时,他们谈论的可能不是钱,而是货币;当他们谈论成本时,可能是机会成本、交易成本、沉默成本等等。

当我感冒了,医生会首先确认是普通感冒(cold),还是流感(flu),然后对症治疗。体感正常,我能准确地向医生描述自己的症状,但是我无法区分普通感冒和流感,因为我的字典里只有感冒,在我的认知里,感冒=普通感冒=流感。现在,我了解了流感与普通感冒的区别,并且知道全球每年多达65万人死于季节性流感相关的呼吸系统疾病(来自WHO 2017年的数据),我会在每年的流感多发季节去打一针流感疫苗,遇上普通感冒就多喝热水,尽量不去医院凑热闹了。(天气转冷,祝各位身体健康,多保重)

子曰:必也正名乎!又说,君子名之必可言也,言之必可行也(由于对名分的重视,儒家又有一个别称,名教)。这里要稍微曲解下孔子的话。有一类“术语”,普通人只是苦于不知,苦于不可名,一旦知道了也能做得很好。比如上述感冒的例子。

再比如,对于美食,普通人也知道“色相味俱全”,对着摆盘拍个照,发个朋友圈,却想不到好的文案。也许美食家的舌头会更加敏感一些,但是他们有一套评价体系以及专门的词汇,用于全面地描述对食物的看法。这是你我拿来就能用的。书中提到一个例子,品鉴蛋黄酱时,美食家会从颜色、色彩强度、色度等6个方面描述外观,从10个方面描述口感,分3组的14个层面来描述味道,如基本口味(咸、酸、甜)、化学口感(灼烧感、刺激性、微苦感),每个因素从0-15计分。

可能有同学想吐槽,还让不让人好好吃饭了。我的感受恰恰相反,我们大可不必为每一种口味去打分,但是可以在品尝食物的时候,细细地将不同的口感与口味从“好吃”中分离出来,味道会更丰富,好吃会更好吃。我个人非常喜欢吃牛排,因为不是很频繁地吃,每次都会很用心地品尝:切一块,先举到鼻尖闻一下,再含在嘴里不咬,用口腔去感受这个时候牛肉的香味,然后慢慢地咀嚼,体会五分熟的牛肉的鲜嫩多汁,随着咀嚼,牛肉的香味会溢出,直到充斥整个口腔。整个人都要升华了。

看《浪姐》的时候,万茜姐姐说,演戏,准备了90%,呈现出来80%,被观众感受到的可能只有50-60%。美食同样如此。“好吃”只是get到了50%的美味,细细品味能感受到70%,剩下的10%就留给美食家吧。

前文提到,美食家有一套点评的专业词汇。当我们了解到一个相对专业的词汇,比如对于滑蛋而言,爽滑感是一个很重要的口感,我们在品尝的时候,去感受爽滑的程度。这是一个循名责实的过程。

循名责实,是一个刑名学的核心。刑,通“形”,因此刑名学同形名学。一个圆形的东西,从各个角度看,它都呈现出圆形,那么所有的圆形都是它的“形”;我们对这些形的判断,是球,也就是它的“名”。

循名责实,顾名思义,就是根据事物的“名”,去考察它的“实”,不容许有名不副实的情况。对应到上文滑蛋的例子,滑蛋不滑,这就是名不副实,要么它不是滑蛋,要么它不是一个好的滑蛋,总之是一个差评。

儒家,极重名分,说“必也正名乎”。正名是为了正实,它与循名责实一起上下求索,所求正是一个名副其实。

两千多年前,孔老夫子奔走呼号:“名不正则言不顺,言不顺则事不成,……”。但是随着社会的发展,严格意义上的名与实逐渐分离,“名不副实”成为常态。马路,不再是马儿跑的路;双十一,不再只是光棍的节日,还是全民的购物狂欢节。一些名对应的实改变了,另一些名的内涵更丰富了或者更单一了。

用更加现代的视角重新认识名与实:实是有形或无形的概念,是一个或者一组概念的集合;名则是对概念的引用,是象征性的符号。正名、循名责实、名副其实,都是想要建立符号与概念之间“正确”的连接。

夫子看重连接的正确性,那是礼乐,是法度,是君君、臣臣、父父、子子。

然而,如果重要的是连接呢?用发展的眼光来看,世界无时无刻不在变化之中。以科学为例,过去“正确”的连接,被发现是错误的,会被纠正,比如,亚里士多德认为力是维持物体运动的原因,伽利略告诉我们:力是改变物体运动状态的原因;科学的进步,会发现比我们过去所认知的更宏大的世界,比如从地心说到日心说再到地球只是苍茫宇宙中普通又不普通的蓝色星球。

也许可以这样说,所谓知识,是既知且识,知其名、识其实,也就是我们知道的那些连接。当我们向世界输出知识时,我们脑海中的概念会一个一个表达为符号,可以是语言文字,也可能是声音、画面;当我们从世界汲取知识时,外界的信号、符号会内化为一个与之对应的概念。博闻强识的人,是知道许多连接的人;学习,是建立新连接、更新连接;举一反三,是能够建立连接与连接之间的联系……

那些我们并不知道的连接,无论是名与实皆不知的,还是只知其名不知其实的,又或者知其实而不知其名的,于我们而言,都是“未知”的。名与实皆不知的,属于完全未知的情况,且不去讨论它。后两种未知其实并不少见。比如,资本主义,许多人都听过,在中国更是饱受批判,但是资本主义是什么呢?回答不了这个问题,那就是只知其名不知其实了。

知其实而不知其名的,我知道有两种情况。

其一,对应感冒看病的例子,我们能够一点一点描述它的部分症状(外在表现),但是它是什么(内核),我们并不知道,更不知道如何对症下药。这些暂时都不是我们的知识。久病成医,就是生病多了,对于常见病症的认识更加充分了,能够建立起一些连接,这是头疼甲、那是胃病乙,在不去医院的情况下也能自我医治。

其二,对应好景美食的例子。我们能够感知到的概念全部纠缠在一起,使得只能去感受这份美好,却不能更深刻地理解,于是不可名状。这时候,薄片分析法就有了用武之地,它是斩麻快刀,乱者必斩。“斩”过之后,一条又一条的连接,不捋自顺,拎起了这一头,也就拎起了那一头。物理学家理查德・费曼,不喜欢惯常的数学符号,就自己发明了一套。类似地,我们可以自己命名分离的概念,或者取个方便自己记忆的别名,名之可言即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值