随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别,即对人的身份识别和指令识别。机器人没有像人类一样发达的感觉器官,那么它们是如何对人类进行身份识别并对根据人类指令做出正确的行动呢?其实指纹识别和人脸识别早已不是什么新鲜事,随着人工智能的迅速发展,未来各种新型的身份识别技术将会逐渐进入我们的生活,
随着智能机器人的快速发展,人们对机器人的“智力”要求也越来越高,而智能服务机器人的兴起也为人工智能技术提出了更高的要求。作为以人机交互为主的智能服务机器人,模式识别技术则是服务机器人的核心关键技术。所谓模式识别技术,就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。
在人工智能系统中,有一个我们称之为Agent的主体,Agent发现它身处某种环境下,并需要完成某些任务。如果周围的环境是真是世界,Agent可能会是一个机器人;但如果周围环境是诸如游戏这类虚拟环境,Agent就可能是一个虚拟形象(Avatar)。
要完成某个任务,Agent会通过两种方式与环境互动。首先是传感器,DeepMind更多会使用视觉传感器让机器与环境互动,当然,如果你愿意,也可以使用语音、触觉等方式。所以这类Agent通常通过自己的观察来对环境建模。但是这里有个问题,真是环境通常是充满噪声、干扰、不完整的,所以需要Agent尽最大努力去预测周围到底是什么样的。
一旦这个环境模型建立,就要开始第二步了:如何在这个环境中做出最好的行为决策。当然,行为与环境间的互动可能是成功的,也可能是失败的,这写结果都会被实时纳入Agent的观察过程,这也就是强化学习的过程。
DeepMind 将深度学习与另一种叫做“强化学习”的技术相结合,强化学习的灵感来自于斯金纳(B.F. Skinner)等动物心理学家研究成果。它可以让软件通过在行动后接收对行动效果的反馈来学习,人类和动物通常都是这么做的。
康德说过:直觉和概念构成了我们掌握的所有知识,所以仅有概念而没有相应的直接,或仅有直觉而无概念,都不能产生知识。
这段话给我们的启发是,所谓在包含正确知识体系的科学中,产生概念的哲学因素和产生直觉的经验因素都很重要。
在某种意义上可以说,西方文化就是“编码文化”。科学技术、工业革命、市场经济、普适价值、契约关系等等,无一不编码。有必要指出,从计算机诞生的第一天起,计算机语言的发展就浸润在西方的编码文化之中。计算机语言最基本的语句是if-else,至于switchcase语句完全可以用if else语句来替换掉,在if-else的背后即非此即彼:0,或1,正交。由此可见,相对而言,本已“编码”的西方社会较容易“编程”而进入虚拟世界,以及反过来接受虚拟世界对现实世界的规范与制约。
相比之下,中国文化显然是“意会文化”。道可道非常道。“道”,如何编码?考托福雅思,2万单词;汉语,5000单词足矣,一词多义。所以联合国文件不能以中文为准,即使伤害了中国人民的感情。由单词组成的语句更多歧义。冬天,能穿多少就穿多少;夏天,能穿多少就穿多少。语境相关。面对这样的中文考题,外国考生也只能是“跪了”。中国的各级文件中必有“原则上”三个字,其背后是无穷无尽的下不为例和个案处理。最高境界干脆是:“尽在不言中”。这样的社会及其运作过程,绝非if-else,亦远非switchcase可以囊括,可以穷尽。不能编程,是否意味着中国的传统文化与社会运行不能映射到虚拟世界?
量子计算机有可能为中国传统文化,为中国社会的运行方式编程。
在机器学习中,所有的神经元都从一张白纸的“空”状态开始,在训练过程中变得特异化(specialized)。在训练期间,网络被“给予”大量数据,每个神经元都成为识别数据中特定模式的专家。在最低层,神经元执行最简单的任务。例如,在照片识别应用中,低级神经元可能识别来自暗处的光线或物体的边缘。这些神经元的输出被传递到网络下一层的神经元中,这些神经元又会以其特有的方式搜索它们会识别的特征。
只有几层的神经网络就可以学习识别人脸、各种犬类、停车标志和校车。
正是在英国剑桥大学和德国哥廷根大学的短暂求学经历,让神童维纳开始成长为一名真正的青年数学家。
1913年,19岁的维纳在《剑桥哲学学会会刊》上发表了一篇关于集合论的论文。这是一篇将“关系的理论”简化为“类的理论”的论文,在数理逻辑的发展中占据有一席之地。维纳从此步入学术生涯。
由于知道的对象是事实,因此与知道所关涉的是“现实性”。这种现实性是由感觉经验提供的。与此不同的是,由于相信(信念)的对象是命题,所以相信涉及的多是“可能性”。因为这类命题或是我听说的,或是我虽然具有某些理由相信,但实际情况尚未发生(如相信明天会下雨)等等。
确定性程度不同。康德对这一问题曾给出精辟的界定:信念是主观上充分,而客观上不充分的;知识则是不仅主观上充分,而且客观上也充分。这一点可说构成了信念与知识的根本差别。
人造的结构能够产生出另一与自己功能相同的结构
根据DARPA,对于大数据问题,图形分析处理器非常有必要。这些问题通常涉及多对多的关系(many-to-many)而不是目前的处理器所针对的多对一或一对一的关系。DARPA的一个军事例子,可能是the first digital missives of a cyberattack。根据英特尔的一个民用案例,可能是所有从亚马逊购物的人都被映射到他们购买的所有商品(明确地将多对多关系描述为人与物之间的关系)。
军旅作家朱苏进写过一段十分深刻的话,描述类似韩先楚这些将军:“差不多都是被苦难所逼,被迫扯起战旗,投奔共产党闹革命,他们是别无选择而后成大器。也就是说,他们是为了求生,而不是为了出仕为将才慨然从戎的。这就使他们的戎马生涯带有以命相搏、置之死地而后生的彻底性。在他们身上,浓浓地聚集着东方的、民族的、党性的、血缘的精神内涵。必须深刻地理解他们,研究他们,欣赏他们,然后才可能正确地继承他们。”
克劳塞维茨在《战争论》说:面对战争中的不可预见性,优秀的指挥员必备两大要素:第一,即便在最黑暗的时刻,也具有能够发现一线微光的慧眼;第二,敢于跟随这一线微光前进。
能够发现微光,是智慧;敢于跟随微光前进,则是勇气。只有战争才能真正完成这样的识别,才能激发出军人在和平时期无论多么周密的审查筛选也难以发现的潜质。
如果有人否认纯粹数学对象的存在,他就必定要否认有任何几何事物存在,因此很难坚持说,我们的几何观念是从存在物中抽象出来的。当然,没有什么实体只有长度而无宽度,或者只有宽度而无厚度,因为几何图形并不是实体,而是实体的边界。要想让我们的几何观念从物理对象的世界中抽象出来,承认这是一个站得住脚的假说,那么世界就必须是一个几何世界——它的一个基本特征就是在空间中的广延
信息技术在物理世界和人类社会之外增加一个Cyberspace(这个单词的原意是“控制域”,本文翻译成“信息空间”),使得人类社会和物理世界成为可控的世界。
韩璧丞告诉硅谷密探,BrainCo 研究的是脑机接口领域中相对较难的两个领域:
第一个难点是脑电信号的意识解析,换句话说就是,“对应人的大脑意识,这些信号究竟意味着什么”,因为在传统的脑电领域里有种误解是只有侵入式(把电极插入人脑中)的方式得到的脑电信号才是最准确的,但其实非侵入式的方式采集的信号与大脑意识有着一种深层次的映射关系,而 BrainCo 正是在研究这个非侵入式脑电信号的算法解析及映射。
而第二个难点是基于人类学习下的自适应算法,简单来说就是让人适应机器,发出算法机器可识别的信号,通过训练找出映射关系。因为韩璧丞相信,人脑是最好的计算装置,人的学习能力是非常强的,通过人类的适应,解决一个动态分类的映射是更好的脑机接口的体验的关键。
思想家、文学家埃默森曾经说过:“用刀解剖关键性的字,它会流血。”足见语言是有生命的,它具备了创造和毁损的能力。诗人安琪洛也谈到过言语的力量。她说,言辞就像小小的能量子弹,射入肉眼所不能见的生命领域。我们虽看不见言辞,它们却成为一种能量,充满在房间、家庭、环境和我们心里。她相信,身边的言辞会渗透我们的生命。
通过词缀联想,学习者可以学一个会一串,迅速地扩大词汇量。Krashen 在“输入假设”( input hypothesis ) 中也提到:只有接受可理解性输入( comprehensible input ),语言习得才会产生。精加工策略,可以建立形象与词汇之间的联系,使抽象的材料具体化,使学习者要记忆的目标词转化为可理解性输入,这一信息加工过程遵循了 Krashen 的“输入假设”,是一种行之有效的英语词汇学习策略。