杂
文章平均质量分 85
杂
超人汪小建(seaboat)
公众号:【远洋号】,笔名seaboat,擅长工程算法、人工智能算法、自然语言处理、计算机视觉、架构、分布式、高并发、大数据和搜索引擎等方面的技术,大多数编程语言都会使用,但更擅长Java、Python和C++。平时喜欢编程、绘画、看书、写作和运动,擅长素描、篮球、跑步、游泳、健身和羽毛球等运动项目。崇尚技术自由,崇尚思想自由。出版书籍:《Tomcat内核设计剖析》、《图解数据结构与算法》、《图解Java并发原理》、《人工智能原理科普》。
展开
-
现实世界的模型与理论
模型与理论为了去分析理解现实世界的万物与人类的思想,我们引入了很多概念,从而形成概念体系。概念体系则被称为模型,将逻辑应用于模型得到的见解称为理论。比如数学有很多概念,这...原创 2019-11-12 08:00:00 · 704 阅读 · 0 评论 -
当前AI的特点及带来的工业革命
AI的劣势目前所谓的人工智能都属于弱人工智能范畴,基于机器学习的算法模型几乎是以统计学或盲模型的方式运行,所以基本上不能作为强人工智能的基础。它只能针对某个很窄的领域进行建模,很难实现一个通用广泛的学习机制。比如一个具体应用场景,需要AI工程师针对该问题进行具体编程实现,很难扩展到其它场景。目前的人工智能基于机器学习算法,都由数据驱动,很难实现实质性的逻辑突破。此外,需要消耗惊人的资源能源才能运行,这就造成成本非常高。机器能根据历史样本提供答案,但是却给不出为什么会这样决策。它就好比一个黑盒,最大的问题原创 2020-11-07 12:18:14 · 353 阅读 · 0 评论 -
机器在数学上能否拥有创造性
数学创造性几千年以来在数学上所取得的成果都是由人类大脑探索发现并推理总结而来的,在数学的原创性创造方面机器几乎无能为力,尽管计算机在数学中应用得越来越广泛。计算机的运作方式与人类大脑完全不同,那么计算机能否拥有数学创造性呢?如果拥有创造性它所创造的数学与人类的数学是否相同呢?关于活力论活力论是一种古老的思想,它从生物学和化学来看创造生命的可能性。它认为生命体中包含了一种活力,这种活力是生命必备要素,活力只在生命体中才存在,非生命体则不存在,这是生物与非生物体不相同的法则。在该思想影响下产生了有机物和原创 2020-11-17 09:30:55 · 253 阅读 · 0 评论 -
计算机的本质是什么?逻辑?数学?
计算机的诞生1946年,在美国的宾夕法尼亚大学诞生了第一台现代电子计算机ENIAC。虽然在今天看来ENIAC计算能力连手机,甚至是十几块钱的计算器都比不上,但它在当时却是相当强大。ENIAC的体积非常庞大,得好几个大房间才能放下它,耗电也相当恐怖,一开机全城家家户户电灯都要变暗。之所以称ENIAC是第一台现代计算机,是因为现代计算机理论的奠基人是图灵和冯诺依曼。这两个超级天才应该...原创 2019-07-01 08:00:00 · 6600 阅读 · 10 评论 -
人类的智能是如何产生的
智能的人类 人类在外界的影响下进化,又凭借自己的意志来影响外界。 一亿多年前体重是人类上百倍的恐龙虽然称霸了地球,但它们也仅仅是“低级动物”,并没有任何迹象标明恐龙发展出了高级智能。而人类则不断通过基因突变来进化自身的组织,使得自身能够更加充分与外界接触并由此产生刺激,比如在触觉、视觉、听觉、嗅觉等等方面。更重要的是大脑还具有记忆功能,从而使得人类在与...原创 2019-06-18 10:11:05 · 2664 阅读 · 2 评论 -
不确定世界的模型
复杂的世界我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙,其复杂程度都是超乎想象。或许你不曾深入去思考过身边事物的复杂性,那是因为你已经对你日常所见习以为常。所有在你...原创 2019-12-02 08:10:00 · 306 阅读 · 0 评论 -
概念、理论与模型
我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙都充满着复杂性挑战。我们去理解现实世界的物体或思想都离不开概念、理论和模型。原创 2022-12-17 16:16:07 · 327 阅读 · 0 评论 -
图灵机与计算理论
前言图灵机和计算理论是人工智能乃至整个计算机科学的理论基础,邱奇-图灵论题告诉我们一切可计算过程都可以用图灵机模拟。图灵机图灵机,又称图灵计算、图灵计算机,是由数学家艾伦·麦席森·图灵(1912~1954)提出的一种抽象计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人们进行数学运算。图灵机指一个抽象的机器,它有一条无限长的纸带,纸带分成了一个一个...原创 2018-06-18 10:38:45 · 8860 阅读 · 1 评论 -
计算机最基础的核心理论——布尔逻辑
布尔逻辑是计算机最基础的核心理论,为什么这么说呢?因为不管是我们使用的手机电脑或是其它的智能设备都是基于存储芯片和处理芯片,虽然这些芯片的外观和构成都不同,但它们的基本模块却是一样的,都是...原创 2021-09-20 13:18:53 · 880 阅读 · 0 评论 -
了解无人驾驶汽车原理
无人驾驶汽车无人驾驶汽车,又称自动驾驶汽车或轮式移动机器人,是一种运输动力的无人地面载具。我们理想的无人驾驶汽车是无需人类操作即能从地点A行驶到地点B,不管途中环境多复杂...原创 2019-10-10 08:00:00 · 3433 阅读 · 0 评论 -
人工智能时代社会工作
人类与机器人人工智能在各类媒体的炒作下貌似已经无所不能了,似乎要很快就要全面超越人类。但实际上人的智能包含了很多方面,比如运动智能、感知智能、决策智能、推理智能、控制智能等等。目前的人工智能只在少数领域内很小的一块能超越人类,而在更多领域它看起来更像个三岁的小孩。机器人在人工智能技术的加持下智能提高了,不过与人类相比还是相去甚远。不过人类个体的智能受到时空约束,人类个体的生命是有限的,人的一生在历史长河中不过是一瞬间,人在短暂的一生学习能力、感知能力、处理能力都受到很大的约束。机器人则有自己独特的优势,原创 2020-07-07 09:34:54 · 387 阅读 · 0 评论 -
监督学习在研究什么
什么是监督学习简单来说,监督学习是对给定的输入输出样本进行学习并建立一个模型,该模型能对任意输入做出好的输出预测。监督学习核心思想所有可能的模型函数的集合称为假设空间,H={f∣Y=f(X)}H=\left \{ f|Y=f(X) \right \}H={f∣Y=f(X)}。对于所有的模型函数集合,可能不知道是该用用逻辑回归模型、或贝叶斯模型、或神经网络模型还是用支持向量机模型。这个过程通常是一个不断迭代的过程,只有在不断地尝试比较才知道哪个模型比较好。假设选定一个模型f,对于输入X,预测值为原创 2020-10-23 17:20:28 · 202 阅读 · 0 评论 -
大自然能否演变出一台计算机
原子与分子按目前的科学解释,万物都是由原子和分子组成,大量的原子分子经过不同的组合从而形成不同的物体。从随机的角度来看,只要时间足够长就可以产生任意的物体。正所谓随机蕴含...原创 2019-10-28 08:00:00 · 470 阅读 · 0 评论 -
了解左右大脑
最早的实验是在猫脑上做的,通过外科手术将猫的两半脑联系切除后,所有基本都表现得很正常,不过如果蒙住一个眼睛让它走迷宫后再蒙住另外一只眼则完全不记得这个迷宫的情况。学习研究人工智能需要对大脑的结构有一定的了解,当前的弱人工智能与生物上的大脑并没有什么太多联系,最多也只是引入了一些概念上的东西,实际的机制确实完全不同。人类的大脑分为左右两个半球,它们各自的功能都不同。也许胼胝体并非是左右脑的唯一连接,这样可能就导致切胼胝体不能完全分离左右脑,因为曾经有一个天生没有胼胝体的小孩,但信息仍然可以在两半脑之间传递。原创 2023-01-01 08:45:41 · 357 阅读 · 0 评论 -
以向量和矩阵的视角抽象万物
空间从广义上,我们通过宇宙来定义万物,宇宙也是时间和空间的统一。对于整个物理世界,时间和空间是最重要最本质的两个维度。如果抛开时间维度,则可以通过空间来描述事物。空间能容...原创 2019-08-06 08:00:00 · 634 阅读 · 0 评论 -
人工智能的本质是最优化过程
模型三要素为了将事物和问题转化为最优化问题数学模型我们需要考虑三个要素:因素变量、约束条件和目标函数。我们根据事物和问题先找到影响模型的所有因素变量,然后再根据目的建立一...原创 2019-08-27 08:00:00 · 574 阅读 · 0 评论 -
如何用TensorFlow训练聊天机器人(附github)
前言实际工程中很少有直接用深度学习实现端对端的聊天机器人,但这里我们来看看怎么用深度学习的seq2seq模型来实现一个简易的聊天机器人。这篇文章将尝试使用TensorFlow来训练一个基于seq2seq的聊天机器人,实现根据语料库的训练让机器人回答问题。循环神经网络在seq2seq模型中会使用到循环神经网络,目前流行的几种循环神经网络包括RNN、LSTM和GRU。训练样本集主要是一些QA...原创 2019-02-20 11:13:27 · 1632 阅读 · 1 评论 -
聊聊机器如何理解人类的语言
人类语言复杂性自然语言对于人类发展进程是至关重要的,可以说如果没有自然语言就不会有人类的文明,它也是人类独有的能力。想象一下,如果没有自然语言我们该如何进行思想交流,该如何进行人与人之间的协作?。人类的自然语言发展到如今已经是高度成熟了,同时这也是一个相当复杂的系统,从字到单词到短语再到句子和段落,加上各种不同的表达形式和语境,真真算得上是“皇冠上的明珠”。如果要去形容自然语言有多复杂好像也很难说清楚,那我们就以数学组合的角度来看自然语言的复杂度,当然用该例子也并不完全正确,重点是体会下自然语言爆炸式原创 2021-01-12 09:41:27 · 503 阅读 · 0 评论 -
聊聊香农的信息熵
复杂的世界我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙,其复杂程度都是超乎想象。或许你不曾深入去思考过身边事物的复杂性,那是因为你已经对你日常所见习...原创 2019-07-30 08:00:00 · 640 阅读 · 0 评论 -
人类的数学抽象思维
抽象的数学如今的数学已经变得相当抽象深奥,但实际上数学却并非生来如此,数学的发展主要是由现实问题来推动,对数学进行抽象能使其成为通用性更强的理论。通过抽象思维从实际问题中...原创 2019-08-13 08:00:00 · 1055 阅读 · 2 评论 -
计算机如何从0发展而来
前言现代计算机已经发展的非常复杂,要理解计算机的运行原理都已经变得异常艰难,虽说我们无法亲自去制造他,但我们可以了解下计算机系统是怎么从0发展而来的。逻辑门逻辑门是计算机...原创 2019-07-23 08:00:00 · 618 阅读 · 1 评论 -
大数据和人工智能工程上的一些点
大数据大数据这个词最早出现在上世纪90年代的美国,直到2012年后才火起来。大数据没有一个明确的概念,之所以称之为大是因为数据量太大超过了单台计算机的资源,这时就需要分布式的数据处理工具,以便能在用户可容忍的时间内进行数据处理。大数据从业人员肯定会去了解谷歌的mapreduce论文和hadoop开源工具。然而海量数据本来是静态,只有通过对数据进行分析和利用才能让数据产生价值。正所谓量变产生质变。...原创 2020-05-06 10:35:57 · 487 阅读 · 0 评论 -
浅聊卷积神经网络的发展
前言卷积神经网络的发展主要是为了解决人类视觉问题,不过现在其它方向也都会使用。发展历程主要从Lenet5->Alexnet->VGG->GooLenet->ResNet等。Lenet5上世界80年代发明了卷积层,但由于硬件限制无法构建复杂网络,直到后面90年代才开始有实践。1998年LeCun提出卷积层、池化层和完全连接层组合,以此来解决手写数字的识别问题。此时的效...原创 2018-09-23 10:30:53 · 2929 阅读 · 1 评论 -
几大智能语义平台调研
几个平台此次主要是调研了以下五家智能语义平台:阿里云小蜜(beebot) www.aliyun.com/product/beebot百度度秘(DuerOS)dueros...原创 2019-09-10 08:00:00 · 705 阅读 · 0 评论 -
聊聊大数据与人工智能
关于数据这些年人类生产的数据呈爆发式增长,从十几年前移动智能设备的兴起,到如今人们身上穿戴的各种传感器设备,都在24小时不断产生大量数据。这些数据包括文本、语音、图像、视频等等。大数据大数据这个词最早出现在20世纪90年代,当时只是用来描述数据量很大,但并没有给出明确的定义和概念意思。出现后没有受到多少人的关注,直到2012年后大数据得到了各行各业的关注重视,很多学科和行业都会涉及大数据,大...原创 2020-01-13 10:12:01 · 1286 阅读 · 0 评论 -
人工智能六十多年
前言作为吃瓜群众,多数人对人工智能的了解主要是通过科幻片,里面的机器人拥有人类的思维和超凡的能力。然而目前现实的人工智能却只是很弱的人工智能,它仅仅是功能单一的某个程序。人工智能六十多年的发展经历了几度繁荣和衰落,虽然已取得不错的进展,然而现实与理想的差距还是很大,前进道路曲折。达特茅斯会议之前1956 年的达特茅斯会议被称为是AI诞生的标志,但在此之前已经有AI相关的研究。1...原创 2018-05-27 10:09:31 · 784 阅读 · 0 评论 -
冰冷的机器能否被我们唤醒?
机器的智能计算机经过七八十年的快速发展,几乎没人不认为如今计算机的强大。它超快的运算速度能让复杂的数值计算瞬间得到结果,它超大的存储空间能存得下海量的信息,机器在这些方面...原创 2019-05-28 08:00:00 · 177 阅读 · 0 评论 -
如何让机器自己学会玩游戏(附github)
前言AI时代已经到来,未来几十年AI会越来越普遍,作为技术人员如果想不被浪潮淹没最好掌握这种基础技能,对AI有兴趣想入门的同学可以看看下面的课程:https://edu.csdn.net/topic/ai30?utm_source=wjhttps://edu.csdn.net/course/detail/6601?utm_source=wj这篇文章将讲解强化学习如何让机器自己学会玩游戏...原创 2019-03-04 14:17:25 · 715 阅读 · 0 评论 -
大脑的记忆
虽然AI的神经网络也具备记忆编码功能,而且也能够读写记忆,但在记忆的创建方式、存储方式以及提取方式等都无法确定是否与生物神经网络的机制相同,这也是如今AI从本质上更进一步的主要障碍。记忆是指记住某事物并且在需要的时候提取出来的行为。按照记忆的时间长短可以分为短时记忆和长时记忆,短时记忆通常只能保持对某件事数十秒的记忆,而长时记忆是以分钟或年为单位的较长时间的记忆。长时记忆又分为陈述记忆和非陈述记忆,陈述记忆主要是将知识和过去的体验用话语或图像形式保存记忆,非陈述记忆是指不可用话语和图像形式保存的记忆。原创 2023-01-14 11:40:18 · 698 阅读 · 1 评论 -
图灵机是什么?一起来看看它的工作原理
前言当前的人工智能实际上还是属于数学问题的范畴,人工智能的发展也需要数学的理论支持。我们在讨论人工智能时本质上是在讨论可计算问题,著名的邱奇-图灵论题(Church–Turing thesis)表明一切可计算问题都可以使用图灵机来模拟计算,该理论由美国数学家邱奇和英国数学家图灵共同提出的。图灵所提出的图灵机本质是一种计算模型,计算针对的是确定性的事情,而不定的事则超出了计算的范围。计算的分解图灵认为任何可计算的问题都可以使用图灵机来模拟,对于某个可计算问题,我们根据一组确定的规则就可以通过移动纸带来得原创 2021-03-01 23:59:19 · 4053 阅读 · 1 评论 -
新书上市|《图解数据结构与算法》,全彩印刷!这是一本轻松学习数据结构与算法的书!
关于这本书我的新书《图解数据结构与算法》上市了,全彩印刷,这本书的写作初衷是为大家提供一种形象且易于理解的方式来学习常见的数据结构和算法,本书采用一步一图的方式来呈现数据结构中常见概念以及算法的步骤,降低了理解难度和阅读压力。对于常见的数据结构和算法的核心思想,我们更希望从感性的角度来理解把握,从而能够在不同的场景中知道要使用怎样的数据结构和算法。这也是本书的写作意图,作者希望不管是刚入行的程...原创 2020-04-08 08:12:48 · 905 阅读 · 0 评论 -
看图轻松理解数据结构与算法系列(希尔排序)
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。希尔排序希尔排序是希尔(Donald Shell)提出的一种排序方法,也属于插入排序,但是简单插入排序的高效版本,也称为缩小增量排序。基本思想是将待排序元素进行增量分组,然后在分组组内进行插入排序,随着...原创 2018-09-27 08:32:52 · 512 阅读 · 0 评论 -
看图轻松理解桶排序
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。桶排序桶排序即Bucket Sort,也称箱排序。其基本思想是将待排序数组分配到若干个桶内,然后每个桶内再各自进行排序,桶内的排序可以使用不同的算法,比如插入排序或快速排序,属于分治法。每个桶执行完排序...原创 2018-11-19 08:44:12 · 400 阅读 · 0 评论 -
看图轻松理解斐波那契数列
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种...原创 2019-01-21 08:00:00 · 1912 阅读 · 0 评论 -
使用哈希算法将字符串映射到数组中
需求将不同字符串映射到对应数组,数组不够时自动成倍扩容,比如有一个数组String[4],现在准备将不同的string映射到String[4]上,str5时会自动扩容并重新打散。str1-->String[3]str2-->String[0]str3-->String[2]str4-->String[1]方案先使用哈希运算,比如用murmurhash3_x86_32算法得到一个32位的值a。原创 2017-02-23 19:19:13 · 3814 阅读 · 0 评论 -
看图轻松理解斐波那契数列
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。斐波那契斐波那契(Leonardo Pisano ,Fibonacci, Leonardo Bigollo,1175年-1250年),又称列奥纳多,是中世纪意大利数学家。他是西方第一个研究斐波那契数列的...原创 2019-01-21 08:14:05 · 692 阅读 · 1 评论 -
2018汇总数据结构算法篇
看图轻松理解数据结构和算法系列(数组) 看图轻松理解数据结构与算法系列(单向链表) 看图轻松理解数据结构与算法系列(双向链表) 看图轻松理解数据结构与算法系列(基于数组的栈) 看图轻松理解数据结构与算法系列(二叉搜索树) 看图轻松理解数据结构与算法系列(AVL树) 看图轻松理解数据结构与算法系列(选择排序) 看图轻松理解数据结构与算法系...原创 2019-01-02 09:42:26 · 366 阅读 · 0 评论 -
图论动态规划算法——Floyd最短路径
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。Floyd算法Floyd是一种经典的多源最短路径算法,它通过动态规划的思想来寻找给定加权图中的多源点之间的最短路径,算法时间复杂度是O(n3)。之所以叫Floyd是因为该算法发明人之一是Robert F...原创 2018-11-12 08:33:46 · 3129 阅读 · 2 评论 -
看图轻松理解数据结构与算法系列(NoSQL存储-LSM树)
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。关于LSM树LSM树,即日志结构合并树(Log-Structured Merge-Tree)。其实它并不属于一个具体的数据结构,它更多是一种数据结构的设计思想。大多NoSQL数据库核心思想都是基于LSM...原创 2018-10-09 08:31:53 · 875 阅读 · 1 评论 -
看图轻松理解数据结构和算法系列(数组)
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种...原创 2018-07-23 08:00:00 · 110 阅读 · 0 评论