超人汪小建(seaboat)
公众号:【远洋号】,笔名seaboat,擅长工程算法、人工智能算法、自然语言处理、计算机视觉、架构、分布式、高并发、大数据和搜索引擎等方面的技术,大多数编程语言都会使用,但更擅长Java、Python和C++。平时喜欢编程、绘画、看书、写作和运动,擅长素描、篮球、跑步、游泳、健身和羽毛球等运动项目。崇尚技术自由,崇尚思想自由。出版书籍:《Tomcat内核设计剖析》、《图解数据结构与算法》、《图解Java并发原理》、《人工智能原理科普》。
展开
-
大语言模型LLM的一些点
GPT模型是一种自然语言处理模型,使用Transformer来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。LLM的涌现能力指的是在大型模型中出现的一些令人惊讶且不同于较小模型的能力,类似于物理学中的相变现象。核心关键点就是要LLM具备自然语言的方式来操作结构化数据,比如json。原创 2023-08-14 19:13:43 · 885 阅读 · 0 评论 -
大脑的记忆
虽然AI的神经网络也具备记忆编码功能,而且也能够读写记忆,但在记忆的创建方式、存储方式以及提取方式等都无法确定是否与生物神经网络的机制相同,这也是如今AI从本质上更进一步的主要障碍。记忆是指记住某事物并且在需要的时候提取出来的行为。按照记忆的时间长短可以分为短时记忆和长时记忆,短时记忆通常只能保持对某件事数十秒的记忆,而长时记忆是以分钟或年为单位的较长时间的记忆。长时记忆又分为陈述记忆和非陈述记忆,陈述记忆主要是将知识和过去的体验用话语或图像形式保存记忆,非陈述记忆是指不可用话语和图像形式保存的记忆。原创 2023-01-14 11:40:18 · 697 阅读 · 1 评论 -
了解左右大脑
最早的实验是在猫脑上做的,通过外科手术将猫的两半脑联系切除后,所有基本都表现得很正常,不过如果蒙住一个眼睛让它走迷宫后再蒙住另外一只眼则完全不记得这个迷宫的情况。学习研究人工智能需要对大脑的结构有一定的了解,当前的弱人工智能与生物上的大脑并没有什么太多联系,最多也只是引入了一些概念上的东西,实际的机制确实完全不同。人类的大脑分为左右两个半球,它们各自的功能都不同。也许胼胝体并非是左右脑的唯一连接,这样可能就导致切胼胝体不能完全分离左右脑,因为曾经有一个天生没有胼胝体的小孩,但信息仍然可以在两半脑之间传递。原创 2023-01-01 08:45:41 · 357 阅读 · 0 评论 -
概念、理论与模型
我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙都充满着复杂性挑战。我们去理解现实世界的物体或思想都离不开概念、理论和模型。原创 2022-12-17 16:16:07 · 326 阅读 · 0 评论 -
读《冯诺依曼传》
约翰尼人生最后的一年他对自己的新型计算机与包含了几十亿神经元的人脑之间的对照十分着迷,大脑进行多位数求和时很慢,但大脑的很多其它能力,比如认知、想象、思考能力等都是计算机没有的功能,这些能力在大脑中是怎样编程的呢?如果能做到,那么他将改变人类的整个未来。1956年约翰尼入院后仍坐着轮椅接受了美国总统艾森豪威尔亲自授予的特别自由勋章。约翰尼也承认他的绝望之情,一个知道如何更好生活的人,却不知道如何面对死亡,他无法想象没有他的思想的世界回事个什么样子。他也拒绝休息,只要有一口气在他就会思考。原创 2022-12-10 16:43:40 · 917 阅读 · 0 评论 -
人工智能六十多年
前言作为吃瓜群众,多数人对人工智能的了解主要是通过科幻片,里面的机器人拥有人类的思维和超凡的能力。然而目前现实的人工智能却只是很弱的人工智能,它仅仅是功能单一的某个程序。人工智能六十多年的发展经历了几度繁荣和衰落,虽然已取得不错的进展,然而现实与理想的差距还是很大,前进道路曲折。达特茅斯会议之前1956 年的达特茅斯会议被称为是AI诞生的标志,但在此之前已经有AI相关的研究。1...原创 2018-05-27 10:09:31 · 784 阅读 · 0 评论 -
聊聊从逻辑门到操作系统的计算机
前言现代计算机已经发展的非常复杂,要理解计算机的运行原理都已经变得异常艰难,虽说我们无法亲自去制造他,但我们可以了解下计算机系统是怎么从0发展而来的。逻辑门逻辑门是计算机的基础元件,通过它可以完成逻辑运算(也称布尔运算),这类运算输入输出都只有0和1。与门执行“与”操作,两个输入一个输出,只有当两个输入都为1时输出才为1,其它情况都为0。或门执行“或”操作,两个...原创 2018-07-02 08:27:20 · 1731 阅读 · 0 评论 -
图灵机与计算理论
前言图灵机和计算理论是人工智能乃至整个计算机科学的理论基础,邱奇-图灵论题告诉我们一切可计算过程都可以用图灵机模拟。图灵机图灵机,又称图灵计算、图灵计算机,是由数学家艾伦·麦席森·图灵(1912~1954)提出的一种抽象计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人们进行数学运算。图灵机指一个抽象的机器,它有一条无限长的纸带,纸带分成了一个一个...原创 2018-06-18 10:38:45 · 8859 阅读 · 1 评论 -
浅聊卷积神经网络的发展
前言卷积神经网络的发展主要是为了解决人类视觉问题,不过现在其它方向也都会使用。发展历程主要从Lenet5->Alexnet->VGG->GooLenet->ResNet等。Lenet5上世界80年代发明了卷积层,但由于硬件限制无法构建复杂网络,直到后面90年代才开始有实践。1998年LeCun提出卷积层、池化层和完全连接层组合,以此来解决手写数字的识别问题。此时的效...原创 2018-09-23 10:30:53 · 2929 阅读 · 1 评论 -
一个例子了解迁移学习
迁移学习对于传统机器学习而言,要求训练样本与测试样本满足独立同分布,而且必须要有足够多的训练样本。而迁移学习能把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域...原创 2018-12-13 08:00:00 · 305 阅读 · 0 评论 -
可视化探索卷积神经网络提取特征
前言卷积神经网络的发展主要是为了解决人类视觉问题,不过现在其它方向也都会使用。发展历程主要从Lenet5->Alexnet->VGG->GooLenet->ResNet等。传统神经网络传统BP神经网络层与层之间都是全连接的,对于图像处理领域,当神经网络处理大图像时,全连接会导致待训练的参数非常庞大,比如100万个像素的图像,对于100个节点的隐层,则会产生亿级别的参数...原创 2018-12-06 08:16:24 · 7392 阅读 · 2 评论 -
聊聊从脑神经到神经网络
前言神经网络能解决非线性的复杂的模型问题,而且通过增加网络的层数将具备更加强大的学习能力,另外如果再改造改造层的结构则变成各类深度学习模型,例如CNN RNN之类的。神经网络一般被用来捕捉复杂情况下的特征,比如说视频图像中的动物类别、一名作家的写作风格等等。大脑神经元人脑可能有1000多亿个神经元,每个神经元都可能在几个方向上互相连接着,这么大量的神经元及连接就形成了一个超级大型的网络。我...原创 2018-11-29 08:32:22 · 1660 阅读 · 0 评论 -
聊聊机器学习的套路
前言这里说说机器学习问题分析的一般性过程,尽管存在各种各样的机器学习问题,但大体上的步骤及最佳实践都有一定的套路。理解问题首先得理解要解决的是什么问题,比如业务上要解决什么问题该问题涉及到的信息管道有哪些如何采集数据,数据源在哪数据是完整的吗,数据刻度最小是多少数据是定期发布的还是实时获取的确定影响模型的有价值因素工作量以上等等等等。ETL处理待收集的数据可能是表格数...原创 2018-11-15 08:34:46 · 414 阅读 · 0 评论 -
如何用TensorFlow训练聊天机器人(附github)
前言实际工程中很少有直接用深度学习实现端对端的聊天机器人,但这里我们来看看怎么用深度学习的seq2seq模型来实现一个简易的聊天机器人。这篇文章将尝试使用TensorFlow来训练一个基于seq2seq的聊天机器人,实现根据语料库的训练让机器人回答问题。循环神经网络在seq2seq模型中会使用到循环神经网络,目前流行的几种循环神经网络包括RNN、LSTM和GRU。训练样本集主要是一些QA...原创 2019-02-20 11:13:27 · 1632 阅读 · 1 评论 -
业务系统如何引入神经网络
切入点目前的AI其实更多就是仅仅用来从历史数据中学习到一些规律而已,在业务上,更多的只是减少人为介入工作,所以要在业务系统中引入神经网络,其实主要就是在要找到切入点。简单...转载 2019-01-24 08:00:00 · 179 阅读 · 0 评论 -
如何让机器自己学会玩游戏(附github)
前言AI时代已经到来,未来几十年AI会越来越普遍,作为技术人员如果想不被浪潮淹没最好掌握这种基础技能,对AI有兴趣想入门的同学可以看看下面的课程:https://edu.csdn.net/topic/ai30?utm_source=wjhttps://edu.csdn.net/course/detail/6601?utm_source=wj这篇文章将讲解强化学习如何让机器自己学会玩游戏...原创 2019-03-04 14:17:25 · 714 阅读 · 0 评论 -
从大脑结构到人工神经网络
前言神经网络能解决非线性的复杂的模型问题,而且通过增加网络的层数将具备更加强大的学习能力,另外如果再改造改造层的结构则变成各类深度学习模型,例如CNN RNN之类的。神经网络一般被用来捕捉复杂情况下的特征,比如说视频图像中的动物类别、一名作家的写作风格等等。大脑神经元人脑可能有1000多亿个神经元,每个神经元都可能在几个方向上互相连接着,这么大量的神经元及连接就形成了一个超级大型的网络。我...原创 2019-07-12 09:02:26 · 2126 阅读 · 0 评论 -
计算机如何从0发展而来
前言现代计算机已经发展的非常复杂,要理解计算机的运行原理都已经变得异常艰难,虽说我们无法亲自去制造他,但我们可以了解下计算机系统是怎么从0发展而来的。逻辑门逻辑门是计算机...原创 2019-07-23 08:00:00 · 618 阅读 · 1 评论 -
计算机的本质是什么?逻辑?数学?
计算机的诞生1946年,在美国的宾夕法尼亚大学诞生了第一台现代电子计算机ENIAC。虽然在今天看来ENIAC计算能力连手机,甚至是十几块钱的计算器都比不上,但它在当时却是相当强大。ENIAC的体积非常庞大,得好几个大房间才能放下它,耗电也相当恐怖,一开机全城家家户户电灯都要变暗。之所以称ENIAC是第一台现代计算机,是因为现代计算机理论的奠基人是图灵和冯诺依曼。这两个超级天才应该...原创 2019-07-01 08:00:00 · 6599 阅读 · 10 评论 -
人类的智能是如何产生的
智能的人类 人类在外界的影响下进化,又凭借自己的意志来影响外界。 一亿多年前体重是人类上百倍的恐龙虽然称霸了地球,但它们也仅仅是“低级动物”,并没有任何迹象标明恐龙发展出了高级智能。而人类则不断通过基因突变来进化自身的组织,使得自身能够更加充分与外界接触并由此产生刺激,比如在触觉、视觉、听觉、嗅觉等等方面。更重要的是大脑还具有记忆功能,从而使得人类在与...原创 2019-06-18 10:11:05 · 2664 阅读 · 2 评论 -
AI神经网络如何辨别事物
AI与神经网络人工智能已经发展了六七十年,经历了几度繁荣和衰落。虽然已取得不错的进展,但是与理想中的人工智能差距还是很大。人工智能三大学派:符号学派、连接学派、行为学派。...原创 2019-06-11 08:00:00 · 8489 阅读 · 23 评论 -
一文了解人工智能——学科介绍、发展史、三大学派
何为智能在介绍人工智能之前,我们要先了解智能到底是什么?智能,其实就是智力和能力的总称。世界著名教育心理学家霍华德·加德纳提出了著名的“多元智能理论”,他认为人类个体都独立存在着八种智能,分别如下:多元智能理论 视觉—空间智能,指对线条、形状、结构、色彩和空间关系的敏感以及通过平面图形和立体造型将它们表现出来的能力。 语言—言语智能,指听说读写能力,利用语言描述事件、表...原创 2019-07-16 19:00:00 · 1537 阅读 · 0 评论 -
冰冷的机器能否被我们唤醒?
机器的智能计算机经过七八十年的快速发展,几乎没人不认为如今计算机的强大。它超快的运算速度能让复杂的数值计算瞬间得到结果,它超大的存储空间能存得下海量的信息,机器在这些方面...原创 2019-05-28 08:00:00 · 177 阅读 · 0 评论 -
神经网络与深度学习
非线性的世界我们的世界是一个非线性的世界,我们能否让机器来学习现实中很多复杂的问题呢?从人类大脑结构中受到的启发,人们开始在一定程度上模拟大脑的结构。既然大脑能够理解这个世界,那人工神经网络应该也是可以的。神经网络简单的感知机属于线性模型,而通过嵌套多个神经网络层和增加神经元就可以解决很多复杂的问题。整个神经网络模型包含了三要素:线性变换、非线性变换和线性决策。线性与非线性变换实际上就是...原创 2019-05-24 10:11:13 · 270 阅读 · 0 评论 -
一文了解人工智能神经网络的原理
大脑神经元人脑可能有1000多亿个神经元,每个神经元都可能在几个方向上互相连接着,这么大量的神经元及连接就形成了一个超级大型的网络。我们就是因为这些网络而存在各种各样的思想和意识。大脑神经元即是脑神经细胞,主要包括细胞体、树突、轴突、突触等。细胞体,由细胞核、细胞质和细胞膜组成。它是神经元新陈代谢的中心,是接收信息并处理的部件。树突,是细胞体向外延伸树枝状的纤维体,它是神经元的输入通道...原创 2019-06-24 09:10:14 · 1563 阅读 · 0 评论 -
为什么需要微积分
微积分我们知道数学是人类描述自然规律的语言将现实世界进行抽象,有了数学这个工具就能让我们对物体数量、物体结构、物体的空间、物体的运动等进行抽象量化描述。现今的数学已经发展...原创 2019-05-20 08:00:00 · 1259 阅读 · 0 评论 -
强化学习如何让机器玩游戏
强化学习强化学习是代理面临的学习问题,它通过与动态环境反复交互试验从而学习到某种行为。它是机器学习的主要学习方法之一,智能体从环境到行为的学习,也就是如何在环境中采取一些列行为,才能使得回报信号函数的值最大,即获得的累积回报最大。现在强化学习与深度学习结合的深度强化学习更加强大。马尔科夫决策过程在理解强化学习之前,我们先了解我们要解决什么样的问题。其实强化学习过程就是优化马尔科夫决策过程...原创 2019-07-04 09:06:14 · 4103 阅读 · 6 评论 -
人工智能如何自己玩游戏?
人工智能近些年来,人工智能在各类媒体大肆宣传报道下又大火了起来。以大众的眼光来看,人工智能看似已经无所不能了,自动驾驶、智能机器人、人脸识别、语音翻译以及下围棋玩游戏等等,这些都不在话下。正所谓外行看热闹内行看门道,实际上,目前的人工智能所用到的技术主要是一些机器学习算法,属于弱人工智能。虽然它能实现很多神奇的应用,但它的局限性也很大,只有在清楚了解人工智能的机制原理后才不至于被媒体夸大的...原创 2019-07-09 08:00:00 · 4662 阅读 · 4 评论 -
现实世界的模型与理论
模型与理论为了去分析理解现实世界的万物与人类的思想,我们引入了很多概念,从而形成概念体系。概念体系则被称为模型,将逻辑应用于模型得到的见解称为理论。比如数学有很多概念,这...原创 2019-11-12 08:00:00 · 704 阅读 · 0 评论 -
大自然能否演变出一台计算机
原子与分子按目前的科学解释,万物都是由原子和分子组成,大量的原子分子经过不同的组合从而形成不同的物体。从随机的角度来看,只要时间足够长就可以产生任意的物体。正所谓随机蕴含...原创 2019-10-28 08:00:00 · 470 阅读 · 0 评论 -
人类的数学抽象思维
抽象的数学如今的数学已经变得相当抽象深奥,但实际上数学却并非生来如此,数学的发展主要是由现实问题来推动,对数学进行抽象能使其成为通用性更强的理论。通过抽象思维从实际问题中...原创 2019-08-13 08:00:00 · 1055 阅读 · 2 评论 -
以向量和矩阵的视角抽象万物
空间从广义上,我们通过宇宙来定义万物,宇宙也是时间和空间的统一。对于整个物理世界,时间和空间是最重要最本质的两个维度。如果抛开时间维度,则可以通过空间来描述事物。空间能容...原创 2019-08-06 08:00:00 · 634 阅读 · 0 评论 -
人工智能的本质是最优化过程
模型三要素为了将事物和问题转化为最优化问题数学模型我们需要考虑三个要素:因素变量、约束条件和目标函数。我们根据事物和问题先找到影响模型的所有因素变量,然后再根据目的建立一...原创 2019-08-27 08:00:00 · 574 阅读 · 0 评论 -
不确定世界的模型
复杂的世界我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙,其复杂程度都是超乎想象。或许你不曾深入去思考过身边事物的复杂性,那是因为你已经对你日常所见习以为常。所有在你...原创 2019-12-02 08:10:00 · 306 阅读 · 0 评论 -
几大智能语义平台调研
几个平台此次主要是调研了以下五家智能语义平台:阿里云小蜜(beebot) www.aliyun.com/product/beebot百度度秘(DuerOS)dueros...原创 2019-09-10 08:00:00 · 705 阅读 · 0 评论 -
人机对话系统与自然语言处理
前言一两年前由于工作需要重点研究过自然语言处理与人机对话系统,本文将会列出的它们的知识点以及自己的思考。nlp与人机对话对于普通企业,人机对话目前主要的应用是任务型人机对话系统。不管是nlp亦或是chatbot,学术上和工程上都有不同的实现手段。学术界上人机对话系统的研究成果以及最新的研究趋势在工程上应用的较少,而工程上又有自己的方式来实现人机对话。人机对话在实现过程中会使...原创 2019-09-03 08:00:00 · 1371 阅读 · 0 评论 -
了解无人驾驶汽车原理
无人驾驶汽车无人驾驶汽车,又称自动驾驶汽车或轮式移动机器人,是一种运输动力的无人地面载具。我们理想的无人驾驶汽车是无需人类操作即能从地点A行驶到地点B,不管途中环境多复杂...原创 2019-10-10 08:00:00 · 3430 阅读 · 0 评论 -
聊聊香农的信息熵
复杂的世界我们生活在一个极其复杂的世界,不管是小到分子原子亦或是大到整个宇宙,其复杂程度都是超乎想象。或许你不曾深入去思考过身边事物的复杂性,那是因为你已经对你日常所见习...原创 2019-07-30 08:00:00 · 640 阅读 · 0 评论 -
聊聊大数据与人工智能
关于数据这些年人类生产的数据呈爆发式增长,从十几年前移动智能设备的兴起,到如今人们身上穿戴的各种传感器设备,都在24小时不断产生大量数据。这些数据包括文本、语音、图像、视频等等。大数据大数据这个词最早出现在20世纪90年代,当时只是用来描述数据量很大,但并没有给出明确的定义和概念意思。出现后没有受到多少人的关注,直到2012年后大数据得到了各行各业的关注重视,很多学科和行业都会涉及大数据,大...原创 2020-01-13 10:12:01 · 1286 阅读 · 0 评论 -
人工智能时代社会工作
人类与机器人人工智能在各类媒体的炒作下貌似已经无所不能了,似乎要很快就要全面超越人类。但实际上人的智能包含了很多方面,比如运动智能、感知智能、决策智能、推理智能、控制智能等等。目前的人工智能只在少数领域内很小的一块能超越人类,而在更多领域它看起来更像个三岁的小孩。机器人在人工智能技术的加持下智能提高了,不过与人类相比还是相去甚远。不过人类个体的智能受到时空约束,人类个体的生命是有限的,人的一生在历史长河中不过是一瞬间,人在短暂的一生学习能力、感知能力、处理能力都受到很大的约束。机器人则有自己独特的优势,原创 2020-07-07 09:34:54 · 387 阅读 · 0 评论