Tech
文章平均质量分 70
yeasy
Make the world better!
展开
-
AI 的时代——Eric Schmidt 斯坦福内部讲座摘要
前几天,谷歌创始人之一 Eric Schmidt 受邀在斯坦福进行了《The Age of AI》讲座。由于是闭门讲座,所以相关话题比较直白开放,探讨了 AI 技术的当前发展、其对社会和经济的影响,以及未来可能面临的挑战和机遇。专注金融科技、人工智能、数据科学、分布式系统相关领域的热门技术与前瞻方向。讲座后,现场还进行了非常激烈和深入的延续讨论,限于篇幅和话题,不再赘述。===== 关于 TechFirst 公众号 =====如果你喜欢公众号内容,欢迎鼓励一杯 coffee~原创 2024-08-17 13:46:08 · 219 阅读 · 1 评论 -
下一代人工智能的设计思路
或许,下一代的人工智能要想更加高效,应当向人类的大脑学习。概率派则认为人无法将整个世界的完整知识进行正确表达,应该将更原始的数据直接灌输给机器,让机器自行去发现规律。在算力稀缺的年代里,推理派更占上风,毕竟依靠人的先验知识,可以节约机器进行学习的时间。大模型扭转了此前人工智能研究的思路,放弃了可解释性,而开始拥抱复杂网络和大规模参数。推理派相信可以通过让机器学习人提前总结归纳好的知识,以达到超越人的智能的水平。后来随着算力资源和数据的丰富,概率派依托超大规模神经网络,目前已经成为主流。原创 2024-01-05 10:00:00 · 495 阅读 · 1 评论 -
OpenAI 开发者大会亮相新一代AI
OpenAI也宣布了降低价格及提高API速率限制的措施,以促进AI技术的广泛应用。:GPT-4 Turbo在执行具体指令方面表现更佳,新增的JSON模式可以确保模型以合法的JSON格式响应。:一种功能更强大的模型,具有128K的超大文本窗口,并以更低的成本提供服务。:新版本支持16K的文本窗口,默认提供改进的指令执行能力和JSON模式。:通过新的seed参数,模型可以提供更一致的输出,便于调试和测试。:新API为开发者提供了构建目标明确的辅助AI应用的便利。原创 2023-11-08 02:10:19 · 309 阅读 · 0 评论 -
向量数据库——让人工智能拥有记忆
大模型应用的深入,让向量数据库的需求变得十分迫切。向量数据库通过对向量化数据处理,可以比较高效地处理复杂的多维数据查询和分析任务,很适合目前的人工智能场景。大模型发展起来后,LangChain、AutoGPT 等项目,都大量使用了向量数据库。向量数据库其实不是全新事物,但是此前的应用场景中向量维度没有那么多。原创 2023-07-03 13:27:12 · 783 阅读 · 0 评论 -
硅基智能生命究竟还有多远
相比之下,现有的大型语言模型大约有两千亿个参数,这只是人类大脑的千分之一左右。如果假设意识的产生需要达到人类大脑的百分之一,那么只要现有的人工智能系统再扩大约十倍,就有可能孕育出真正的智能生命。智力,指的是发现和解决问题的能力,这方面大型语言模型已经体现出了与人类相匹敌甚至超过人类的水平。而意识,是对自我和世界的认知能力,目前这方面的能力还没有在大型语言模型中得到充分体现,可以暂定人工智能还没有达到意识的阶段。如果这个假设是正确的,我们或许可以通过比较现有人工智能系统的复杂度,来预测它产生意识的可能时间。原创 2023-06-22 07:09:41 · 841 阅读 · 0 评论 -
GPT-4 会带来了什么
这将进一步释放 AI 的潜力,甚至有人称为它是新时代的操作系统。未来大部分的信息系统都将连接到 AI 上来。那么,世界将迎来什么样的变化呢?原创 2023-03-25 05:52:13 · 697 阅读 · 0 评论 -
文心一言 vs GPT4
拿文心一言发布会上的几个问题调戏了 GPT4 一下,看看表现如何。原创 2023-03-16 15:46:19 · 4981 阅读 · 0 评论 -
调戏 ChatGPT
调戏ChatGPT,哈哈哈……原创 2023-01-18 06:27:52 · 3518 阅读 · 0 评论 -
软件系统与熵增
熵增是宇宙的基本规律。说的是封闭体系的整体熵只能增,不能减。文明的发展过程,就是在与之争斗,以寻觅那渺茫的生存机缘。人类无法对抗熵增,唯有一二变通之法。原创 2022-12-02 09:15:00 · 927 阅读 · 0 评论 -
分布式金融的攻击与防护
过去四年里,基于区块链的分布式金融(DeFi)行业融资额达到 2530 亿美金,而因为攻击造成的损失超过了 30 亿美金。原创 2022-11-09 13:15:00 · 1955 阅读 · 0 评论 -
掌握系统性思维
整体大于局部之和,结构决定系统行为。原创 2022-11-09 13:00:00 · 943 阅读 · 0 评论 -
设计不会崩溃的健康码系统
本文试图通过利用现代信息科技,逐步设计一个低成本(日均成本 1 块钱),且不会崩溃的健康码服务系统。原创 2022-04-02 08:29:47 · 3447 阅读 · 0 评论 -
从数字艺术品到 NFT
过去几年里,数字艺术品探索了采用 NFT(非同质化代币,Non Fungible Token)这一新的数字媒介形式进行资产交易的可能性。未来大量的物品交易,都可以通过 NFT 形式进行。另外,NFT 可以将资产所有权进行数字化,方便更充分地实现价值。NFT 的出现,代表了交易者从基于纸质合约转变为基于数字合约交易的迫切需求。数字艺术品数字艺术品是指利用计算机技术生成的具备某种艺术价值的一组数据。类似于传统的物理创作的艺术品,数字艺术品被认为具备唯一性和收藏价值。由于数字艺术品的交易多通过加原创 2022-02-18 09:24:27 · 13216 阅读 · 0 评论 -
从 web 1.0 到 web 3.0
互联网生态在过去三十年中经历了从 web 1.0 到 web 2.0 的蜕变,未来的 web 3.0 路在何方,值得思考探究。web 1.0上世纪九十年代初,HTTP 协议发明后,各类网站如雨后春笋纷纷涌现,早期如 AOL、Yahoo 等都创造了惊人的增长奇迹。这些网站的特点都是拥有者负责提供内容,用户则只能读取内容和使用服务。换言之,是经典的单一生产-众多消费模型。web 1.0 的模式使得万维网话语权掌握在少数网站服务商手中,少数人决定了主流声音,其他都是沉默的大多数。web 2.原创 2022-01-04 10:00:00 · 1074 阅读 · 0 评论 -
大规模系统的可控思路
任何系统增大到一定规模,面临的根本问题之一便是可控性(controlability)。规模较小时,可控性通常并非瓶颈,此时可通过操作系统节点进行直接管理。但随着规模逐渐增大,可控性复杂度将成为系统能否扩展的关键制约。要处理可控性复杂度,有两个基本思路:解耦控制和自发控制。解耦控制最简单的思路是将控制平面从系统的数据平面和管理平面剥离。解耦出的控制平面,可以构造统一接口进行操作,复用控制逻辑。以赶羊群为例,如果直接控制每只羊的前进将非常困难,但是给每只羊都拴上绳子(解耦出控制平面),直接原创 2021-12-15 08:15:00 · 745 阅读 · 0 评论 -
数字 Token 的设计与管理
NIST 今年 2 月在其 8301 号报告《Blockchain Networks: Token Design and Management Overview》(区块链网络:令牌设计与管理概述)专门探讨了数字 token 的相关问题。有几个有趣的话题,值得思考。未来架构的重点架构按照主流设计,自底向上分为5层: 物理层:物理硬件。包括服务器,网络基础设施等; 网络层:支持点对点网络通信的网络。如互联网、企业网等; 区块链层:区块链相关的协议实现。包括共识、存储、智..原创 2021-12-14 01:32:50 · 854 阅读 · 0 评论 -
分布式交易的一致性机制
分布式交易随着微服务(Micro Service)的兴起再次收到重视。传统软件场景下,业务需求相对稳定,业务规模增长平缓,可以进行有效预判。此时,宏服务(Macro Service)架构是最合适的选择。该架构下很容易实现数据的 ACID 一致性,以及对失效交易进行回滚(roll back)。但是当业务需求变化剧烈,规模增长很难预判(典型如互联网场景)时,传统软件架构很难进行动态调整和快速演进。此时,采用多种服务单元合作的微服务架构就成为很自然的选择。分散架构随之带来分布式交易的问题。首先,一笔交原创 2021-04-09 05:24:28 · 1151 阅读 · 0 评论 -
超级账本 Fabric 2.x 是如何演进的?
超级账本 Fabric 是最流行的企业分布式账本实现,由 IBM、DAH 等企业于 2016 年初贡献到社区,目前在全球范围内得到了广泛的应用。Fabric 提出了许多先进的理念和设计,包括多通道、身份证书机制、隐私保护、无限扩展的网络结构、运维管理接口等。目前,Fabric 可以满足不同场景下的性能需求,如虚拟机部署场景下可以达到 3500 tps 的吞吐量和小于 1 秒的延迟(参考《Hyperledger Fabric: A Distributed Operating System for Perm原创 2020-08-19 04:55:18 · 738 阅读 · 0 评论 -
也谈并发和并行
并发(concurrency)和并行(parallelism)都是常见的概念,并且很多时候并不容易进行区分,甚至被用作表达同样的概念。网上最流行的解释,并发是一个人吃三个馒头;并行是三个人吃三个馒头。这样理解简单概况了主要区别,但其实并不是太完整。从对象的角度,并发是一种任务分配模式,指的是同一个处理器被调度处理不同的任务,这些任务往往都是同一性质的任务。例如浏览器打开多个页面原创 2014-10-09 15:01:21 · 1378 阅读 · 0 评论 -
账本科技演化录
本文已正式发表于《清华金融评论》2018年2月刊(http://www.21wq.com/aaa/Tsinghua/magazine/wxpay/contentPage.php?id=1708),内容略有调整。如果说金融科技(Financial Technology,Fintech)是保障社会文明的重要支柱,那么账本科技(Ledger Technology,或记账科技)则是最核心的支柱基石。无论是...原创 2018-03-04 11:14:29 · 2368 阅读 · 0 评论 -
超级账本 Fabric 新特性之细粒度隐私保护
超级账本 Fabric 项目自 1.1 版本开始,关于增强通道内隐私保护的新特性引发不少讨论,如 FAB-1151、 FAB-2961、 FAB-4976、FAB-8718。本文将总结该特性设计过程和来龙去脉,以供后续开发者更好地理解最初的设计意图和核心思想。隐私保护问题超级账本 Fabric 1.x 系列版本中在增强隐私性方面做了很大改进,1.0 版本中一个重要特性就是多通道(Multiple...原创 2018-05-18 16:57:48 · 4828 阅读 · 5 评论 -
欧盟《一般数据保护条例》(GDPR)你需要知道的
欧盟《一般数据保护条例》(General Data Protection Regulation,GDPR)将于 2018 年 5 月 25 日起正式施行,该法案虽然旨在加强对欧盟境内相关居民和个体信息和隐私数据的保护,但从整个信息产业来看,是一次历史性的突破。欧洲再次走到了世界的前列。从此,个人数据(在部分地区)的保护将有法可依。发展过程2012 年 1 月首次提出法案草案,先后经过 2014 年...原创 2018-04-29 09:24:49 · 11731 阅读 · 0 评论 -
胡思乱想大杂烩
从计算复杂性的角度,多项式意味着等价,指数意味着差异。从数的角度,多项式是等价类,指数则带来等级的差异。所以,很大概率上 P!=NP 。但是,为何指数如此特别?是否可从信息论角度进行分析?另外,从微分角度,对多项式来说意味着降维;指数则保持了不变性,是否与此有关? 金融活动类似水,沿着势下降的方向流动。该过程中水量不变,但会影响到路径上的环境。如果没有路径控制,水流会造成坏的结果。如果有需求,而......原创 2018-06-18 09:48:51 · 668 阅读 · 1 评论 -
区块链下个十年关键问题探索
如果从比特币项目上线算起,区块链科技已经走过了其第一个十年的历程。就新兴事物而言,十年时间可能不算久远。回顾过往,通过技术的快速迭代、应用的加速落地,区块链确实交付了一份充实的答卷。Gartner 咨询公司在2017 年做出预测,到2025年,区块链业务的附加值将达到1760亿美元。整个2018 年全年区块链行业的投资额同期涨幅超过300%。过去十年,区块链科技被应用在供应链、公共事务、金...原创 2018-11-26 15:33:23 · 992 阅读 · 0 评论 -
科技与法律的一些思考
(据某次互联网立法研讨会议上的发言要点整理)科技与法律的关系过去百年,全球形成相对稳定的和平环境,各国经济都得到长足发展。类似欣欣向荣长达一个世纪的的境况,在农业时期和工业时期都很难想象,在整个人类文明史上也都是十分罕见的。其关键原因在于科学技术的突飞猛进尤其是信息科学技术的飞速发展,客观上缩小了世界的规模。过去百年,依赖量子物理学革命这一基础突破所带来的巨大红利。科技行业之所以...原创 2018-12-29 20:58:46 · 1657 阅读 · 1 评论 -
2019 阅读书目
前段时间有出版社老师问起新年读书计划。回首这一年,最大遗憾就是读得书太少,很多只粗略看了个开头。计划新的一年利用差旅中时间,认真读完几本好书。《论法的精神》牛顿的《自然哲学的数学原理》揭露了物理世界的根本规律,而孟德斯鸠这本巨著,堪称探讨了社会科学的基本规律。这本书影响颇为深远。华夏历史典籍中唯有《韩非子》异曲同工,然而成书太早,思想深度无法相提并论。《设计原本》如果你...原创 2018-12-31 10:56:40 · 3001 阅读 · 0 评论 -
网络科学的魅力
半个世纪前,互联网早期的设计者们在讨论网络设计原则时,一定无法想象到几十年后,与信息科技毫无关系的物流行业,也会演化出了惊人的相似结构。互联网体系架构的基础原则包括三个:报文格式:报文格式十分灵活可扩展,支持多种类型报文,支持不同长度报文,报文上标记点对点地址。转发设备无需额外修改。路由协议:根据优化目标的不同,可以有多种路由协议,它们彼此可交互,构成全球网络的路由表。存储转发:无连接...原创 2019-01-19 15:37:02 · 958 阅读 · 0 评论 -
超级账本Fabric中的权限管理和策略
权限管理是区块链网络十分重要的功能,负责控制某个身份在某个场景下是否允许采取某个操作(如读写某个资源)。超级账本 Fabric 项目通过策略(Policy)来灵活指定各场景下的操作权限。策略应用场景具体来看,常见的策略场景包括如下表所示。其中,大部分都与系统配置链码相关,可以在通道配置中进行指定;部分为代码中的规定。对于存储在通道配置中的策略,可以利用 configtx.yaml ...原创 2019-03-13 17:09:54 · 7525 阅读 · 3 评论 -
Hyperledger Fabric 收到过大消息导致 gRPC 错误
概要gRPC 默认的接收消息限制自 v1.0 之后调整到了 4 MB,导致当接收消息超过 4MB 后会 reset 掉连接。问题分析首先这是个老问题,而且并不只有 Fabric 碰到,所有使用 gRPC 的情况下都可能碰到(不论是 Python、Java、Golang 语言),包括 Tensorflow 等项目中也都报了相关的bug,例如https://github.com/tens...原创 2019-05-11 08:08:22 · 3371 阅读 · 1 评论 -
数据科技的若干发展趋势
数据科技(Data Science and Technology)在近二十年来越来越受重视,盖因大部分问题都直接来自业界的真实需求。甲骨文 Open World 大会(9.15~9.19)刚刚在旧金山谢幕。来自全球各地的科技巨头和行业客户齐聚一堂,探讨了包括分布式账本、智能技术、物联网等热门话题,以及可能对数据科技产生的深远影响。分布式账本作为社会学实验,比特币、以太坊等公共账本已经...原创 2019-09-21 03:39:47 · 814 阅读 · 0 评论 -
关于网络学科的几点思考
如果从 ENIAC 诞生(1946 年 2 月)算起,人类进入信息社会已经过去了 70 余年。前三十年(1946 ~ 1976),计算机自身从电子管进化到晶体管再到集成电路,为后来计算机网络的出现奠定了物质基础。后三十年(1976 ~ 2006),计算机网络的出现,特别是 Internet 的出现,将多个主机联系起来,形成大规模的分布式集群,为整个信息时代构建了不可或缺的基础设施。原创 2018-01-07 11:20:25 · 691 阅读 · 0 评论 -
《区块链原理、设计与应用》荣获2018年度畅销图书奖!
《区块链原理、设计与应用》已经正式出版,详细介绍了区块链和分布式账本相关技术,以超级账本为例介绍企业分布式账本的设计原理、架构实现和应用技巧,欢迎大家阅读使用并反馈建议。获奖情况荣获2018年度机械工业出版社畅销图书奖,信息科技领域唯一原创获奖图书。编辑推荐本书由超级账本全球技术委员会委员、核心设计和开发者编撰,清华大学五道口金融学院常务副院长廖理教授作序,Apache 基金会...原创 2017-10-18 21:12:01 · 4563 阅读 · 2 评论 -
Hyperledger Fabric 排序节点启动过程
Orderer 节点启动通过 orderer 包下的 main() 方法实现,会进一步调用到 orderer/common/server 包中的 Main() 方法。核心代码如下所示。// Main is the entry point of orderer processfunc Main() { fullCmd := kingpin.MustParse(app.Parse(原创 2017-10-20 19:24:59 · 3366 阅读 · 2 评论 -
一张图说明实践中该如何使用 git workflow
ref: https://github.com/xirong/my-git/blob/master/git-workflow-tutorial.md原创 2015-06-16 22:08:14 · 1507 阅读 · 0 评论 -
netfilter/iptables 结构要点
四张表,每个表有若干链。filterINPUT(路由表决策后,到本机的进程)FORWARD(路由决策后,发现不是到本地)OUTPUT(本机进程发包,路由决策后准备发到外面)iptables -t TABLE 操作 CHAIN 序号 规则-m state --state ESTABLISHEDnatPREROUTING(路由之前)POS原创 2015-03-16 20:20:41 · 1555 阅读 · 0 评论 -
IPsec 和 NAT 的冲突问题详解
背景IPsec 协议可以用来在 IP 层提供校验和加密等安全特性。基于 IPsec 的 VPN 已经成为 site-site 模式下高可靠连通方案的首选。NAT 最初是为了解决地址不足的问题,它将 NAT 网关后的实际地址隐藏起来,对外呈现一个外部地址,通常包括基于地址的映射(设备负责将内外地址进行对应和替换)和基于端口(通常外部为同一地址,根据到达端口的不同替换为内部不同的地址和原创 2015-03-25 17:04:42 · 14461 阅读 · 1 评论 -
C10K 问题引发的技术变革
C10K 问题服务器同时支持并发 10K 量级的连接,这些连接可能是保持存活状态的。解决这一问题,思路主要有两个方面,一个是对于每个连接处理分配一个独立的进程/线程;另一个思路是用同一进程/线程来同时处理若干连接。每个进程/线程处理一个连接这一思路最为直接。但是由于申请进程/线程会占用相当可观的系统资源,同时对于多进程/线程的管理会对系统造成压力,因此这种方案不具备原创 2015-01-26 14:30:34 · 14783 阅读 · 3 评论 -
网络流量监测技术概述
监控指标延迟(Latency)丢包率(Packet Loss)吞吐量(Throughput)链路使用率(Link Utilization)可用性(Availability)测量手段主动 vs 被动单点 vs 多点网络层 vs 应用层镜像 vs 采样主机端 vs 交换节点流量抓取协议镜像/SPAN把被监控端口的流量复制一份,发送到特定目的端口。某些硬件原创 2015-01-25 15:20:03 · 8989 阅读 · 0 评论 -
数据中心核心网络技术一览
主机内二层转发(即服务器内虚机间转发)基于本地软件交换机交换VMWare 方案,通过服务器上软件交换机(如 Linux 网桥、OpenvSwitch)来实现。主要问题是对服务器性能有消耗。802.1Qbh BPE(Bridging Port Extend)已终止。Cisco 主导,数据层面为 PE(Port Extender)。802.1BRCisc原创 2015-01-21 13:18:58 · 5111 阅读 · 0 评论 -
支持 Markdown 的网页 slides 工具总结
支持 Markdown 的网页 slides 工具总结在注重效率的今天,很多人都不喜欢制作 PPT,特别是技术人员。流行的 PPT 制作工具往往需要用户关注太多内容无关的细节。而像 TeX 这样强大的系统又似乎太过于重量级了。现在越来越流行制作网页格式的 slides,并通过浏览器来播放和发布。 这样做有很多优点:包括跨平台(特别在移动端)、无需特殊软件支持、分享方便、轻量级等。原创 2014-11-25 13:45:09 · 7579 阅读 · 0 评论