半吊子全栈工匠-CSDN博客

原创 2023年，不缀的脚步

匆匆，时光从指尖溜走，匆匆，时光染白了发梢，匆匆，时光在倾听着我们匆匆的脚步。2023年，平凡而又非常不同以往，一个50多岁的IT人再一次换了工作，对那些贩卖焦虑的人来说往往被称为特例，或者被当成幸存者偏差，浮躁和无奈会蒙蔽人们的视听，让人们看不到他们不能轻易得到的东西。事实上可能并不复杂，可以扪心自问，我们真的喜欢技术么？能够从工作中获得乐趣么？工作乐趣工作的乐趣大体有三个。第一个是赚钱养家，赡...

2023-12-28 09:10:12 913

原创机器学习模型性能的10个指标

尽管大模型非常强大，但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比，解释现实中的物理现象，未必要用到量子力学。有些相对简单的问题，或许一个统计分布就足够了。对机器学习而言，也不用言必深度学习与神经网络，关键在于明确问题的边界。那么在使用ML解决相对简单问题的时候，如何评估一个机器学习模型的性能呢？这里给出了10个相对常用的评价指标，希望对产研同学有所帮助。1. 准确率准确率是机...

2023-12-24 20:23:25 1794

原创解读LoRA

大模型调优（finetuning）不仅仅是参数的优化，同样会受到非功能性约束的挑战，例如：计算效率约束：训练过程应该快速而廉价。内存计算高效：不应该需要大量的GPU来微调LLM。易于部署：不应该为每个要解决的任务部署LLM的多个副本。在一定程度上，LoRA（Low-Rank Adaptation）可以较好地面对这些挑战。使用LoRA，可以降低微调专用LLM的门槛，同时实现与端到端微调相当的性能，能...

2023-12-17 20:23:54 264

原创《一书读懂物联网》前言

我们对知识的认知是有规律可循的，大都是从问题开始，对问题的界定、归纳等都是为解决知识增长或进化而服务的，正如波普尔知识进化图（见图 i-1）所示的那样。科学始于问题，发现问题是科学知识增长的起点，任何新的科学知识的产生都来源于问题。一个问题（P1）的技术解决方案（TS）往往不止一个，而是有很多个，各种技术解决方案形成一个集合，在对其进行严格的实际检验、明确场景、排除错误（EE）后，才能筛选出较好的...

2023-12-13 20:23:11 347

原创《一书读懂物联网》作者序

“光阴荏苒，日月如梭”，这句话在物联网时代尤为贴切。随着信息技术的快速发展，物联网已成为当今世界上最热门的话题之一，将无数种设备、传感器、网络和应用程序联系在一起，形成一个庞大的网络，给我们的生活带来了前所未有的便利。虽然物联网已经进入了我们的日常生活，但对于大多数人来说，物联网可能仍然是一个相对陌生的概念，因为它牵扯的技术和概念比较庞杂。物联网作为一个超系统，它是什么、它如何运作、它的应用范围有...

2023-12-12 09:33:38 146

原创全栈必备之SQL简明手册

【引子】曾经的少年问我SQL是什么，我一时似乎有千言万语，但又不知从哪说起。作为一名码农工匠，基础的东西也可能需要温故知新，系统梳理，常用常新。从编程语言的视角来看，SQL是一种强大而灵活的语言，具有嵌套特性，允许用户以高效且简洁的方式与数据库进行交互。通过SQL，用户可以轻松地对数据库中的数据进行CRUD等操作，从而满足各种数据处理需求。1. SQL 的基本原理作为一种高级的非过程化编程语言，S...

2023-12-10 20:24:00 130

原创大模型应用设计的10个思考

技术不是万能的，但没有技术却可能是万万不能的，对于大模型可能也是如此。基于大模型的应用设计需要聚焦于所解决的问题，在自然语言处理领域，大模型本身在一定程度上只是将各种NLP任务统一成了sequence 到 sequence 的模型。利用大模型，我们是在解决具体的生产和生活中的问题，产品和技术上的设计仍然不可或缺。那么，如果大模型正在重新构建软件工程的未来，我们是否应该遵循一些基本原则呢？1. 模...

2023-12-03 20:23:33 226

原创解读向量数据库

不论是RAG，还是Agent，几乎每个LLM 驱动的应用程序都可能会用到向量数据库。那么，向量数据库是什么？与传统数据库有何不同？又如何选择向量数据库呢？本文是老码农关于向量数据库的学习笔记。1. 什么是向量数据库？首先，我们需要理解什么是向量？向量是基于不同特征或属性来描述对象的数据表示。每个向量代表一个单独的数据点，例如一个词或一张图片，由描述其许多特性的值的集合组成。这些变量有时被称为“...

2023-11-26 20:23:16 5258 3

原创大模型应用框架之Semantic Kernel

随着大模型应用开发的兴起，各种应用开发框架也蓬勃兴起。对应于大模型的应用方向RAG和Agent，微软分别推出了Semantic Kernel 和 Autogen 两个框架。本文是Semantic Kernel 的一些学习笔记，或许，Semantic Kernel 的成功应用应该算是微软的office copliot 全家桶了。什么是Semantic Kernel？Semantic Kernel是...

2023-11-19 20:23:39 613

原创从隐私悖论到隐私工程

【引子】隐私和安全是计算机领域永恒的主题之一。大模型本身是一种先进的生产力，它在很大程度上能够推进技术的进步和应用范围的拓展。然而，与此同时，大模型的应用也可能带来隐私和安全的挑战。例如，联邦学习与大模型的结合目前还面临着许多挑战，包括安全威胁及防御、隐私威胁与增强、效率问题以及处理非独立同分布（Non-IID）数据等问题。这些问题可能会对用户的隐私造成潜在的威胁。重要的一点是如何利用大模型来“对...

2023-11-12 20:23:22 247

原创大模型应用于数字人

大模型会改变整个软件行业，其中具有代表性的产品之一是数字人，那么，什么是数字人呢？数字人涉及了哪些关键技术呢？大模型对数字人的发展带来哪些影响呢？1. 什么数字人？数字人目前还缺乏一个相对统一的定义，有人把人类的数字孪生体定义为数字人，有人把虚拟世界中具有人类行为的实体定义为数字人，有人将3D人体模型称为数字人，例如，韩国学界对数字人的定义是：用数字化技术，打造具有逼真人类长相、语言、动作姿...

2023-11-05 20:23:33 329

原创 Agent 应用于提示工程

如果Agent模仿了人类在现实世界中的操作方式，那么，能否应用于提示工程即Prompt Engingeering 呢？从LLM到Prompt Engineering大型语言模型(LLM)是一种基于Transformer的模型，已经在一个巨大的语料库或文本数据集上进行了训练，包括了互联网上的大多数网页。在训练期间，需要花费大量的时间(和/或图形处理器)、能量和水(用于冷却) ，梯度下降法被用来优化模...

2023-10-29 20:23:05 530

原创《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计（译者序）...

“言为心声,语为心境”，语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本，然后通过自然语言处理技术对文本进行分析和理解，最终生成相应的响应或执行相应的操作。虽然智能语音技术由来已久，但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注，因为这样的智能音箱带给了人们一种叫作...

2023-10-22 20:23:09 813

原创《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计（译者序）...

“言为心声,语为心境”，语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本，然后通过自然语言处理技术对文本进行分析和理解，最终生成相应的响应或执行相应的操作。虽然智能语音技术由来已久，但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注，因为这样的智能音箱带给了人们一种叫作...

2023-10-22 20:23:09 175

原创《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计（译者序）...

“言为心声,语为心境”，语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本，然后通过自然语言处理技术对文本进行分析和理解，最终生成相应的响应或执行相应的操作。虽然智能语音技术由来已久，但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注，因为这样的智能音箱带给了人们一种叫作...

2023-10-22 20:23:09 143

原创《语音优先》智能语音技术驱动的交互界面设计与语音机器人设计（译者序）...

“言为心声,语为心境”，语言与对话是我们沟通与协作的重要方式。而智能语音技术是一种基于人工智能和自然语言处理技术的语音交互技术。它可以通过语音识别技术将用户的语音指令转换为文本，然后通过自然语言处理技术对文本进行分析和理解，最终生成相应的响应或执行相应的操作。虽然智能语音技术由来已久，但直到亚马逊Echo智能音箱的诞生才再一次引发了业界对智能语音技术的广泛关注，因为这样的智能音箱带给了人们一种叫作...

2023-10-22 20:23:09 117

原创基于大模型（LLM）的Agent 应用开发

目前，业界一般认为基于大模型的应用集中在两个方向上：RAG 和 Agent，无论哪一种应用，设计、实现和优化能够充分利用大模型(LLM)潜力的应用都需要大量的努力和专业知识。随着开发人员开始创建日益复杂的LLM应用程序，开发流程不可避免地变得更加复杂。这种流程的潜在设计空间可能是巨大而复杂的，《如何构建基于大模型的App》一文给出了一种探索中的大模型应用开发基础框架，基本可以适用于RAG 和Age...

2023-10-15 20:24:01 4413 1

原创解读提示工程（Prompt Engineering）

提示工程（Prompt Engineering），也称为上下文提示，是一种通过不更新模型的权重/参数来引导LLM行为朝着特定结果的方法。这是与AI有效交流所需结果的过程。提示工程可以用于各种任务，从回答问题到算术推理乃至各种应用领域，理解提示工程，能够帮助我们了解LLM的限制和能力。为了理解提示工程，先要澄清什么是Prompt。1.什么是PromptPrompt提示是什么呢？Prompt提示是模型...

2023-10-11 22:22:35 2855

原创解读大模型（LLM）的token

当人们谈论大型语言模型的大小时，参数会让我们了解神经网络的结构有多复杂，而token的大小会让我们知道有多少数据用于训练参数。正像陆奇博士所说的那样，大型语言模型为从文本生成到问题回答的各种任务提供了令人印象深刻的能力，不仅彻底改变了自然语言处理(NLP)领域，而且作为基础模型会改变整个软件生态。这些模型的一个经常被忽视的关键点是“token”的作用，即模型处理的各个信息单元。大型语言模型(LLM...

2023-10-06 20:23:53 6325 1

原创解读LangChain

随着OpenAI在2020年发布了开创性的GPT-3，我们见证了LLM的普及度稳步攀升，如今还在逐渐升温发酵。这些强大的人工智能模型为自然语言处理应用带来了新的可能性，使开发人员能够创建更为复杂、类似于人类交互的聊天机器人、问答系统、摘要工具等产品。LangChain作为一个多功能框架应运而生，旨在帮助开发人员充分发挥LLMs在各种应用中的潜力。基于“链式”不同组件的核心概念，LangChain简...

2023-09-28 08:36:29 464

原创如何构建基于大模型的App

ChatGPT 的出现让大模型再一次成为业界的关注热点，然而，并不是每个组织都要去训练及生成大模型的，而且各个组织的技术积累和计算资源也不太允许这样去做。更多的时候，我们还是基于大模型开发业务应用。所谓智能原生（AI Native），往往是指那些没有大模型就无法成立的应用，那是一些新的业务机会和挑战。很多时候，我们还只是Applied AI，即通过AI 尤其是大模型为应用赋能。不论是AI 原...

2023-09-24 20:23:06 380

原创可信而可靠，关于Rust 的学习

最早接触到Rust是在几年前的一次技术大会上，黄东旭说TiKV 是用Rust 语言编写的，引起了我的一些兴趣，但只是保持关注而已。我一直认为每一种编程语言都有着各自的典型应用领域，也有着各自的编程范式，没有最好的编程语言（参见《PHP是最好的编程语言吗？》），但存在最适合当前的问题领域的编程语言。个人认为，所谓全栈工程师，至少要掌握4种编程语言——C/C++，Java， JavaScrip...

2023-09-17 20:23:39 151

原创支持事务的分布式NoSQL——FoundationDB

【引子】周末阅读时光，一篇好的论文（https://cacm.acm.org/magazines/2023/6/273229-foundationdb-a-distributed-key-value-store/fulltext），开阔了眼界，支持事务语义的NoSQL应该放到软件系统架构备选方案之中。FoundationDB是一个开源的事务性键值存储系统，是最早将NoSQL架构的灵活性和可扩展性与...

2023-09-10 20:23:09 444

原创 Qcon2023: 大模型时代的技术人成长（简）

我目前致力于操作系统相关的研发，公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的AI Native 呢？带着这样的疑问我参加了Qcon2023 北京站的大会。与Qcon 2022 北京站不同的是，身份变了，上次是分享者，这次是出品人，出品的专题是——大模型时代的技术人成长。在大模型时代，技术人如何成长呢？划分为3个话题：大模型时代的特点是什么？对个人提出了哪些新的要求...

2023-09-04 21:36:23 302

原创一文读懂互联网的架构本质

【引子】谈到互联网，很多人脑海中会出现各种各样的术语和服务，但是互联网是如何设计并构建的呢？作为一个网络，互联网的架构本质是什么？石头兄弟和我曾经一起译过一本《计算机网络问题与解决方案》的巨著，但真正仔细阅读并从中有所收获的朋友并不多。最近，石头兄弟推荐了另一篇文章https://cacm.acm.org/magazines/2023/2/268956-extracting-the-essent...

2023-08-27 20:23:43 306

原创老码农的运行时漫谈

写程序离不开运行时，但是有很多伙伴却并没有搞清楚运行时到底是什么。运行时的概念之所以容易被混淆，是因为运行时有两层不同的含义：run time 和 runtime，先贤们在翻译的时候可能忽略了中间的空格，导致运行时一词代表了两种含义：运行时期和运行环境/系统。运行时期（Run time）在计算机科学中代表一个程序从开始执行到终止执行的运作时期，与之相对的其他时期包括：设计时期（design tim...

2023-08-20 20:23:14 223

原创穿上App外衣，保持Web灵魂——PWA温故

穿上App的外衣，保持Web的灵魂——PWA早在2015年，设计师弗朗西斯·贝里曼和Google Chrome的工程师亚历克斯·罗素提出“PWA（渐进式网络应用程序）”概念，将网络之长与应用之长相结合，其核心目标就是提升 Web App 的性能，改善 Web App以媲美Native的流畅体验。1. 什么是PWAPWA 不是一个框架或工具集，而是一个概念，是开发人员需要在应用程序中实现的一组功能...

2023-08-13 20:23:17 306

转载与持续架构之父Murat Erder 有约！ | SECon

8月11-12日SECon全球软件工程创新峰会即将在上海龙之梦大酒店盛大开幕，届时将有来自国内外60+一线技术专家、行业精英在SECon全球软件工程创新峰会上，分享他们的最新研究技术，展示他们的优秀成果。无论你是热爱编程的开发者，还是关心软件开发流程的管理者，这个峰会都将为你带来启发和思考。最受人瞩目的开幕式将于8月11日北京时间上午8:50准时开始，届时线上线下同步直播，无法来现场的小伙伴抓紧点...

2023-08-10 12:12:59 153

原创浅析数据工程

目前数字化转型对于市场来说并不是一个新鲜事物，从技术视角来看，尽管大模型的涌现带来人们的更多关注，但人工智能与大数据相关技术仍处于创新阶段，各行业正在寻找和探索价值场景与新兴技术融合的平衡点，希望在新兴技术的加持下能够在激烈的竞争中占据有利位置。数据，数据数据是新一代技术革命下的生产要素，掌握了生产要素与生产要素的加工方式就是掌握了数字经济下的价值密码，这已经是业界的基本共识。企业想要更好地管理数...

2023-08-06 20:23:59 999

原创隐私保护之隐私信息检索

【引子】用户的隐私保护涉及多个方面，用户行为的隐私保护更是一个难点。周末读了一篇论文，https://cacm.acm.org/magazines/2010/4/81501-private-information-retrieval/fulltext，涉及了很多数学上的方法和概念，很是费劲，隐私信息检索会过犹不及么？企业这么做的动力在哪里呢？互联网的普及意味着有大量的在线数据和检索信息不可或缺的资...

2023-07-30 18:52:17 215

原创隐私计算之TEE的双操作系统支撑

在关于隐私计算的系列文字中，《从隐私到隐私计算》一文提到了实现隐私计算的三种主要技术路径，包括：多方安全加密、联邦学习和可信执行环境。其中，在《隐私计算中可信执行环境的一知半解》中，可信执行环境（TEE）也有两种主流的实现方式，即物理隔离TrustZone 和虚拟化隔离。那么，如何实现TrustZone的可信执行环境来支持隐私计算呢？1. 关于TrustZoneTrustZone技术是ARM公司开...

2023-07-23 20:23:36 305

原创老码农的管理拙见

【引子】尽管自己从业了20多年，也曾管理过从几个人到几百人的团队，但个人非常不愿意或者不敢讨论团队管理的问题，因为管理是以结果为导向的，具有后验的特征，而且管理中面对的最大复杂性是人，每个人都是不同的个体，同样的成功经验换了一个环境就可能会失败，因此，有关管理的讨论往往是案例分析，就个案进行讨论，或者会到“人性”、“坐而论道”上来。然而，“大道易得，小术难求”。今年的春季窗口，几个年轻的朋友得...

2023-07-16 20:23:10 190

原创操作系统的可扩展访问控制

访问控制是操作系统安全的基石，当前的操作系统已部署了很多访问控制的模型：Unix和Windows NT多用户安全；SELinux中的类型执行；反恶意软件产品；Apple OS X，Apple iOS和Google Android中的应用沙盒；以及面向应用程序的系统如FreeBSD中的Capsicum等。这种多样性是一种惊人的结果。本质是本地化安全，将操作系统安全模型适应于本地或产品特定要求。这一转...

2023-07-09 20:23:58 234

原创全栈必备：系统架构设计的10个思维实验

软件系统的架构设计经验很难获得。即便工作多年，能够完成系统架构设计的机会也很有限。如何提高自己的系统架构设计能力呢？不断实践当然不可或缺，思维实验或许也是一种有效的方式。一般地，在深入架构设计之前，充分理解问题及其需求是至关重要的。花点时间澄清任何模棱两可的地方，并确保自己对系统的范围和目标有一个清晰的理解。对问题的澄清不要犹豫，用自己的话重申问题，以确认你的理解。在确定解决方案之前，采取分步骤的...

2023-07-02 20:23:41 235

原创论文学习笔记：增强学习应用于OS调度

【引子】周末，读了一篇同事推荐的论文《STUN: Reinforcement-Learning-Based Optimization of Kernel Scheduler Parameters for Static Workload Performance》，很有启发，遂加入个人思考编译成文。从小型物联网设备到大型服务器，Linux在各个领域中都得到了广泛应用。计算吞吐量对于使用数百万个线程来模...

2023-06-29 21:21:42 403

原创 LLM的工程实践思考

陆奇博士的主题演讲《新范式新时代新机会》非常震撼人心。我远程参加了深圳站和北京站两场演讲，深受感触。虽然了解大模型的机制和原理以了解新的范式非常重要，但是“行胜于言”，基于大模型的众多应用都需要工程技术才能落地。然而，工程技术的重要性往往被忽视，认为只要有资源就可以实现。实际上，这可能是对技术本身缺少了敬畏。那么，LLM在工程实践中会涉及哪些问题和挑战呢？1. 从机器学习实践到大模型的工程实践...

2023-06-24 20:23:02 2623 5

原创神经网络中的损失函数

在《神经网络中常见的激活函数》一文中对激活函数进行了回顾，下图是激活函数的一个子集——而在神经网络领域中的另一类重要的函数就是损失函数，那么，什么是损失函数呢？损失函数是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数，用于衡量预测值与实际值的偏离程度。在机器学习中，损失函数是代价函数的一部分，而代价函数是目标函数的一种类型。在应用中，损失函数通常作为学习准...

2023-06-18 20:23:30 2117

原创操作系统性能提升之内核锁优化

性能为王，系统的性能提升是每一个工程师的追求。目前，性能优化主要集中在消除系统软件堆栈中的低效率上或绕过高开销的系统操作。例如，内核旁路通过在用户空间中移动多个操作来实现这个目标，还有就是为某些类别的应用程序重构底层操作系统.在许多领域中，专有化似乎是追求更好性能的答案，集中在应用程序和内核，甚至是在不同的内核子系统之间。特别地，专有化可以构建应用程序向系统请求某些功能的上下文。虽然，应用程序专有...

2023-06-11 22:03:49 798

原创关于操作系统调度器的三篇论文

【引子】没有忘记，目前从事的是DingOS 操作系统相关工作，没有因为LLM 而迷失。LLM 会成为基础设施，LLM 会为操作系统赋能，但是操作系统的价值是客观存在的，除非，计算机体系结构发生了翻天覆地的变化。在任何多路复用资源的系统中，计算在哪里运行以及何时运行的调度问题都可能是最基本的问题。然而，就像计算机中许多其他重要问题一样（例如数据库中的查询优化），调度器的研究像钟摆一样，时而活跃，时而...

2023-06-08 20:23:20 1288

原创解读大模型的微调

在快速发展的人工智能领域中，有效地利用大型语言模型（LLM）变得越来越重要。然而，有许多不同的方式可以使用大型语言模型，这可能会让我们感到困惑。实际上，可以使用预训练的大型语言模型进行新任务的上下文学习并进行微调。那么，什么是上下文学习？又如何对大模型进行微调呢？1. 上下文学习与索引自从GPT-2和GPT-3出现以来，可以发现在预训练的通用文本语料库上的生成式大型语言模型（LLM）具备了上下文学...

2023-06-07 08:18:50 1933

萃智（TRIZ）文摘

计算机世界1000期特稿——信息革命的流金岁月

Internet Email协议开发指南

空空如也