高桐@BILL-CSDN博客

原创 2.7 提示词调优编码实战（二）

本文介绍了如何优化提示词模板来提升大模型输出质量。通过格式化任务描述和输出约束，使模型能更准确地识别用户对流量套餐的需求。示例代码展示了使用Ollama API调用llama3.2模型的实现，包括服务检查、文本生成和流式输出功能。优化后的模板明确定义了JSON输出的字段类型、取值范围和排序规则，要求模型只输出用户提及的字段。虽然基础模型输出仍有改进空间，但通过微调等技术可进一步提升小模型能力。

2025-08-24 21:58:07 5

原创 2.6 提示词调优编码实战（一）

本文通过开发运营商"流量套餐智慧客服"系统，演示了提示词调优的重要性。首先使用简单提示词时，模型仅输出无关的通用套餐信息。随后通过构建提示词模板，包含任务描述、用户输入和输出格式要求，使模型能够识别用户对流量、价格等属性的需求，并以JSON格式输出。实验表明，恰当的提示词设计能显著提升模型输出的准确性和实用性，但当前结果仍不能满足实际客服需求，需要进一步优化提示词工程。

2025-08-24 20:36:46 214

本文介绍了使用Python的requests库访问Ollama服务的相关技术要点。主要内容包括：1）通过requests发送GET请求检查模型可用性；2）关键参数说明：prompt提示词、temperature控制生成随机性、max_tokens限制输出长度；3）流式与非流式输出的区别及实现方式；4）多轮对话的实现方法，通过messages数组维护对话历史实现上下文连贯。文章详细解析了各参数对模型输出的影响，并提供了具体的代码示例，为使用Ollama服务进行文本生成和多轮对话开发提供了实用指导。

2025-08-24 10:24:29 120

原创 1.10 本地模型调用编码实战（一）

本文介绍了一个基于Python的本地Llama3.2模型交互工具包，通过Ollama框架实现模型调用。主要内容包括：1) 开发环境配置（MacBook M1/8GB内存）；2) 核心功能实现：服务状态检查、文本生成（支持流式输出）和多轮对话；3) 完整代码示例及三种交互方式演示。该工具包可作为智能体开发的基础框架，实现了从服务连接到功能调用的全流程，支持参数调节和对话历史记录功能。

2025-08-23 11:10:08 15

原创 1.9 Ollama加载模型原理

Ollama简化了本地大语言模型的部署流程，采用客户端-服务器架构自动完成模型加载与交互。其工作流程包括：1）解析指令并检查本地缓存，必要时从远程仓库下载模型；2）解析Modelfile获取模型配置和量化信息；3）根据硬件选择最优推理后端；4）启动后台服务并暴露API端口。通过将模型权重转化为可调用的服务，Ollama实现了命令行直接对话的功能，降低了LLM使用门槛。

2025-08-21 18:52:01 17

原创 3.2 结构化输出简介

本文探讨了大模型连接外部世界的核心技术——结构化输出，剖析其从插件系统到行业标准的发展历程。文章以OpenAI产品演进为主线，依次分析Plugins的封闭生态局限、Function Calling的标准化突破、JSON Mode的格式强制能力，以及Structured Outputs对复杂业务场景的支持。最终指出行业正从单模型规范转向跨平台协议（如MCP），使结构化输出成为大模型与外部系统交互的通用语言。全文揭示结构化输出如何解决自然语言与机器指令的"翻译"难题，成为大模型突破信息茧房、

2025-08-18 22:42:53 161

原创 3.1 结构化输出（大模型的封闭与开放)

摘要：本文探讨大模型突破静态知识库局限的方法，通过连接外部世界实现智能化升级。系统介绍了6种连接方式：1）API接口实现实时数据交互；2）数据库直连获取结构化知识；3）工具调用扩展功能边界；4）网页爬虫采集公开信息；5）物联网硬件实现物理世界感知；6）人工反馈优化系统表现。这些技术使大模型具备实时信息获取、专业任务执行、私有知识整合等能力，从理论型AI转变为具备实际应用价值的行动型AI。文章揭示了AI技术向开放化、专业化、实用化发展的新趋势。

2025-08-18 20:57:42 410

原创 2.5 提示词安全

摘要：文章介绍了"奶奶漏洞"这一针对ChatGPT的提示词攻击手段，通过情感操纵（如让AI扮演奶奶念Windows序列号）突破AI安全限制。分析了四种提示词攻击类型：角色扮演、分步诱导、情感操纵和编码混淆，以及三种防御措施：注入防御、输出防御和有害提示识别模型。文章揭示了大型语言模型面临的安全风险，以及如何通过技术手段防范恶意提示词攻击，为AI安全防护提供了实用参考。（149字）

2025-07-06 22:19:30 636

原创 2.4 提示词优化

我们在使用大模型的时候，同一任务使用不同表述的提示词，可能得到差异巨大的结果，因为模型的性能高度依赖输入提示词的质量。我们可以通过提示词优化来更高效地获取理想输出。

2025-07-06 21:39:17 715

原创 1.18 LA Kernel日志调试

本文介绍了Linux内核日志级别的分类与配置方法。内核日志分为8个等级（0-7），从EMERG到DEBUG。通过/proc/sys/kernel/printk可查看当前配置的4个日志级别参数。文章详细说明了如何通过dmesg命令、启动参数和运行时修改来调整日志级别，并特别针对QNX和Android系统给出了具体的日志配置方案，包括修改配置文件、adb命令和编译时参数设置等方法。这些技术对于系统调试和日志管理具有实用参考价值。

2025-05-25 14:26:25 129

原创 2.3 提示词工程（三）

本文探讨了如何通过使用外部工具和系统化测试来优化模型性能。首先，介绍了利用基于嵌入的搜索技术实现高效知识检索的方法，通过将相关信息动态添加到模型输入中，提升回应的准确性和时效性。其次，讨论了通过代码执行进行精确计算或调用外部API，以解决语言模型在复杂计算中的局限性。此外，还介绍了如何使模型能够访问特定功能，通过生成符合描述的函数参数并执行函数调用。在系统化测试方面，强调了设计全方位评估程序的重要性，以确保更改对总体性能产生积极影响，并提出了以标准答案为基准评估模型输出的方法。

2025-05-20 11:21:42 1023

原创 2.2 提示词工程（二）

就像学生在考试中借助笔记能够帮助其取得更好的成绩一样，为这类模型提供参考文本也可减少其制造虚假信息的情况。如果输入信息中已经包含了相关知识，就可以直接要求模型在回答问题时引用所提供的文件中的段落。值得注意的是，输出中的引用可以通过在所提供的文件中匹配字符串来进行验证。由于所有模型都受到上下文窗口大小的限制，我们需要一种方法来动态地查询与提出的问题相关的信息。如果我们能向模型提供与提问内容相关的可靠信息，我们就可以指导模型利用这些信息来构建答案。（嵌入式技术）来实现有效的知识检索。

2025-05-20 11:21:27 821

原创 2.1 提示词工程（一）

随着大语言模型（LLM）和多模态模型的普及，AI已从简单的分类和预测工具发展为能够生成复杂内容的强大工具。然而，这些模型的“黑箱”特性使得其内部机制难以精确控制，因此需要通过提示词工程来引导模型输出符合需求的结果。提示词工程（Prompt Engineering）是生成式AI模型中的关键技术，通过优化输入提示，引导模型生成更准确和相关的输出。这一技术不仅提升了AI产品的竞争力，还催生了“提示词工程师”这一新兴职业，成为企业优化AI交互体验的重要手段。

2025-05-11 14:57:10 937

原创 1.4 大模型应用产品与技术架构

大模型应用的产品架构随着技术发展和场景需求不断演进，在演进的过程中人们提出了不同的应用产品架构和技术架构。

2025-04-26 22:50:19 644

原创 1.3 AI常见术语梳理

神经网络是一种受生物神经元启发的计算模型，由互连的节点（神经元）组成，通过调整连接权重学习数据中的复杂模式。其核心思想是分层抽象：底层处理原始数据（如像素），高层提取高级特征（如物体轮廓）。批量大小（Batch Size）：单次训练样本数（影响内存与稳定性）。可以用减少幻觉，提升事实准确性。精确率（Precision）与召回率（Recall）的调和平均。隐藏层：通过权重矩阵计算特征（如全连接层、卷积层）。将用户流量随机分为A组（旧模型）和B组（新模型）。输出层：生成预测结果（如分类概率、生成文本）。

2025-04-20 14:49:26 715

原创 1.2 大模型技术架构

模型名称架构类型参数量级核心创新点文心一言（ERNIE）编码器-解码器混合架构千亿级知识增强、多模态统一建模通义千问（Qwen）纯解码器Transformer720B长上下文支持、多模态扩展混元（Hunyuan）混合专家（MoE）万亿级稀疏激活、多任务联合训练云雀（Lark）纯解码器优化架构未公开轻量化部署、端云协同混合专家+稀疏注意力16B~146B高效推理、数学与代码优化。

2025-04-20 14:15:27 933

原创 1.1 初识AI

AI已不再是可选项，而是必备基本技能。它是每个从项目，到产品，到研发再到测试质量交付，甚至各行各业的各个环节的基本技能。AI技术正在深刻重塑行业格局和每一个工程师，每一个人的工作模式。作为一个从业操作系统超过10年的工程师来说，无论产品形态是手机，IOT，汽车，AI已无处不在。行业领域 AI影响维度典型案例软件工程 ★★★★★★★★★☆ (9/10) GitHub Copilot、AutoML、AI自动化测试。

2025-04-13 16:51:57 658

原创【系统稳定性】1.13 解析gcore

gcore是什么？高通骁龙8295 (QCOM 8295) 芯片在QNX操作系统下产生的gcore文件，是程序崩溃时系统生成的内存转储文件，包含了程序崩溃时的内存状态、寄存器信息、调用栈等重要信息。gcore文件通常位于/var/log目录下。

2025-03-23 14:39:51 180

原创【系统稳定性】1.16 GPU（二）

QCOM Adreno GPU 通过硬件和软件的结合，为这些 API 提供底层支持，从而实现高效的图形渲染和计算任务。简单来说，开发者可以通过这些API，在QCOM GPU上实现图形相关的开发。以OpenGL ES为例，开发者可以通过OpenGL ES来利用Adreno GPU 提供了专用的硬件单元（如顶点着色器、片段着色器、纹理单元）来执行相关的的渲染任务。高通的 GPU 驱动程序实现了 OpenGL ES 的 API 接口，将 OpenGL ES 的调用映射到 Adreno GPU 的硬件指令。

2025-03-23 14:00:22 208

原创 1.8【模型部署】Windows本地部署DeepSeek模型 --- Ollama篇（下）

大型语言模型（如 LLaMA、GPT 等）通常包含数十亿甚至数百亿个参数，导致模型文件非常大。为了便于管理和传输，模型文件会被分割成多个较小的分片。每个分片文件包含模型的一部分参数或权重，加载时需要将所有分片合并才能完整地加载模型。无网络连接，直接通过Ollama本地已经本地已经下载好的的Deepseek模型。

2025-03-09 22:51:01 1290

原创 1.7【模型部署】 Windows本地部署DeepSeek模型 --- Ollama篇（上）

Ollama 是一个本地部署大模型的开源项目，旨在简化大型语言模型（LLMs）的本地部署和使用。它提供了一个简单易用的框架，让用户能够在自己的设备上运行和微调各种语言模型，而无需依赖云服务或复杂的配置。Ollama 的目标是让开发者、研究人员和爱好者能够更轻松地探索和应用大型语言模型。

2025-03-09 19:10:35 1060

原创【系统稳定性】1.15 GPU（一）

Vertex（顶点），Texture（纹理），ALU（算数逻辑运算）分别代表了GPU处理图形数据的不同阶段和功能模块。在3D图形渲染中，顶点是构成3D模型的基本单元。顶点是图形学中的一个基本概念，指的是3D空间中的一个点，通常用坐标（x, y, z）表示。GPU中包含大量的ALU，能够同时处理多个数据（如顶点、像素），实现高性能并行计算。运行在GPU上的程序，负责计算每个像素的最终颜色，通常会结合纹理数据和光照信息。每个ALU可以执行基本的算术操作（如加、减、乘、除）和逻辑操作（如与、或、非）。

2025-03-09 14:08:46 187

原创【系统稳定性】1.17 SSR

Subsystem Restart即子系统重启，这是一种回复策略或子系统兜底机制，旨在确保系统在某个子系统出现故障时能够自动恢复，而无需重启整个设备。SSR通过监控子系统的健康状态，并在检测到故障时触发重启，以恢复其功能。

2025-03-09 13:48:01 274

原创【显示】3.1 Android 从Activity到Display链路概括

Activity→→ 创建视图树（View Hierarchy）。Window→ 管理DecorView和Surface。→ 触发MeasureLayoutDraw流程。Surface→ 作为绘图表面，接收Canvas的绘制内容。→ 合成多个Surface的内容。→ 将合成后的帧传递给显示控制器。Display→ 最终上屏显示。

2025-03-04 08:20:06 261

原创【系统稳定性】1.12 QVM稳定性问题分析（二）

如前面提到的，qmv中la异常，就是linux kernel及其android os相关的异常引发的系统异常，该异常通常不会导致qnx或域控整机重启。我们可以通过分析，la_gvm.txt，或slog中过滤vmm_service或qvm，查看qvm状态信息。包括文件系统损坏，如存储设备上的文件系统（如ext4、F2FS）损坏，导致内核无法读取或写入数据，以及分区挂只读等。这种场景下，外设驱动未正确处理硬件状态，导致任务卡死。驱动或内核异常，如内存踩踏等导致的kernel panic，而导致qvm重启。

2025-03-02 14:08:46 146

原创【系统稳定性】1.11 QVM稳定性问题分析（一）

在QVM（Quantum Virtual Machine）作为HOST QNX的Guest，同样会遇到重启、Watchdog（看门狗）等稳定性问题。qvm进程异常qmv中la异常qvm进程异常就很好理解了，我们就把他作为一个qnx内核上运行的一个native服务来看待，那么他具备所有进程所具备的基本属性。qvm进程异常包含进程本身设计问题，如锁同步的问题，依赖问题，资源调度问题等。qmv中la异常，就是linux kernel及其android os相关的异常引发的系统异常。

2025-03-01 22:05:43 325

原创【系统稳定性】1.10 QNX Crash之Ramdump的分析（二）

系统正常可用，但串口无输出，且无法输入，可能是串口阻塞，串口无序频繁打印。当然除了串口阻塞的情况，也处存在包括前面提到的例如当前已经执行令了某种指令，或者本身也就没有打印，可以Ctrl+C强制退出指令尝试下。调试端口可用，但调试可用，执行卡顿。串口不响应或不能输入输出也有一种可能，例如当前已经执行令了某种指令，或者本身也就没有打印，可以Ctrl+C强制退出指令尝试下。或者另一种可能，系统资源跑飞，如cpu拉爆了，串口指令响应比较慢，可以wait a minite，and check。

2025-03-01 20:36:56 200

原创 1.6 【模型部署】本地部署DeepSeek模型 --- LM Studio篇（下）

选择不同的runtime，如下我通过选择了CPU llama.cpp (Windows)解决该问题，可以根据自己的硬件配置来选择不同的runtime。

2025-02-23 22:47:47 1803

原创 1.5【模型部署】本地部署DeepSeek模型 --- LM Studio篇（上）

LM Studio 是一款专为本地运行大型语言模型（LLMs）设计的工具，允许用户在个人电脑上轻松加载、管理和运行各种开源语言模型（如 LLaMA、Falcon、GPT-J 等）。通过LM Studio我们可以实现模型的完全离线运行，所有模型和数据都在本地处理，无需联网，保护隐私。它支持多种模型格式，包括兼容 Hugging Face 的模型格式（如 .bin、.ggml 等），方便用户导入和使用各种开源模型。

2025-02-23 22:41:53 1468

原创【系统性能】2.1 整机卡顿初探

通常为底软驱动异常，资源严重紧张，或系统级服务工作状态不正常导致。此类问。

2025-02-03 13:18:46 253

原创【系统稳定性】1.14 冻屏

通过QNX查看是否发生gcore，及la ramdump(adb/bgm(obd)/redmoon/acu连接)这部分排查framework部分，时间的传递链路是否正常，比如是否有view消费等。替换mtouch驱动库(慎用，替换后会reset Touch芯片，会导致现象消失)以及排查/var/log/中是否io-pkt-v4-hc的反复coredump。检查adb链接，qnx连接(串口，acu，gbg，obd，redmoon等)查看/var/log/查看是否正在dump gcore;

2025-02-03 13:11:00 323

原创警告：Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

由于tensorflow默认分布是在没有CPU扩展的情况下构建的，例如SSE4.1，SSE4.2，AVX，AVX2，FMA等。高级矢量扩展（AVX）是英特尔在2008年3月提出的英特尔和AMD微处理器的x86指令集体系结构的扩展，英特尔首先通过Sandy Bridge处理器在2011年第一季度推出，随后由AMD推出Bulldozer处理器在2011年第三季度.AVX提供了新功能，新指令和新编码方案。特别是，AVX引入了融合乘法累加（FMA）操作，加速了线性代数计算，即点积，矩阵乘法，卷积等。

2025-02-01 11:27:55 419

原创 Build and install error messages

Exception:...Exception:...Exception:...line 4, in.........Exception:...line 4, in...

2025-02-01 11:27:12 984

原创 tensorflow_self_check.py

#"""import impimport systry:else:print("""WARNING!try:print("""try:print("""try:print("""try:print("""try:print("""try:print()else:print("""print("""main()

2025-02-01 11:26:31 881

原创 Common installation problems

We are relying on Stack Overflow to document TensorFlow installation problems and their remedies. The following table contains links to Stack Overflow answers for some common installation problems. If you encounter an error message or other installation

2025-02-01 11:26:04 388

原创 error: RPC failed； curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 10054

Descriptions：Solutions：

2025-02-01 11:24:17 839

原创 1.For New TFLite Beginner

flowers]()summarize.Update pipgit clone。

2025-02-01 11:23:48 847

原创 fatal: unable to access ‘https://github.com/tensorflow/models/‘: OpenSSL SSL_read: SSL_ERROR_SYSCALL

Solutions：

2025-02-01 11:22:14 152

原创【环境搭建】1.2 构建（一）

代码检出以后，通过执行下面的指令来安装其他相关的构建依赖项。获取在 Linux 上构建所需的所有依赖项，以及所有特定于 Android 的依赖项（我们需要一些常规 Linux 依赖项，因为 Android 构建包含一堆 Linux 工具和实用程序）。

2025-02-01 03:00:00 1245

原创【环境搭建】1.1源码下载与同步

当前的开发背景是基于Google的开源Chromium，来开发Android设备的浏览器方案。一，系统要求大多数开发都是在 Ubuntu 上完成的，所以建议最好是在Ubuntu上完成开发环境的搭建。

这个小案例是主要用来演示一下如何点击一个图片按钮，对缩略图进行缩放操作。

2014-07-07

pageowner 解析工具

该工具组合可以对pageowner进行不同维度的解析，包括下面3各方面： 1.通过关键函数对pageowner进行解析、统计，最终以进程级展示进程的cma内存使用情况，并通过占用size自动排序。 2.该工具可用于分拆pageowner信息，并以进程和线程进行分别拆分，用于更细力度的pageowner拆分。 3.该工具用于解析整个pageowner中各个进程的内存使用情况解析工具的开发是为了在我们拆分内存布局的时候能够提高效率，不容易出错，达到事半功倍的效果。在使用过程中，遇到任何问题，都可以免费提供支持。

2022-05-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

android工程师面试内部题

Baidu_map(百度地图)Android平台开发指南文档

Fragment与Activity使用Bundle传递数据

android电子商城（客户端+服务器）

app之间交互（ComponentName）

Fragment与Activity使用Handler进行交互

收发彩信，自动打开数据连接

Fragment与Activity使用接口进行交互

Android中app之间的交互

实现TextView自由复制

Asp电子商务网站

毕业设计-( ASP精品课程网站

毕业设计-VC职工工资管理系统

版本控制器git-1.9.4（msysgit Windows版）

Android的一个仿酷狗播放器的应用程序源码

微博客户端源代码

andricoFacebook客户端

p2p终结者局域网软件

android手机USB驱动

视图缩放案例

pageowner 解析工具

linux_kernel_config 中文手册(2.6.28)

jdk-11.0.14_linux-x64_bin.deb

opengrok-1.7.30.tar.gz

busybox-1.35.0.tar.bz2

syslinux-6.03.tar.xz

高度精简LinuxOS

车载SOA软件架构技术规范

ardupilot-master.zip开源固件源码

MP Mission Planner 飞控地面控制站

SELinux4AndroidO

recovery下edify介绍

apktool+smali2java

recovery_l10n

helloworld.zip

Android4.3系统内置音乐播放器

解决彩信gif格式图附件不能正常播放

解决Android4.3彩信幻灯片中gif格式图片不能正常播放

SmartTools

模仿Android4.3版本短信设置功能

空空如也