Encarta1993-CSDN博客

原创【开源项目】ai-good-for-nothing

ai-good-for-nothing 是一个 AGI 时代必不可少的高级 AI 废物，能流畅地回答你提出的所有问题，毫无漏洞，也不存在任何幻觉，且基本不消耗 GPU，部署成本低廉，任何低配的笔记本都可以运行。

2025-05-24 12:27:33 182

当然不是 OKR 出来的，也不是 KPI 出来的，更不是 996 出来的，而是需要有“敢于领先、勇于领先”的决心孕育而出的。擅长插入广告的 APP 工厂（广告广的也不是真正需要的东西），专心研究网贷的大厂（贷款也不是为了真的让人应急），数钱到手软的游戏制造厂（黑猴也不会在它手里诞生）等肯定就没想过要技术领先。（注：以下的描述是 23 年初偶然看到的，保存下来只是觉得特别符合自己的全栈幻想，当时可不信有人会这么干，作为一个 V2 时代的喷子，这次也是被 V3/R1 打脸了，这种事希望以后多来几次。

2025-04-30 00:21:20 979

原创【DEBUG】batch response: Git LFS is not enabled on this GitLab server, contact your admin.

使用 Git LFS 时候如果提示batch response: Git LFS is not enabled on this GitLab server, contact your admin.表示账号不支持 LFS，可以取开通，如果开通不了则需要取消 git 的跟踪

2025-04-14 16:28:41 365

原创【语音识别】vLLM 部署 Whisper 语音识别模型指南

使用 vLLM 部署 openai whisper

2025-04-10 15:06:09 5123

原创【DEBUG】ValueError: Model architectures [] failed to be inspected.

当部署大模型时候遇到如下报错ValueError: Model architectures [''] failed to be inspected. Please check the logs for more details.比如：ValueError: Model architectures ['Qwen2ForCausalLM'] failed to be inspected. Please check the logs for more details.

2025-04-10 14:44:32 3031 3

原创【Python】Linux 升级 Python 版本（源码安装）

升级Python可能影响依赖旧版本的程序，建议在虚拟环境中测试。通过这些步骤，你可以在Linux上成功升级Python版本。如果需要将新版本设为默认，可以使用。

2025-03-13 11:23:58 1714

原创【数据库】Redis 介绍及安装

Redis(Remote Dictionary Server)是一个开源的、基于内存的数据结构存储系统,它支持多种数据结构,如字符串(String)、列表(List)、集合(Set)、有序集合(Sorted Set)、散列(Hash)等。Redis不仅可以用作数据库、缓存和消息代理,还可以通过复制、持久化、高可用性和分区提供强大的数据保障。Redis以其极高的性能而著称,能够支持每秒数十万次的读写操作。这使得Redis成为处理高并发请求的理想选择,尤其是在需要快速响应的场景中,如缓存、会话管理、排行榜等。

2024-08-25 23:20:01 654

原创【数据挖掘】关系网络可视化

Pyvis 是一个 Python 库，用于创建和可视化网络图。它基于 Vis.js 库，可以生成交互式的 HTML 文件，让用户在网页上直观地查看和操作网络图。以下是 Pyvis 的主要功能和特点：1. 创建和可视化网络图：Pyvis 允许用户创建节点和边，并将其可视化。网络图可以是有向图或无向图。2. 集成 NetworkX：Pyvis 与 NetworkX 集成，可以直接从 NetworkX 图对象生成 Pyvis 图对象，方便用户将已有的 NetworkX 图转换为交互式的可视化图。

2024-07-24 16:28:22 1502

原创【数据挖掘】词云分析

Python 中的 WordCloud 库WordCloud 是一个 Python 库，用于生成词云图（Word Cloud），也称为文字云。词云图是可视化文本数据的一种方法，通过将文本中的单词以不同大小和颜色展示，以便更直观地显示出文本中单词的频率和重要性。

2024-07-23 20:35:10 3066

原创【数据挖掘系列】

1. 小说人物关系挖掘。

2024-07-23 12:09:41 203

原创【Python】多语言识别库 langid

langid 是一个强大的语言识别库，除了基本的语言检测功能外，它还具有以下几个重要功能和特点：

2024-07-08 15:30:45 1529 1

原创【从零开始认识AI】梯度下降法

梯度下降法（Gradient Descent）是一种用于优化函数的迭代算法，广泛应用于机器学习和深度学习中，用来最小化一个目标函数。该目标函数通常代表模型误差或损失。基本思想是从一个初始点出发，通过不断沿着目标函数的负梯度方向更新参数，逐步逼近函数的局部最小值（或者全局最小值）。梯度是目标函数相对于参数的导数，因此，负梯度方向是函数值下降最快的方向。具体步骤如下：1. **初始化参数**：随机选择模型初始参数 \( \theta_0 \)。

2024-06-24 18:06:17 886

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第十一周) - 自然语言处理扩展研究

语言锚定强调的是将抽象的语言信息与具体、可感知的现实世界信息相结合，从而让机器能够更好地理解和生成语言。偏见和歧视(Bias and Discrimination)，NLP模型可能会在种族、性别、宗教等方面表现出偏见，这通常源于训练数据中的不平衡和偏见。语言锚定涉及将语言单元（如词汇、短语、句子）与外部世界的物理实体和感知数据（如图像、视频、声音等）进行关联，实现基于真实世界情境的语言理解。多语言知识库和知识图谱，构建和使用多语言知识库，进行跨语言的知识推理和问答。

2024-06-15 11:30:29 1330

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第十周) - 自然语言处理应用

文本摘要(Text Summarization)是自然语言处理中的一个重要任务，旨在自动生成简洁明了的摘要，从而概括出原始文本的主要内容。文本摘要技术主要分为两大类：抽取式摘要(Extractive Summarization)和生成式摘要(Abstractive Summarization)。抽取式摘要通过选择和提取原文中的关键句子或段落生成摘要，而不改变原文的文字顺序和表述方式。词频统计(Term Frequency, TF)：通过统计词频来判断句子的权重。

2024-06-15 11:29:48 1111

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第九周) - 可解释性

这时，我们可以看到，例如“收入”对预测结果的正面影响最大，“年龄”对预测结果的负面影响最大等信息，从而更好地理解模型在这个特定示例中的决策依据。在图像分类任务中，如果大部分图像数据集中包含的某个类别背景一致（例如，猫的照片总是在室内），模型可能会将背景与类别关联起来，导致在不同背景下的图像分类效果不佳。在机器学习和自然语言处理中，标注伪影(Annotation Artifacts)指的是在数据标注过程中引入的非预期或有偏的特征，这些特征在训练模型时可能导致模型学到了不应有的模式或偏差。

2024-06-15 11:28:50 1023

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第八周) - 现代大语言模型

例如，在文本生成任务中，如果有一部分输入是[A][B]，随后再出现一个[A]，模型通过这两个头的协同工作，很有可能会预测出下一个标记是[B]，因为它识别到这种模式并进行了有效的复制和传播。GPT-3虽然在各大NLP任务以及文本生成的能力上惊艳，但是仍然还是会生成一些带有偏见的，不真实的，有害的造成负面社会影响的信息，而且并不按人类喜欢的表达方式去说话。这种延续观察到的模式的能力是语言模型生成高质量文本的基础，尤其是在上下文学习中，模型通过提供的示例来掌握任务，并生成符合这些示例模式的输出。

2024-06-15 11:23:08 1381

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第七周) - 结构化预测

常见的应用包括词性标注(POS tagging)、命名实体识别(NER)、分块(Chunking)、语义角色标注(Semantic Role Labeling)、句法解析(Syntactic Parsing)等。在介绍大语言模型之前，先把自然语言处理中遗漏的结构化预测补充一下，因为大模型实打实地最先干掉的行业便是自然语言处理，虽然网传各个最容易被大模型替代的行业里从来没有自然语言处理，但现实是有了大模型后，之前的所有自然语言处理技术都显得不那么有价值了。因此，合理的建模方法通常需要考虑元素之间的依赖关系。

2024-06-08 12:46:26 1497

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第六周) - 预训练模型

在预训练语言模型出现之前，统计语言模型（如N-gram模型）是主流方法。这些模型利用统计方法来预测文本中的下一个词，但它们对长距离依赖和上下文理解能力有限。2013年，Google提出的Word2Vec模型利用神经网络来学习词的分布式表示（词向量），使得相似词在向量空间中彼此接近。这是预训练词嵌入技术的开端。斯坦福大学提出的GloVe(Global Vectors for Word Representation)模型通过结合全局词共现统计信息来生成词向量，进一步提升了词表示的质量。

2024-06-08 12:43:36 1070

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第五周) - Transformer

在语言建模中，注意力(attention)是一个关键机制，用于在给定上下文中访问相关信息以进行预测。注意力机制允许模型根据输入上下文中的重要信息来加权关注不同的部分，并根据其重要性来决定对不同部分的关注程度。例如，对于一个给定的输入句子，语言模型可以使用注意力机制来确定在生成下一个单词时应该关注句子中的哪些部分。当模型预测下一个单词时，它可以根据输入句子中不同位置的单词的重要性来调整注意力权重。这意味着模型可以更有针对性地关注与当前预测相关的上下文信息，而不是简单地平均考虑整个句子。

2024-06-02 16:21:14 1323

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第四周) - 语言建模

如果我们想要预测句子中的下一个词，我们可以使用前面的一个词作为上下文，并计算每个可能的下一个词的概率。该模型基于这样一种假设，第N个词的出现只与前面N-1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。这类模型基于统计方法，利用大量文本数据学习语言的统计规律，进而预测未知文本的概率，或者为给定的文本序列生成最可能的后续词汇。准确率作为语言模型的评估指标没有太多意义，语言是开放的序列预测问题，给定前面的文本，下一个词的可能性是非常多的，因此准确率值会非常低。

2024-06-02 16:13:18 1316

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第三周) - 词嵌入

FastText引入了子词级别的信息，将单词表示为子词的集合，并通过平均或叠加子词的向量来得到单词的表示。而动态词向量模型（如ELMo、BERT、GPT系列）则通过考虑词的上下文信息，提供了更为丰富和灵活的词表示，尤其擅长于捕捉语言的细微差别和复杂语境，但计算成本较高。它们利用单词在文档中的频率和全局语料库的统计信息，计算单词之间的相似性，并将单词表示为稠密向量。通过将单词表示为连续的向量，词嵌入克服了传统的离散表示(如One-Hot)所带来的维度灾难问题，同时也捕捉到了单词之间的语义相似性和关联性。

2024-05-25 11:49:29 499

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第二周) - 多类别分类和神经网络

分类是一个预测建模问题，它涉及到在给定输入的情况下输出类标签。通常分类任务是从两个或多个标签中预测一个标签，在这中情况下，类是互斥的，这意味着分类任务假定输入只属于一个类。这就是多类别分类问题（Multiclass Classification），多分类任务只有一个类别是1，其他都是0。在多类别分类中，“one vs all” 或 “one vs rest”（一对其余）是一种常用的策略，用于将多个类别的分类问题转化为多个二分类问题。在这种策略中，每个类别都被视为一个正类别，而其他所有类别被视为一个统一的负类

2024-05-20 00:29:16 879

原创德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第一周) - 自然语言处理介绍和线性分类

自然语言处理的目标是什么能够解决需要深入理解（deep understanding）文本的问题。能够构建与我们交流的系统：对话系统（dialogue system）、机器翻译（machine translation）、摘要（summarization）等。能够构建从文本中抽取信息（extract information）并回答问题（answer question）的系统。标准自然语言处理流程（pipeline）获取原始文本（text）。

2024-05-12 18:02:19 1251

原创【Docker】Docker 中不能使用 nvidia-smi

docker 中执行 nvidia-smi 后报错：Failed to initialize NVML: Unknown Error

2024-04-23 15:40:45 4367 3

原创【Linux】Supervisor 基础

Supervisor已在Linux上成功启动，并开始管理指定的进程。你可以使用Supervisor命令行工具（supervisorctl）来管理和监视进程。

2024-04-08 14:53:08 733 1

原创【Python】RocketMQ 基础使用

RocketMQ是一个开源的分布式消息传递系统，最初由阿里巴巴集团开发并于2012年开源。它旨在解决高可靠性、高吞吐量、低延迟和可伸缩性等大规模分布式系统下的消息通信需求。RocketMQ的设计目标是提供一种灵活、可靠、高性能的消息传递解决方案，适用于各种场景，包括在线消息通信、日志处理、流式处理、事件驱动架构等。：RocketMQ采用了分布式架构，支持水平扩展和高可用性。它的架构包括多个消息生产者、多个消息消费者和多个消息服务器（Broker）。

2024-04-08 10:58:56 2525

原创【PDF合并】利用 Python 合并 PDF 文件

然后，使用 append 方法逐个添加要合并的 PDF 文件。在示例中，将要合并的 PDF 文件路径存储在列表 pdf_files 中，可以根据实际情况进行修改。在 PyPDF2 版本 3.0.0 中，PdfFileMerger 类被移除了，取而代之的是 PdfMerger 类。执行上述代码后，将会生成一个名为 merged.pdf 的文件，其中包含了所有合并的 PDF 文件的内容。在添加完所有的 PDF 文件后，需要指定合并后的输出文件路径 output_path。

2024-03-07 11:06:21 2086

原创【机器学习】实验记录工具

Weights & Biases（简称为 WandB）是一个用于跟踪机器学习实验、可视化实验结果并进行协作的工具。它提供了一个简单易用的界面，让用户可以轻松地记录模型训练过程中的指标、超参数和输出结果，并将这些信息可视化展示。WandB 还支持团队协作，可以让团队成员共享实验记录、交流想法，并进行实验结果的比较和分析。通过 WandB，用户可以更好地管理和理解他们的机器学习项目，加速实验迭代过程，提高模型的性能。以上代码演示了如何使用 Weights & Biases（W&B）库进行实验追踪和记录。

2024-01-24 18:40:45 1035

语音识别vLLM 部署 Whisper 语音识别模型指南

完整中文教程170页-德克萨斯大学奥斯汀分校自然语言处理硕士课程-21.5MB

Android控件与布局入门 - 简易计算器

Android使用 CameraX 实现基础录像功能

Android使用 CameraX 实现基础拍照功能

空空如也