自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(534)
  • 资源 (10)
  • 收藏
  • 关注

原创 ClickHouse 25.3 json列类型使用示例

JSON已经成为现代数据系统中处理半结构化和非结构化数据的通用语言。无论是在日志记录和可观察性场景、实时数据流、移动应用存储还是机器学习管道中,JSON的灵活结构使其成为跨分布式系统捕获和传输数据的首选格式。从clickhouse 25.3版本,在生产中已经可以使用JSON列类型

2025-06-08 10:29:24 1042

原创 如何构建一个提供LLM运行环境的镜像

如果想在本地搭建LLM的运行环境,使用镜像是一个很好的选择本文提供基于python 3.10版本,使用poetry管理依赖,快速搭建LLM运行环境的镜像的脚本。

2025-04-10 09:40:40 60

原创 Trio:快速掌握Python并发编程的神器

Trio 是一个友好的 Python 库,用于异步并发和 I/O。它提供了一种简单且强大的方式来编写并发程序。本文将介绍如何使用 Trio 快速开发并发应用,包括与 Python 原生 async/await/coroutine 的区别、Trio 的优劣势、如何开发多任务并发的后端、如何开发多任务并发的 WEB 后端以及使用 Trio 的注意事项等。

2025-03-29 19:42:20 781

原创 使用 Docker Compose 的 COMPOSE_PROFILES 变量:模块化你的应用部署

利用 Docker Compose 的 COMPOSE_PROFILES 环境变量及其 profiles 功能,开发者可以更加灵活和高效地管理复杂的应用部署。无论是为了简化开发流程还是优化生产环境的部署策略,这个特性都提供了一种优雅的解决方案。

2025-03-25 10:23:12 955

原创 2025-工具集合整理

Docker Image Puller 是一个方便的工具,用于从 Docker 仓库拉取镜像,支持国内镜像源加速和多架构支持。该工具采用 MIT 许可证,开放源代码,方便用户根据需要进行定制和扩展。TikTok 发布/喜欢/合辑/直播/视频/图集/音乐;easyexcel作者最新升级版本, 快速、简洁、解决大文件内存溢出的java处理Excel工具。

2025-02-02 21:44:13 581

原创 AI Agent相关的设计图

LLM Agent 是一个基于大型语言模型的智能代理,能够执行复杂的任务。它通常结合了多种工具和API,以完成特定的目标。LLM Agent 可以根据上下文动态调整其行为,并且能够处理多步骤的任务。

2025-01-26 11:49:50 484

原创 2024年年终看LLM的发展方向

如今的大模型已经能够满足95%用户的需求,涵盖信息抽取、方案设计、表格生成、简单代码编写、简单问答、简单服务调用等领域,这95%的需求大多是简单任务,对模型的能力要求不高。因为大多数的用户日常并不需要模型具备复杂的逻辑推理能力。剩下5%涉及复杂逻辑推理的需求,隐藏着AGI的技术瓶颈,代表着以o1为典型的新技术范式,但需要投入天价的算力本文回顾2024年LLM的发展记录及针对2025年LLM发展方向的展望。

2024-12-31 18:10:23 1316

原创 JAVA 17+新特性示例汇总

JAVA 17+新特性示例汇总

2024-12-29 13:11:30 163

原创 Redis生产实践中相关疑问记录

Redis生产实践中相关疑问记录

2024-12-22 11:41:25 999

原创 springboot3如何集成knife4j 4.x版本及如何进行API注解

- knife4j是为**Java MVC框架集成Swagger生成Api文档的增强解决方案**, 取名knife4j是希望她能像一把匕首一样小巧,轻量,并且功能强悍!- 本文提供springboot3如何集成knife4j 4.x版本及如何进行API注解

2024-11-23 17:39:15 702

原创 深入理解 Spring Boot 的 WebApplicationType

在 Spring Boot 应用程序启动过程中,WebApplicationType 是一个重要的概念,它决定了应用程序是以 Web 应用程序的形式运行还是以非 Web 应用程序的形式运行。本文将详细探讨 WebApplicationType 的工作机制及其在实际项目中的应用。

2024-11-23 17:15:55 581

转载 Word模板引擎poi-tl(poi template language)使用入门指南

Word模板引擎poi-tl(poi template language)使用入门指南

2024-10-16 10:05:38 993

原创 如何使用PSTools工具集中的PSExec修改注册表信息,解决某些注册表项无法删除的问题

如何使用PSTools工具集中的PSExec修改注册表信息,解决某些注册表项无法删除的问题

2024-10-08 19:40:49 821

原创 rapidocr 提取汇总

rapidocr 提取汇总

2024-09-19 15:29:53 634

原创 FastAPI--如何自定义Docs UI,包括多个APP、静态资源、元数据等

FastAPI--如何自定义Docs UI,包括多个APP、静态资源、元数据等

2024-09-17 13:19:54 659

原创 如何构建一个提供nlp服务的镜像

本文介绍如何构建一个提供nlp服务的镜像,功能如下:基于hanlp 2.x、jionlp的基础采用fastapi封装NLP的相关服务

2024-09-04 18:18:12 570

原创 clickhouse MPPDB数据库 实现复杂功能的SQL示例

clickhouse MPPDB数据库 实现复杂功能的SQL示例

2024-08-24 12:16:55 459

原创 Alembic:python中数据库迁移的瑞士军刀

Alembic 是由 SQLAlchemy 的创始人 Mike Bayer 设计的一个数据库迁移工具。它不仅支持自动迁移脚本生成,还允许开发者手动编辑迁移脚本来满足特定的需求。Alembic 通过提供一个环境来跟踪数据库模式的变更历史,确保数据库的版本与应用代码保持同步。

2024-08-22 21:55:01 1393

原创 如何下载huggingface或modelscope上的大模型或数据集

如何下载huggingface或modelscope上的大模型或数据集

2024-08-17 19:14:52 2238

原创 hg transformers pipeline使用

在Hugging Face的transformers库中,pipeline是一个高级API,它提供了一种简便的方式来使用预训练模型进行各种NLP任务,比如情感分析、文本生成、翻译、问答等。通过pipeline,你可以在几行代码内实现复杂的NLP任务。pipeline会自动加载用于指定任务的默认模型和tokenizer,如果需要,用户也可以指定使用特定的模型和tokenizer在创建pipeline时,除了可以指定任务类型和模型外,还可以设置其他参数,详见本文

2024-08-17 18:33:06 804

原创 支持密码解压rar/zip等压缩包的JAVA类库

支持密码解压rar/zip等压缩包的JAVA类库

2024-08-10 15:16:19 209

原创 深入理解Bouncy Castle:Java开发者的强大密码学工具箱

Bouncy Castle由澳大利亚的两位开发者于1998年创建,旨在为Java和C#平台提供强大的密码学功能。它不仅支持广泛的加密算法,还提供了对许多安全协议的支持,包括SSL/TLS、S/MIME、CMS、OCSP等。Bouncy Castle的库遵循JCE(Java Cryptography Extension)和JSSE(Java Secure Socket Extension)规范,同时它也扩展了这些规范,增加了更多的功能和灵活性。

2024-08-10 14:46:58 340

原创 NLP专业术语及工具【hanlp、jiolp】

NLP专业术语及工具【hanlp、JioNLP】

2024-07-21 14:40:35 1005

原创 poetry使用经验汇总

Poetry 是一个 Python 依赖管理和打包工具,它旨在解决 Python 项目中常见的依赖问题,提供更简洁、更可靠的依赖管理方式本文针对poetry的使用经验进行汇总

2024-07-06 22:29:45 939

原创 docker 配置文件使用经验,后续持续增加

docker配置文件使用经验

2024-05-15 21:12:15 1136 1

原创 Gradio每个组件支持的事件,用于自查

Gradio每个组件支持的事件,用于自查

2024-05-02 11:28:51 228

原创 SecGPT 全球首个网络安全开源大模型且可以在CPU上运行的网络安全大模型

SecGPT 网络安全大模型探索使用网络安全知识训练大模型,能达到怎样的能力边界。SecGPT的愿景是将人工智能技术引入网络安全领域,以提高网络防御的效率和效果。其使命是推动网络安全智能化,为社会提供更安全的数字生活环境。SecGPT可以作为基座安全模型,用于探索各种网络安全任务。以下是对SecGPT在网络安全任务中可能应用的进一步探讨

2024-05-02 10:44:36 1636 3

原创 ASCII码表、ANSI、ANSI escape code、CSI、Unicode、UTF-8、UTF-16、UTF-32的相关知识,用于自查

ASCII码表、ANSI、ANSI escape code、CSI、Unicode、UTF-8、UTF-16、UTF-32的相关知识,用于自查

2024-05-01 09:44:18 171

原创 Jupyter 容器环境: Debian 11离线部署SSH Server总结

在基于continuumio/anaconda3镜像搭建的jupyter环境中,想在pycharm中进行远程debug代码,但容器中没有部署ssh server导致无法进行。本文讲述如何在anaconda3容器中安装ssh server

2024-04-30 21:07:39 818 1

原创 LLM--RAG中的文本切分策略及长上下文窗口是否会取代RAG?

在使用基于检索的生成模型(RAG)处理长文本数据时,合理的文本切割策略是提高模型性能和效率的关键。本文讲解文本切割相关的概念及技术要点。目前LLM模型进化的方向是增加上下文窗口的长度,主流LLM支持的上下文窗口长度越来越大,并且随着Infini-Transformer架构的出现,那么长上下文窗口是否会取代RAG?

2024-04-14 15:05:56 3658

原创 LLM-大模型演化分支树、GPT派发展阶段及训练流程图、Infini-Transformer说明

LLM-大模型演化分支树、GPT派发展阶段及训练流程图、Infini-Transformer说明

2024-04-14 11:22:56 1726

原创 快速了解FastAPI与Uvicorn是什么?

FastAPI is a modern, fast (high-performance), web framework for building APIs with Python 3.8+ based on standard Python type hints.本文带你快速了解FastAPI与Uvicorn是什么?

2024-04-06 22:23:25 2552

原创 clickhouse MPPDB数据库--新特性使用示例

从clickhouse 22.3至最新的版本24.3.2.23,clickhouse在快速发展中,每个版本都增加了一些新的特性,在数据写入、查询方面都有性能加速。本文根据[clickhouse blog](https://clickhouse.com/blog)中的clickhouse release blog中,学习并梳理了一些在实际工作中可能用到的新特性。

2024-04-04 14:08:35 1272

原创 docker容器添加新端口映射的步骤及`wsl$`目录的作用

docker容器如何添加新的端口映射在windows的Docker desktop中,`wsl$` 目录的作用是什么?

2024-04-01 20:35:25 638

原创 LLM-在CPU环境下如何运行ChatGLM-6B

ChatGLM-6B-INT4 是 ChatGLM-6B 量化后的模型权重。具体的,ChatGLM-6B-INT4 对 ChatGLM-6B 中的 28 个 GLM Block 进行了 INT4 量化,没有对 Embedding 和 LM Head 进行量化。量化后的模型理论上 6G 显存(使用 CPU 即内存)即可推理,具有在嵌入式设备(如树莓派)上运行的可能。在 CPU 上运行时,会根据硬件自动编译 CPU Kernel ,请确保已安装 GCC 和 OpenMP (Linux一般已安装,对于Wind

2024-03-31 14:54:29 624

原创 LLM--使用Milvus向量数据库必须知道的基本概念

Milvus 是一款专为大规模向量相似度搜索而设计的开源向量数据库。它旨在高效、快速地处理高维向量数据,并支持实时、近似最近邻(Approximate Nearest Neighbor, ANN)检索,适用于各种涉及向量搜索的应用场景,如图像识别、语音识别、推荐系统、自然语言处理(NLP)等。本文介绍使用Milvus作为向量数据库时必须知道的基本概念

2024-03-31 10:01:16 699

原创 LLM--如何使用SentenceTransformer将文本向量化

将文本向量化是自然语言处理(NLP)中的一项关键步骤,其主要目的是将原本难以直接被计算机理解的自然语言文本转换成数值形式的向量,以便于后续的机器学习算法和深度学习模型进行处理、分析和建模本文介绍如何使用SentenceTransformer将文本向量化

2024-03-31 09:41:57 1296

原创 LLM--打造Private GPT需要知道的一些概念及术语

打造Private GPT需要知道的一些概念及术语

2024-03-31 09:19:15 1368

原创 LLM--提示词Propmt的概念、作用及如何设计提示词

一种用于`指导`人工智能(如聊天机器人或图像生成工具)`生成特定内容`的文字。**提示词**的设计旨在以一种`高效`、`精确`的方式向模型传达用户的`意图`或所需的`任务类型`,从而使模型想你所想。有关如何写好提示词,请学习[面向开发者的大模型手册 - LLM Cookbook](https://github.com/datawhalechina/llm-cookbook),设计高效 Prompt 的两个关键原则:**编写清晰、具体的指令**和**给予模型充足思考时间**

2024-03-31 08:41:25 6654

原创 Milvus 向量数据库:如何基于docker-compose在本地快速搭建测试环境

Milvus 向量数据库:如何基于docker-compose在本地快速搭建测试环境

2024-03-23 11:46:32 577

阿里 & 蚂蚁 OceanBase 原生分布式关系数据库介绍及典型使用案例

阿里OceanBase: 企业级数据管理解决方案及典型应用案例

2021-11-09

HBase在搜索网页库上的应用_360.pdf

HBase在搜索网页库上的应用_360 HBase: 作为Hadoop的子项目,HBase是分布式,面向列的数据库,是在HFDS的基础上提供类似BigTable的功能; 适合非结构化数据存储的数据库,基于列的模式,主要用于随机访问,实时读写大数据;不提供类似SQL语句支持,使用比较简单;

2013-07-28

TSec零信任Lite版公开版.pdf

腾讯TSec零信任Lite版公开版

2023-06-09

CSOP 2023北京站-PPT

网络安全运营与实战大会 CSOP 2023北京站 演讲部分PPT CSOP 2023北京站_“新攻防”背景下,终端安全建设新思路 CSOP 2023北京站_安全能力自动化实践 CSOP 2023北京站_构建情报共享、协同防御的攻防对抗指挥体系 CSOP 2023北京站_企业资产暴露面的收敛 CSOP 2023北京站_云上攻防的点-线-面-体

2023-06-05

中国数据库行业研究报告.pptx

艾瑞咨询2021的中国数据库行业研究报告

2021-06-11

将MySQL或PostgreSQL的库表导出产生WORD文档

将MySQL或PostgreSQL的库表定义,按指定的WORD文档模板,导出产生WORD文档

2021-08-13

GoF设计模式.xmind

GoF 23种设计模式思维导图,按三大分类组织,给出每种模式的使用场景及常用实现

2021-07-08

如何解决weblogic multicast Exception

如何解决weblogic multicast Exception

2012-09-01

新版设计模式手册[C#].pdf

新版设计模式手册[C#].pdf 讲述了在CSHARP中如何使用设计模式,并有详细的代码例子

2009-03-01

Visual_Csharp简单入门.chm

Visual_Csharp简单入门.chm

2009-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除