- 博客(393)
- 资源 (38)
- 收藏
- 关注
原创 利用 vLLM 优化部署私有化大模型,让推理速度飞起
vLLM是一个快速且易于使用的大模型库,专为大模型的推理和部署而设计。可以无缝集成 HuggingFace、Modelscope 上的模型。在性能优化上 vLLM 通过引入创新的架构和算法,如Paged Attention、动态张量并行等,减少计算开销和提高吞吐量,实现推理过程的高效,从而加速LLM在推理阶段的性能。一定程度上解决了传统大模型在硬件资源有限情况下的性能瓶颈。
2025-01-21 20:00:00
1043
原创 MInio + kkFileView 通用服务端在线文件文档预览方案
kkFileView 是一个基于 SpringBoot 开发的万能文件预览开源项目,允许用户在浏览器端实时查看文件内容。
2025-01-12 08:00:00
713
原创 基于 DINOv2 模型实现图搜图相似度检索任务
DINOv2是由Meta AI开发的第二代自监督视觉变换器模型,采用 Vision Transformer (ViT) 架构 。其核心特点是在无需人工标签的情况下,通过自监督学习技术,从海量无标注图像中学习有意义的视觉特征表示,类似于 NLP 领域的自监督 Base 模型,DINOv2 已经具有了对图像的理解能力,和强大的图像特征提取能力,因此它可以作为几乎所有计算机视觉任务的骨干模型。
2024-12-28 15:48:53
832
原创 基于 Roberta 微调训练句子语义等价识别任务
句子语义等价识别任务,说白了,就是让模型来判断两个句子是不是在说同一个意思。就像我们人类有时候会说两句话来表达同一个想法。本文基于开源的 hfl/chinese-roberta-wwm-ext 模型,微调训练句子语义等价识别任务。
2024-12-14 08:00:00
451
原创 使用Numpy从零实现神经网络前向传播、反向传播、迭代训练等主要过程
本文从零开始实现了一个简单的神经网络,包括前向传播、反向传播和迭代训练过程。通过手动计算梯度并更新权重和偏置,最终实现了对输入数据的预测,并展示了损失函数随训练过程的变化。整个过程展现了神经网络的基本原理和实现方法。
2024-12-01 13:08:22
1050
原创 基于 PyTorch 从零手搓一个GPT Transformer 对话大模型
本文仅使用 PyTorch ,从零构建网络结构、构建词表、训练一个 GPT 对话模型。带你体验如何从0到1实现一个自定义的对话模型。模型整体以 Transformer Only Decoder 作为核心架构,由多个相同的层堆叠而成,每个层包括自注意力机制、位置编码和前馈神经网络。
2024-11-10 10:22:49
2687
8
原创 RT-DETR 基于Transformer的目标检测模型介绍及微调训练
RT-DETR是基于Transformer的目标检测模型,DETR的基础上采用了高效的混合编码器和IoU感知,有效降低了计算成本、提高了检测精度。
2024-11-03 14:26:42
1678
原创 基于 Roberta Lora 微调训练 搜索内容相关性判断模型
搜索内容相关性任务是指评估用户查询(`Query`)与搜索引擎返回的文档或信息(`Document`)之间的匹配程度。
2024-10-20 20:27:48
1051
原创 基于T5模型,端到端训练 Ner 命名实体识别任务
T5模型,是由Google提出的一种预训练语言模型,结构基于 Transformer 架构实现。T5模型的核心思想是将所有文本处理任务统一为 文本到文本 的转换任务。这表示,无论是文本分类、情感分析、问答还是机器翻译等任务,都可以通过输入一段文本,经过T5模型处理,输出另一段文本作为结果。这种统一的形式使得T5模型具有广泛的适用性。
2024-10-12 08:00:00
746
原创 尝鲜使用 YOLO V11 Fine-Tuning 训练自定义的目标检测模型
YOLOv11 在 YOLOv8 基础上进行了重要改进,同样支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。它继续采用了卷积神经网络设计,充分利用了最新的计算能力,以提高检测效率和降低延迟。在实际应用中,无论是物体识别、跟踪还是图像分割,都展现出了卓越的性能。
2024-09-30 17:45:09
3185
原创 基于 Qwen2.5-0.5B 微调训练 Ner 命名实体识别任务
Qwen2.5 是 Qwen 大型语言模型的最新系列,参数范围从 0.5B 到 72B 不等。大大提高了编码和数学能力。在指令跟随、生成长文本(超过 8K 个标记)、理解结构化数据(例如表格)以及生成结构化输出(尤其是 JSON)方面有了显著改进。
2024-09-30 10:24:55
3746
5
原创 基于 Qwen2-1.5B Lora 微调训练医疗问答任务
Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。Qwen2 是 Qwen1.5 的重大升级。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。
2024-09-21 13:11:52
953
1
原创 使用 VisionTransformer(VIT) FineTune 训练驾驶员行为状态识别模型
VIT模型是一种基于Transformer架构的计算机视觉模型,它利用Transformer的自注意力机制来捕捉图像中的长距离依赖关系,使得在多个图像识别任务上取得了与卷积神经网络(CNN)相媲美的性能,甚至有所超越,同时具有更好的迁移能力。
2024-09-07 08:00:00
1144
原创 YOLO-V8 通过英特尔 OpenVINO 提高 CPU 推理速度
OpenVINO 是一款由英特尔推出的深度学习推理引擎,可以帮助开发者高效地在各种硬件平台上部署深度学习模型
2024-08-24 08:00:00
1913
3
原创 Supervision 结合 YOLO V8 玩爆各种计算机视觉处理任务
Supervision是一个针对于计算机视觉各种任务的框架工具,为用户了提供便捷高效的视觉处理方法,可以轻松处理数据集或直观地展现检测结果。另外他还提供了多种绘制检测结果的方式,并且还提供了统计特定区域内检测跟踪、越线数量统计、切片推理、轨迹平滑等不同计算机视觉任务的方法封装。可谓是在CV领域,有了它你可以少写很多展现和计算代码。
2024-08-09 17:18:43
1774
原创 JDFrame 一款比 Java 8 Stream 更灵活的数据处理工具
JDFrame的核心优势之一是其丰富的API。它不仅包含了Java 8 Stream的基础操作,还增加了更多高级数据处理功能,如窗口函数、复杂条件过滤、自定义聚合,以及类似SQL的分组、聚合和连接操作。这些额外的功能使得JDFrame能够轻松应对复杂的数据操作需求,为开发者提供了更大的灵活性和便利性。
2024-08-01 18:21:03
1196
3
原创 SDK 多版本管理控制利器 SDKMAN 介绍及使用
SDKMAN 是一款面向Java开发者的命令行工具,旨在简化Unix系统上SDKs的管理。它支持跨平台使用,提供便捷的版本控制和切换功能,通过维护候选SDK列表,让用户能够轻松安装、更新和卸载各类软件开发工具包。SDK 支持如 Java,Groovy,Scala,Kotlin、Ceylon,也支持Maven,Gradle,SBT,Spring Boot,Vert.x 等。
2024-07-31 13:51:35
1725
原创 基于 YOLO V10 Fine-Tuning 训练自定义的目标检测模型
YOLO-V10 由清华大学提供,采用无 NMS 训练和效率-精度驱动架构,提供目前最先进的性能和延迟。
2024-07-30 11:49:24
1849
原创 Fast-Retry 高性能百万级任务重试框架介绍及使用
Fast-Retry 是一个高性能任务重试框架,可以支持百万级别任务的并发重试处理。与 Spring-Retry 不同,Fast-Retry 支持异步任务的重试、超时等待、回调 等功能。
2024-07-21 15:51:10
747
原创 Spring Cloud Alibaba AI 介绍及使用
Spring Cloud Alibaba AI 是阿里以 Spring AI 为基础,并在此基础上提供阿里云通义系列大模型全面适配,让用户在 5 分钟内开发基于通义大模型的 Java AI 应用。
2024-07-10 19:20:24
1318
原创 OpenCV 调用自定义训练的 YOLO-V8 Onnx 模型
Onnx 格式是一种开放格式,用于表示深度学习模型。目的是为了促进不同深度学习框架和工具之间的模型互操作性。通过Onnx,开发人员可以更容易地在不同的深度学习框架之间转换模型。本文首先将自定义的 YOLO-V8 Pytorch 模型转为 Onnx 模型,然后通过 OpenCV 调用 Onnx 模型,进行运算推理。
2024-06-30 10:14:22
4007
1
原创 MySQL 使用 MyFlash 快速恢复误删除、误修改数据
MyFlash 是由美团点评公司技术工程部开发并维护的一个开源工具,主要用于MySQL数据库的DML操作的回滚。这个工具通过解析binlog日志,帮助用户高效、方便地进行数据恢复。MyFlash的优势在于它提供了更多的过滤选项,使得回滚操作变得更加容易。与其他数据恢复工具相比,MyFlash无需将binlog解析成文本再进行转换,而是提供了基于库、表、SQL类型、位置、时间等多种过滤方式。
2024-06-15 14:59:57
899
原创 Kafka 集群 KRaft 模式搭建
Kafka的KRaft模式是一种新的元数据管理方式,旨在去除对ZooKeeper的依赖,使Kafka成为一个完全自包含的系统。在Kafka的传统模式下,元数据管理依赖于ZooKeeper,这增加了部署和运维的复杂性。为了解决这个问题,Kafka社区引入了KRaft模式。在KRaft模式下,所有的元数据,包括主题、分区信息、副本位置等,都被存储在Kafka集群内部的特殊日志中。这个日志使用Raft协议来保证一致性。
2024-06-02 15:41:01
1702
原创 Sentinel Dashboard 规则联动持久化方案
Sentinel 是阿里开源的一个流量控制组件,它提供了一种流量控制、熔断降级、系统负载保护等功能的解决方案。并且我们通过 Sentinel Dashboard 可以非常便捷的添加或修改规则策略,但是如果细心的小伙伴应该可以发现,默认情况下通过 Sentinel Dashboard 添加或修改的规则并没有进行持久化,服务重启后先前的规则也就消失了,这对于生产环境肯定是不允许的,那如何进行持久化操作呢?
2024-05-26 14:57:27
836
原创 K8s 搭建 FileBeat+ELK 分布式日志收集系统 以及 KQL 语法介绍
Filebeat 是一个轻量级的日志传输工具,它负责收集日志数据并将其传输到Elasticsearch进行索引和存储。ELK是Elasticsearch、Logstash和Kibana三个开源项目的首字母缩写,它们共同构成了一个强大的日志管理和分析平台。
2024-05-18 08:00:00
1583
原创 Istio 使用 Apache SkyWalking 进行服务链路追踪、链路监控告警
SkyWalking是一个开源的观测平台,用于从服务和云原生等基础设施中收集、分析、聚合以及可视化数据,SkyWalking 提供了一种简便的方式来清晰地观测分布式系统,甚至可以观测横跨不同云的系统,SkyWalking 更像是一种现代的应用程序性能监控(Application Performance Monitoring,即APM)工具,专为云原生,基于容器以及分布式系统而设计。
2024-05-11 17:06:08
1435
原创 K8s 多租户管理
多租户是指在同一集群中隔离多个用户或团队,以避免他们之间的资源冲突和误操作。在K8s中,多租户管理的核心目标是在保证安全性的同时,提高资源利用率和运营效率。
2024-05-11 16:23:21
1416
原创 Istio 流量管理(请求路由、流量转移、请求重试、流量镜像、故障注入、熔断等)介绍及使用
Istio是一个开源的服务网格,它为分布式微服务架构提供了网络层的抽象。它使得服务之间的通信变得更为可靠、安全,并且提供了细粒度的流量管理、监控和策略实施功能。Istio通过在服务之间插入一个透明的代理(Envoy)来拦截所有网络通信,从而实现这些功能。这样,开发者就可以专注于业务逻辑,而不必处理服务发现、负载均衡、故障恢复、安全性等网络问题。
2024-05-05 16:10:41
1659
原创 Spring Cloud Kubernetes 实践 服务注册发现、服务动态配置
随着云计算和微服务架构的不断发展,k8s 和Spring Cloud成为了当今技术领域的两大热门话题。k8s作为一个开源的容器编排平台,已经在自动化部署、扩展和管理方面取得了巨大的成功,而Spring Cloud则以其丰富的生态和语言亲和性,为Java开发者提供了便利的微服务框架支持。在现如今的技术趋势下,两者融合已经成为了必要的方向。
2024-05-01 21:50:14
1638
原创 K8s 使用 CephFS 作为后端存储(静态供给、动态供给)
CephFS是 Ceph 中基于RADOS(可扩展分布式对象存储)构建,通过将文件数据划分为对象并分布到集群中的多个存储节点上来实现高可用性和可扩展性。
2024-04-27 14:26:37
1302
原创 K8s 使用 Ceph RBD 作为后端存储(静态供给、动态供给)
Ceph RBD(Rados Block Device)是 Ceph 存储集群中的一个重要组件,它提供了块级别的存储访问。RBD 允许用户创建虚拟块设备,并将其映射到客户端系统中,就像本地磁盘一样使用。
2024-04-27 10:58:41
822
原创 Ceph 分布式文件系统 搭建及使用
在当今数据爆炸式增长的时代,企业对于可靠、可扩展的存储解决方案的需求日益迫切。Ceph 作为一种开源的、可伸缩的分布式存储解决方案,正逐渐成为企业级存储领域的热门选择。Ceph是一种由Radicalbit公司开发的开源分布式存储系统,它通过将数据分布在一个或多个存储节点上,实现了高可靠性、高性能和高扩展性。
2024-04-21 17:12:29
1573
1
原创 GlusterFS 分布式文件系统 搭建及使用
GlusterFS 是一个开源的分布式文件系统,旨在提供高性能、可扩展性和可靠性,适用于现代数据中心和云环境。它以横向扩展的方式设计,可以在多台服务器之间共享文件系统,为应用程序提供统一的文件存储服务。
2024-04-14 16:17:04
1592
原创 MySQL Innodb中 可重复读隔离级别是否能完全规避幻读
在 MySQL Innodb引擎可重复读隔离级别下,已经尽可能最大程度的规避幻读的问题了,使得大多数情况下,重复读都是可以得到一致的结果。但是某些个别情况下还是不可避免会发生幻读。
2024-04-14 14:04:26
622
原创 MySQL Innodb 中的排它锁、共享锁、意向锁、记录锁、间隙锁、临键锁、死锁讲解
MySQL作为流行的关系型数据库管理系统之一,在处理并发访问时,锁起着至关重要的作用。锁的使用可以确保数据的完整性,同时也是实现并发操作的必备工具。在MySQL Innodb 引擎中锁可以理解为两个方向的东西,一个是基本锁的类型,一个是锁粒度的策略。
2024-04-14 09:33:05
1381
Navicat for Oracle.zip
2021-03-08
docker-19.03.8.tar.gz
2020-12-14
canal1.1.5.zip
2020-12-13
gitlib.zip
2020-12-09
RedisClient-windows.zip
2020-12-08
redisclient-win32.x86.1.0.zip--Delete
2020-12-08
阿里开发规范.zip
2020-12-08
zookeeper-3.4.10.tar.gz
2020-12-04
kafka_2.12-2.6.0.tar.gz
2020-12-04
apache-zookeeper-3.5.8.tar.gz-Delete
2020-12-04
swagger-ui-3.18.3.zip
2020-12-03
mycat.tar.gz
2020-08-03
MyCat.tar.gz-Delete
2020-08-03
美国新冠疫情累计测试案例数据集
2022-10-23
hadoop-3.1.4 windows.zip
2022-10-05
hadoop 3.1.4
2022-10-03
elasticsearch7.8.0.zip
2022-01-03
data-for-1.7.5.zip
2022-01-03
elastic-job-lite-console-master.zip
2021-12-22
sentinel.zip
2021-12-22
stata1.4.2.zip
2021-12-22
harbor-offline-installer-v1.5.3.tgz
2021-08-15
dashboard-master.zip
2021-07-23
flannel-master.zip
2021-07-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人