自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小张学AI

分享、记录日常算法工作。包含算法部署、模型结构转换,服务开发及模型加速等,主要涉及人工智能领域 Python、ML、CV、NLP 等前沿知知识

  • 博客(27)
  • 收藏
  • 关注

原创 基于NER、触发词与依存句法分析的言论抽取

基于NER、触发词与依存句法分析的言论抽取

2024-07-21 11:14:21 209 1

原创 基于图片中的表格检测与识别

基于图片中的表格检测与识别

2024-07-21 10:48:08 371 1

原创 装备名称检索与推荐

装备名称检索推荐、本项目采用faiss+uvicorn+fastapi多并发模式。

2024-06-13 10:41:32 366 1

原创 PDF分页处理:技术与实践

PDF分页处理

2024-06-04 15:09:01 758 1

原创 PDF 文件的解析

PDF 文件的解析识别文字及表格

2024-06-04 12:01:00 620 1

原创 chatGLM基于incontext learning原理微调nlp任务

chatGLM基于incontext learning原理微调nlp任务

2024-05-14 10:23:04 737 1

原创 PDF文档智能问答

在文本中,将会介绍如何使用fitz模块来处理PDF文档,并基于此,再使用大模型对PDF文档内容进行智能问答,提升问答效果。

2024-04-16 11:10:11 935 1

原创 CLIP模型入门

CLIP模型入门

2024-04-08 14:17:46 879 2

原创 非机构化解析【包含PDF、word、PPT】

针对PDF、docx、doc、PPT四种非结构化数据进行解析,识别里面的文本和图片。

2024-04-07 17:57:01 699 1

原创 类似微信的以文搜图功能实现

通过PaddleOCR识别图片中的文字,将识别结果报存到es中,利用es查询语句返回结果图片

2024-04-03 09:47:03 1362 2

原创 向量数据库实战介绍

本文简单介绍了三种常见的向量数据库:faiss, Milvus, Qdrant,每种向量数据库都有其利弊。同时,结合一个具体的应用案例:文本相似性搜索,来分别展示这三种向量数据库的使用方法。

2024-04-02 10:37:47 1294 1

原创 基于CLIP模型的图像相似度计算与检索

基于CLIP模型的图像相似度计算与检索

2024-03-26 16:38:21 1070 1

原创 使用LLaVA模型实现以文搜图和以图搜图

使用LLaVA模型实现以文搜图和以图搜图实战

2024-03-25 21:28:13 1518 1

原创 基于llava-v1.5-7b大模型的图片理解

基于llava-v1.5-7b大模型的图片理解

2024-03-16 15:21:34 1084 1

原创 基于ViT的端到端公式识别模型

𝚃𝚎𝚡𝚃𝚎𝚕𝚕𝚎𝚛:基于ViT的端到端公式识别模型,可以把图片转换为对应的latex公式。

2024-03-12 15:35:22 515 3

原创 常用运维脚本

常用运维脚本_1

2024-02-21 11:24:29 292

原创 基于AC自动机的关键词抽取

基于AC自动机的关键词抽取

2024-02-19 11:23:06 327 1

原创 从Hugging Face中下载数据集、模型到本地

从Hugging Face中下载数据集、模型到本地

2024-02-18 17:13:33 3383 1

原创 基于PaddleNLP的层次分类

本项目提供通用场景下基于PaddleNLP的层次分类端到端应用方案。

2024-02-07 16:56:26 1012 2

原创 基于PaddleNLP的文本多分类任务

此项目是基于PaddleNLP的文本多分类任务,包含外交、军事、经济、政治、科技、安全6大领域。

2024-02-04 10:31:02 1525 1

原创 docker常用命令

docker基础命令及常用命令

2024-02-03 18:23:30 210 1

原创 基于gunicorn+flask+docker模型高并发部署

此项目的是基于已有深度学习环境进行迁移,利用gunicorn+flask+docker的形式进行模型部署,实现高并发。

2024-02-03 16:30:39 738 1

原创 使用Nginx对多算法接口做负载均衡

此项目是为了解决服务器并发压力,提高应用处理性能,增加吞吐量,加强网络处理能力,实现算法高可用。

2024-01-30 11:28:59 529 1

原创 NER之基于正则化抽取方法

该项目是基于拍卖数据的正则化相关技术进行抽取。

2024-01-24 15:42:04 427 1

原创 基于paddleNLP的文本二分类任务

此次项目是基于paddleNLP的文本二分类任务,利用Label Studio对数据进行标注,生成特定格式的异常言论和正常言论数据进行训练和推理。

2024-01-23 10:28:59 1575

原创 基于Sentence Transformers和faiss文本检索与匹配算法

SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜索和同义词挖掘等常见任务。该框架基于 PyTorch 和 Transformers,并提供了大量针对各种任务的预训练模型。还可以很容易根据自己的模型进行微调。阅读论文 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks,深入了解模型的训练方式。

2024-01-22 11:06:13 1170 1

原创 基于pytorch的层次分类

本项目提供通用场景下基于Bert+MLP的层次分类端到端应用方案,打通数据标注-模型训练-模型调优-模型转换-预测部署全流程,有效缩短开发周期,降低AI开发落地门槛。层次文本分类任务的中数据样本具有多个标签且标签之间存在特定的层级结构,目标是预测输入句子/文本可能来自于不同级标签类别中的某一个或几个类别。以下图新闻文本分类为例,该新闻的一级标签为体育,二级标签为足球,体育与足球之间存在层级关系。

2024-01-21 16:56:39 1371 2

kubernetes常用命令表

k8s常用命令

2024-02-19

docker容器生命周期管理

docker容器生命周期管理

2024-02-19

linux常用命令大全

linux常用命令大全

2024-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除