WindyChanChan-CSDN博客

AI之旅‌AI之旅导航‌：这是一个免费无广告的AI大模型和工具导航网站，提供了大模型整理和排名信息‌。评测网站SuperCLUESuperCLUE是一个中文通用大模型的综合性评测基准，旨在全面评估中文大模型在不同任务上的表现。它由CLUE团队开发，专注于语言理解与生成、知识理解与应用、专业能力、环境适应与安全性等多个维度的评估。SuperCLUE的评测体系包括基础能力、专业能力和中文特性能力三个主要维度，涵盖语义理解、对话、逻辑推理、角色模拟、代码生成与创作等10项基础能力，以及中学、大学及专

2025-01-11 21:08:13 1026

原创国内外大模型以及部署

国内15家AI大模型应用盘点AI大模型秘塔AI搜索秘塔AI搜索免登录，免费的问答大模型。开源大模型OllamaOllama是一个专注于提供大语言模型（LLM）本地化部署和运行的工具和资源的平台。它旨在帮助用户轻松地在自己的设备上运行和定制大型语言模型本地部署大模型5分钟本地部署部署ollama-webui可视化界面展示大模型大模型一键启动AI应用帮

2024-12-31 20:13:54 568

原创网盘加速器

下载助手。

2024-12-08 14:54:16 833

原创学术研究网集

大木虫学术导航

2024-09-19 19:56:14 171

原创 DL即插即用模块

注意力机制awesome-attention-mechanism-in-cvAwesome-Transformer-Attention即插即用deepLearning-modules-toolboxdeepLearning-modules-toolbox

2024-09-19 19:47:18 295

原创 LLM基础知识

【代码】LLM基础知识。

2024-09-14 21:13:58 373

原创文档去重算法

MinHash算法MinHash是一种用于近似计算文档集合相似度的算法。它可以有效地将文档集合的相似度评估问题转化为哈希集合之间相互作用的问题，从而可以用较小的计算代价来获得相似的结果。SimHash算法SimHash是一种用于快速计算文本指纹的算法，通过降维技术将高维的文本特征向量映射成一个低维的哈希值（指纹）。该算法在保持文本相似度信息的同时，大大降低了数据的维度。Klongsent算法Klongsent算法可能结合了MinHash的随机哈希选择和SimHash的降维技术，通过先对文

2024-09-13 19:30:57 514

原创大模型训练数据库Common Crawl

‌‌Common Crawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。Common Crawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌Common Crawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据经过处理后，可以用于自然语言处理和机器学习的训练。

2024-09-11 20:34:56 3476 1

原创五、Flask类视图和Restful

【代码】五、Flask类视图和Restful。

2024-04-27 19:44:00 290

原创四、Flask进阶

【代码】四、Flask进阶。

2024-04-24 20:30:57 401

原创三、Flask模型基础

【代码】三、Flask模型基础。

2024-04-21 21:19:04 766

原创二、Flask会话技术和模板语言

【代码】二、Flask会话技术和模板语言。

2024-04-14 13:29:04 659

原创一、flask入门和视图

【代码】一、flask入门和视图。

2024-04-12 20:48:52 475

原创自然语言处理应用：开放文本域的实体关系抽取

【代码】自然语言处理应用：开放文本域的实体关系抽取。

2024-03-23 21:35:10 395

原创 Stable Diffusion 详解

整体目标文本生成图片；文本+图片生成图片网络结构CLIP的文本编码器和图片生成器组成图像生成器，输入是噪声经过UNet得到图像特征，最后解码得到图像前向扩散模型直接预测图片难度比较大，所有让模型预测噪音然后输入-噪音可得到原图逆向扩散预测模型UNet改进后的UNet参考链接

2024-03-10 13:55:41 891

原创 Glip模型

Yolos完全使用Transformer做目标检测Detr先使用CNN提取特征然后再使用transformerDetr和Yolos共同的缺点：需要事先知道所有的类别GlipZero-shot, 目标检测的类别可以不在训练类别中目标框进行视觉编码，然后和文本进行匹配文本和视觉特征是通过Clip模型提取的，所以视觉向量和文本向量是在一个空间Glip模型的优点Glip图像和文本融合Glip损失函数Glip训练数据

2024-03-09 21:16:05 956 1

原创 SAM模型

SAM与过去分割对比根据以下Demo,我们可以发现，通过在图像中指定要分割的内容提示，SAM可以实现各种分割任务，且无需额外的训练、做到零样本泛化，即SAM学会了辨别物体、具备图像理解力、对不熟悉的图像和物体能进行零样本概括，这一通用特性使得SAM模型在有关领域的推广应用成为可能。SAM模型结构focal loss为了解决类别不均衡的问题，其中系数为0就是标准的分类loss数据引擎SAM存在的问题

2024-03-09 20:32:49 617

原创多模态入门

VIT处理图像CNN VS Transformer多模态BLIP模型网络结构视觉编码器: 就是 ViT 的架构。将输入图像分割成一个个的 Patch 并将它们编码为一系列 Image Embedding，并使用额外的 [CLS] token 来表示全局的图像特征。视觉编码器不采用之前的基于目标检测器的形式，因为 ViLT 和 SimVLM 等工作已经证明了 ViT 计算更加友好。作用提取图像特征。文本编码器:就是 BERT 的架构，其中 [CLS] token 附加到文本输入的开头以总结句

2024-03-06 19:08:11 583

原创从第一原理看大语言模型

大模型基础框架大模型幻觉问题大模型能力思维链模式思维链模式激发的是大模型的推理能力LLM知识能力RAG

2024-03-03 19:54:51 638

原创 Sora模型技术讲解

3 的patch，就是1800维特征。将一帧一帧图片转化为20 * 30。

2024-03-02 11:43:30 477

原创 Sora背后的关键技术

Sora量大核心技术Spacetime Patch（时空Patch）Patch可以理解为Sora的基本单元，就像GPT-4的基本单元是Token。Token是文字的片段，Patch则是视频的片段。GPT-4被训练以处理一串Token，并预测出下一个Token。Sora遵循相同的逻辑，可以处理一系列的Patch，并预测出序列中的下一个Patch。Sora通过Spacetime Patch将视频视为补丁序列，Sora保持了原始的宽高比和分辨率，类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至

2024-02-28 20:52:41 803

计算机图形学

计算机图形学函数

空空如也