- 博客(243)
- 收藏
- 关注
原创 JWT的实现及其适用场景
JWT(全称JSON Web Token)是一种开放标准(RFC 7519),它定义了一种紧凑且自包含的方式,用于作为JSON对象在各方之间安全地传输信息。此信息是经过数字签名的,因此可以验证和信任。JWT可以使用秘密(使用HMAC算法)或使用RSA或ECDSA的公钥/私钥对进行签名。虽然JWT可以加密,也可以在各方之间提供保密性,但我们将专注于签名代币。签名令牌可以验证其中包含的声明的完整性,而加密令牌则向其他方隐藏这些声明。当使用公钥/私钥对对令牌进行签名时,签名还证明只有持有私钥的一方才是签名方。
2024-03-22 14:30:21 2162
原创 视觉多模态大模型---MiniMax-vl-01---以闪电般的注意力缩放基础模型
MiniMax-VL-01 是与今年1月15日由上海稀宇科技有限公司(MiniMax)发布并开源的一款视觉多模态大模型,它与基础语言大模型 MiniMax-Text-01 一同构成了 MiniMax-01 系列。这款模型的设计初衷是为了应对日益增长的长上下文处理需求,并为未来的智能体(Agent)系统提供强有力的支持。以下是关于 MiniMax-VL-01 的详细介绍。
2025-01-15 16:07:11 366
原创 Sky-T1:在450美元内训练自己的O1预览模型
Sky-T1-32B 是由加州大学伯克利分校的 NovaSky 团队开发的一款高性能、低成本且完全开源的大规模推理模型。该模型拥有 320 亿个参数,训练成本却不到 450 美元,这主要得益于高效的训练方法和合成数据的应用26。与以往需要数百万美元才能完成训练的大型语言模型相比,Sky-T1-32B 的出现标志着一个重要的里程碑,它不仅降低了进入门槛,也为研究人员和开发者提供了一个强大的工具来探索先进的自然语言处理(NLP)技术。
2025-01-14 10:37:16 461
原创 智谱 AI 推出的最新一代凯源预训练模型---GLM-4-9B
GLM-4-9B-Chat是基于GLM-4架构构建的一个大型语言模型,其参数量达到了90亿(9B),并且支持多达128K tokens的上下文长度,这使得它可以处理非常长的文本输入,例如大约200万中文字符的内容。此外,为了满足不同场景的需求,GLM-4-9B-Chat还提供了多种变体,如基础版本GLM-4-9B(8K)、超长上下文版本GLM-4-9B-Chat-1M(1M),以及多模态版本GLM-4V-9B-Chat(8K)。
2025-01-14 09:46:59 688
原创 comfyui精准作图之gligen
在 Stable Diffusion(SD)中,GLIGEN 是一种用于增强文本到图像生成模型可控性的技术。它通过在现有的预训练扩散模型(如 Stable Diffusion)基础上,引入额外的定位输入(如边界框、关键点或参考图像),从而实现对生成图像中对象位置的精确控制。
2025-01-10 16:05:23 776
原创 多模态视觉模型InterVL
InternVL 是由上海人工智能实验室(Shanghai AI Laboratory)及其合作伙伴开发的开源多模态大语言模型(MLLM)系列,旨在缩小开源模型与商业模型(如 GPT-4V、Gemini 等)在多模态理解能力上的差距。InternVL 系列模型在视觉、语言和多模态任务中表现出色,尤其在处理高分辨率图像、多语言支持和复杂场景理解方面具有显著优势。
2025-01-08 17:41:41 760
原创 文本和代码创建图表和可视化之Mermaid(相当好用)
Mermaid 是一种基于 JavaScript 的图表绘制工具,它允许用户使用类似于 Markdown 的文本描述来创建和修改复杂的图表。通过这种简洁的人类可读的文本格式,开发者和技术作家能够轻松地将图表集成到他们的文档中,从而帮助文档跟上开发的步伐。
2025-01-08 17:08:19 921
原创 快速生图模型LCM(Latent Consistency Models)
LCM,全称 Latent Consistency Models(潜在一致性模型),是由清华大学交叉信息研究院的研究者们构建的一种生成模型。它旨在解决传统扩散模型(Diffusion Models)中由于迭代采样过程计算量大而导致的生成速度缓慢的问题。通过引入一系列创新性的方法,LCM 能够仅用少数几步推理就能生成高分辨率图像,极大地提高了图像生成的速度与效率。
2025-01-07 11:30:19 318
原创 爱诗科技PixVerseV3.5发布:短时极速生成,动漫效果超预期
PixVerse V3.5 是由爱诗科技推出的一款AI视频生成工具的最新版本,它在视频创作效率与质量方面实现了显著提升。这款软件不仅缩短了视频生成的时间,还增强了视频内容的表现力和专业度。
2024-12-31 15:00:08 1020
原创 训练成本低、相应速度快的DeepSeek-V3究竟如何?
DeepSeek V3是由中国幻方量化公司开发的一款大型语言模型,它基于自研的MoE(Mixture of Experts,混合专家)架构设计,总参数量达到了671亿,在推理时仅激活37亿参数。这一独特的架构选择使得DeepSeek V3不仅能够在性能上与GPT-4o和Claude 3.5 Sonnet等顶级闭源模型相媲美,而且在训练成本方面也展现出了极高的性价比,整个训练过程耗资约560万美元。
2024-12-30 11:24:59 1058
原创 基于视觉语言模型(VLM)的CogAgent
前言CogAgent 是由清华大学与智谱AI联合推出的一个多模态大模型,专注于图形用户界面(GUI)的理解和导航。它代表了在视觉语言模型(VLM)领域的一项重要进展,特别是在GUI Agent能力方面。相较于传统的基于文本的Agent,CogAgent的独特之处在于其使用视觉模态而非文本对GUI界面进行感知。这种方法更符合人类的直觉交互方式,即通过视觉与GUI交互,从而做出规划和决策。CogAgent的主要特点视觉GUI Agent能力CogAgent能够接受高达1120×1120像素的高分辨率图像
2024-12-28 08:45:00 1123
原创 集成学习(模型融合)
模型融合(Model Fusion),也被称为集成学习(Ensemble Learning),是一种将多个不同模型或算法结合在一起,通过一定的策略来进行预测或分类等任务的方法。这种技术能够帮助我们利用不同模型的优势,减少单个模型的不足,从而提高模型的准确性和稳定性12。
2024-12-27 08:45:00 1122
原创 推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview
谷歌接连推出了Gemini 2.0 Flash、Veo 2,以及最新的Gemini 2.0 Flash Thinking,每一款新产品都带来了令人印象深刻的特性与功能,仿佛是一场美食盛宴中的一道道佳肴,每一道都比前一道更加诱人。可以说,谷歌通过这些创新性的产品发布,正在人工智能领域树立新的标杆。从名称上我们可以看出Gemini 2.0 Flash Thinking是基于Gemini 2.0 Flash构建的,但前者经过了专门的设计与训练,旨在通过引入“思维”(thoughts)的概念来显著增强其推理能力。
2024-12-27 08:45:00 735
原创 web3之合约与智能合约
智能合约是存储在区块链上的自动化程序或代码,执行合约条款和条件。这些合约是由代码编写的,可以在特定条件下自动执行和强制执行。执行:智能合约在区块链上运行,一旦部署,就由区块链网络中的节点自动执行。智能合约的执行不依赖于中央机构,所有操作都是透明和去中心化的。智能合约 是一种区块链上的程序,能够在达到特定条件时自动执行合约条款,具有去中心化、自动化和透明的特性。普通合约 是传统的法律合同,虽然可以记录在区块链上以提供验证和透明度,但其执行依赖于法律系统和人工干预,通常不具备自动化执行的功能。
2024-12-26 08:45:00 1028
原创 redis的加锁
在单个 Redis 实例的环境中,SET 命令与 NX 选项和 Lua 脚本 (EVAL 命令) 都能提供原子性保证。简单场景:如果只是需要一个简单的锁机制或条件设置,使用 SET 命令的 NX 选项已经足够。复杂场景:如果需要在锁定过程中执行多个操作或实现复杂的逻辑,Lua 脚本提供了更多的灵活性和控制能力。这两种方法在单个 Redis 实例中都是有效的,但在分布式环境中,你可能需要结合其他策略(如分布式锁算法)来确保全局一致性。
2024-12-25 08:45:00 1116
原创 windows安装xformer遇到的问题汇总
在配置Visual Studio Build Tools环境变量时,通常需要设置以下几个关键的环境变量:Path、INCLUDE和LIB。
2024-12-25 08:45:00 404
原创 comfyui插件之ComfyUI-DiffBIR高清修复
ComfyUI-DiffBIR不仅使用简便,而且效果显著,感兴趣的小伙伴可以下载来试试看哦。相关模型的下载,找不到的话可以私我。
2024-12-24 08:45:00 314
原创 modelscope与huggingface cli 下载模型
Hugging Face CLI (huggingface-cli) 是 Hugging Face 官方提供的命令行工具,旨在简化与 Hugging Face Hub 的交互过程。它允许用户轻松地上传、下载、管理和分享各种自然语言处理模型和数据集3。
2024-12-24 08:45:00 1672
原创 scp文件传输配置
以上步骤可以帮助你配置 scp 的免密登录。scp 在局域网中的传输效率较高,如果你经常设计多端传输的话,这会是个不错的选择。
2024-12-23 08:52:46 292
原创 sql之全文索引
MySQL:全文索引的支持取决于存储引擎。InnoDB 和 MyISAM 存储引擎都支持全文索引,但建议使用 InnoDB,因为它提供了更好的事务支持和行级锁定。PostgreSQL:全文搜索的实现依赖于 tsvector 和 tsquery 类型及 GIN 或 GiST 索引,不需要依赖于特定的存储引擎。
2024-12-23 08:45:23 1089
原创 图片的渐进式加载
普通图片的加载是随着下载图片数据的完成度,逐渐从上至下显示完成的。如果浏览器只收到了图片文件数据的一半,那么它只会显示图片的上半部分。而渐进式图片的加载流程则是先显示图片整体的一个模糊效果,随着下载数据的增多,逐渐细化图片中的各个细节,使得图片分辨率逐渐提高,最终还原出完整的图像内容。
2024-12-18 08:45:00 1321
原创 区块链之智能合约
智能合约是区块链技术的核心应用之一,它通过自动化和去中心化的方式,提高了合约执行的效率和可靠性。虽然它们提供了许多优势,但也带来了新的挑战,如代码的不可更改性和复杂性。随着技术的发展和应用的普及,智能合约将继续在各种行业中发挥重要作用。
2024-12-17 09:00:00 1224
原创 SD常用的一些采样方法
SD常用的一些采样方法DDIM (Denoising Diffusion Implicit Models)DDIM 是一种基于扩散模型的采样方法,具有较高的效率,能够在较少的步骤内生成高质量的图像。相比于传统的扩散模型,DDIM 在生成过程中使用的步骤更少,因此能够加速生成过程。特点:相比其他扩散模型,它能够以较少的步骤生成与原始模型相似的图像,适合需要快速生成的场景。PLMS (Pseudo Numerical Methods for Diffusion Models)PLMS 是另一种采
2024-12-17 09:00:00 816
原创 YOLO-World与传统YOLO
YOLO-World 是由腾讯人工智能实验室(Tencent AI Lab)及其合作伙伴在2024年1月31日正式发布的实时开放词汇目标检测模型。这一模型的提出标志着目标检测领域的一个重要进展,特别是在处理开放词汇表识别方面的能力得到了显著增强。具体来说,YOLO-World 结合了视觉语言建模和大规模数据预训练的方法,赋予了YOLO模型零样本检测能力与语言理解能力,在推理速度和零样本检测精度上均领先先前的工作。
2024-12-16 09:00:00 965
原创 orjson模块
通过传递 default 参数给 dumps 方法,可以定义如何处理那些 orjson 不知道如何序列化的对象。此外,还可以利用 OPT_PASSTHROUGH_DATACLASS 和 OPT_PASSTHROUGH_DATETIME 选项配合 default 函数来自定义 dataclass 或 datetime 类型的数据转换逻辑。
2024-12-16 09:00:00 863
原创 容器技术之docker
Docker 是一个流行的开源平台,用于自动化应用程序的部署、扩展和管理。它基于容器技术,可以将应用程序及其所有依赖项打包成一个便携的容器镜像,并在任何地方一致地运行。
2024-08-13 08:45:00 1073
原创 linux的常用命令
文件和目录操作ls:列出目录内容。示例:ls -l(以长格式列出文件和目录)cd:改变当前工作目录。示例:cd /path/to/directory(切换到指定目录)pwd:显示当前工作目录的完整路径。mkdir:创建新目录。示例:mkdir new_directory(创建名为 new_directory 的目录)rmdir:删除空目录。示例:rmdir empty_directory(删除名为 empty_directory 的空目录)rm:删除文件或目录。示例:
2024-08-12 08:45:00 300
原创 机器学习之神经网络
神经网络(Neural Network)是一种模仿人类大脑的机器学习算法,由一系列相互连接的神经元组成。它能够自动学习数据的特征和规律,并对新的输入数据进行预测和分类。
2024-07-06 08:56:03 1049
原创 K-Nearest Neighbors (K-NN) 算法
K-NN 算法最早出现在 1951 年,由 Thomas Cover 和 Peter Hart 在他们的论文"Nearest Neighbor Pattern Classification"中首次提出。K-NN 算法的产生背景主要源于以下几个方面:在现实生活中,许多问题都可以归结为分类问题,比如医疗诊断、图像识别、文本分类等。 K-NN 算法作为一种简单有效的分类算法,很好地满足了这种需求。20世纪50年代,统计学习理论取得了较大进展,为机器学习算法的产生奠定了基础。K-NN 算法基于统计学习的思想,利用训
2024-07-06 08:45:00 852
原创 k8s常见组件之Kube-apiserver
总之,Kubernetes 的 API 接口为集群内外的各种应用程序提供了标准化的资源管理方式,使得 Kubernetes 具有良好的可扩展性和可编程性。Kube-apiserver 作为 API 接口的提供者,在整个 Kubernetes 系统中发挥着核心的作用。之后,其他 Kubernetes 组件(如 Kube-controller-manager、Kubelet 等)会监听 Deployment 对象的变化,并根据期望状态对集群进行相应的编排和调度。
2024-07-05 08:45:00 767
原创 算法解题之双指针
双指针技术是一种常见的算法设计思路,它通常适用于处理有序数组或链表等数据结构。双指针算法通过使用两个指针,同时从不同的方向遍历数组或链表,来解决一些特定的问题。
2024-07-05 08:45:00 1028
原创 k8s常用组件之pod
Pod 是声明式地定义的,用户只需要声明 Pod 的期望状态,Kubernetes 会负责将其实际状态调谐到期望状态。
2024-07-04 09:35:55 1248 1
原创 容器化之 Kubernetes (k8s)
Kubernetes 是一个开源的容器管理平台,由 Google 设计并开发,后捐赠给 Cloud Native Computing Foundation。它旨在提供一个灵活、可扩展的方式来部署和管理容器化的应用程序。
2024-07-04 08:45:00 1012
原创 讲讲多路复用
多路复用(Multiplexing)是一种在单个通信信道上同时传输多个信号的技术。它通过将不同的数据流混合到一个公共的通信信道中,从而提高了资源利用效率和系统性能。
2024-07-03 08:45:00 752
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人