- 博客(47)
- 收藏
- 关注
原创 超GPT3.5性能,无限长文本,超强RAG三件套,MiniCPM3-4B模型分享
MiniCPM3-4B是由面壁智能推出的一个高性能的端侧AI大模型。MiniCPM3-4B具备32k的上下文窗口,这意味着它可以处理更长的文本序列,这对于需要长时间依赖关系的任务尤其重要。MiniCPM3-4B通过使用LLMxMapReduce技术,MiniCPM3-4B能够有效地扩展其上下文理解能力,处理无限长的文本。该模型还具备强大的功能拓展性,如完整的system prompt function calling和code interpreter等能力,使其能够轻松连接外部工具和系统,提供更加便捷
2024-10-14 06:00:00
719
原创 支持超高分辨率图片生成,UltraPixel模型分享
UltraPixel模型是一种先进的超高分辨率图像合成解决方案,它通过创新的架构设计和高效的参数共享机制,成功解决了传统方法在超高分辨率图像生成领域面临的多个挑战。UltraPixel采用了一种独特的级联扩散模型结构,能够在单一模型中实现多分辨率的图像生成,从较低的1K分辨率一直到较高的6K分辨率。UltraPixel集成了一个高压缩比和对分辨率变化具有鲁棒性的自解码器,这保证了无论是在哪种分辨率下生成图像都能保持高质量。
2024-09-30 06:00:00
733
原创 在实时语音交互上超过GPT-4o,端到端语音模型Mini-Omni部署
Mini-Omni是一个专注于音频的端到端会话模型,能够实现实时的语音输入和流式音频输出。这意味着Mini-Omni能够在对话中同时处理语音和文本,而无需依赖额外的自动语音识别(ASR)或文本到语音(TTS)系统。Mini-Omni模型采用了一种文本指导的语音生成方法,结合了批量并行策略,以进一步提升性能。Mini-Omni的架构通过引入适配器来增强音频处理能力,并能够并行生成文本和音频令牌。此外,模型还采用了流式解码技术,以支持实时交互。
2024-09-27 06:00:00
695
原创 超越sora,最新文生视频CogVideoX-5b模型分享
CogVideoX-5B 是由智谱AI开发的一款视频生成大模型,它是在先前版本CogVideoX-2B的基础上进行的重大升级。这一版本不仅提高了视频生成的质量,增强了视觉效果,而且还通过优化推理性能,降低了运行所需的硬件门槛,使得更多用户能够在现有的硬件条件下使用这一先进的技术。CogVideoX-5B模型采用了3D因果变分自编码器(3D causal VAE)和专家Transformer技术,结合文本和视频嵌入,使用3D-RoPE作为位置编码,并利用3D全注意力机制进行时空联合建模。
2024-09-23 06:00:00
764
原创 最新动态一致的文生视频大模型FancyVideo部署
FancyVideo是由360AI团队与中山大学联合开发的一种创新视频生成模型。FancyVideo模型基于UNet架构,旨在解决现有视频生成模型在动作连贯性和情节流畅性方面存在的问题。FancyVideo通过引入跨帧文本引导模块(Cross-frame Textual Guidance Module, CTGM)来改进现有的文本控制机制。实验结果表明,FancyVideo在EvalCrafter Benchmark上的定量评估和其他T2V模型相比,在视频生成质量、文本一致性、运动性和时序一致性方面均
2024-09-20 06:00:00
439
原创 最新腾讯高精度动作模仿模型MimicMotion分享
MimicMotion是由腾讯公司研发的一项可控视频生成框架,旨在生成高质量、长时序且与目标姿态相符的人体动作视频。MimicMotion通过置信度感知的姿态引导技术,可以生成任意长度的高质量视频,并且能够实现时间上的平滑过渡。MimicMotion通过使用复杂的算法确保了生成视频的质量,包括减少图像失真、提升人像手部动作的真实感等。MimicMotion 项目展示了在人工智能视频生成领域的显著进步,特别是在处理长视频和复杂动作时的能力。随着技术的不断发展和优化,预期 MimicMotion 将在动
2024-09-18 06:00:00
1125
原创 最新融合多模态的理解和生成的大一统transform架构,show-o模型部署
Show-o模型是一个由字节跳动和新加坡国立大学联合发布的统一多模态理解和生成模型。Show-o通过结合自回归和(离散)扩散建模,能够在不同的模态间进行灵活转换,处理视觉问答、文本到图像生成、文本引导的修复/外推等多种任务。Show-o采用了一个统一的Transformer架构来处理多模态任务,这使得模型可以在不同的任务之间共享参数,从而减少了训练成本并提高了模型的泛化能力。与传统的自回归模型相比,Show-o能够根据输入和输出的模态自适应地调整其处理方式,这种灵活性使其在处理混合模态数据时表现出色。
2024-09-13 06:00:00
595
一个Delphi的示例代码
2024-06-30
一个acm比赛的c++代码
2024-06-30
一个后端开发的c++代码
2024-06-30
一个sql的示例代码案例
2024-06-30
一个visualbasic的示例代码
2024-06-30
网络安全示例的python代码
2024-06-30
; Hello.asm ; 一个简单的DOS环境下的汇编程序,用于显示"Hello, World!" ; 汇编器指令,定义使用
2024-06-30
基础的离散PID控制器
2024-06-22
Python爬虫示例代码
2024-06-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅