小白狮ww
码龄1年
关注
提问 私信
  • 博客:14,968
    14,968
    总访问量
  • 31
    原创
  • 49,034
    排名
  • 175
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河北省
  • 加入CSDN时间: 2024-04-02
博客简介:

XLionXxxx的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    3
    当前总分
    280
    当月
    32
个人成就
  • 获得235次点赞
  • 内容获得1次评论
  • 获得215次收藏
创作历程
  • 31篇
    2024年
成就勋章
TA的专栏
  • 教程
    6篇
兴趣领域 设置
  • 人工智能
    数据挖掘语音识别计算机视觉目标检测机器学习人工智能深度学习自然语言处理word2vec机器翻译超分辨率重建迁移学习AI作画tf-idfstable diffusionYOLObard文心一言
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

高效语言模型 Parler-TTS 上线,一键完成文本转语音

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,根据需求选择「按量付费」或者「包日/周/月」,点击「审核并执行」。Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型,可以生成具有给定说话者风格的高质量、自然语音,自由度及创新性非常高,并且可以通过 Prompt 控制说话者的性别、音色、语调以及所处的场景(室内、室外、马路上、音乐厅等)。平台在克隆过程中已自动为我们配置好了模型文件,点击「下一步:选择算力」。
原创
发布博客 2024.11.19 ·
529 阅读 ·
4 点赞 ·
0 评论 ·
4 收藏

私人语音助手 Fish Speech:实现声音克隆及文本转语音

进入模型后,我们可以在「Input Text」中输入我们想要转为语音的文字,比如在里面输入「走得最急的,都是最美的风景;平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,点击「审核并执行」。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。如果选择「Reference Audic」,模型将会提供一个语音模板,用户上传一段音频,模型就会根据音频的音色来生成特定的语音。
原创
发布博客 2024.11.10 ·
351 阅读 ·
5 点赞 ·
0 评论 ·
9 收藏

Reader-LM 来袭:一键将 HTML 转换为 Markdown

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,点击「审核并执行」。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。进入之后,先在「Model」处选择模型,然后在「HTML」中输入一段文本,最后点击「Submit」生成。可以看到上方的一栏是由「Reader LM」生成的,下方一栏是由「Markdownify」生成的。平台在克隆过程中以自动为我们配置好了模型文件,点击「下一步:选择算力」。
原创
发布博客 2024.11.01 ·
213 阅读 ·
10 点赞 ·
0 评论 ·
3 收藏

IC-Light 图片打光神器,人人都能成为专业 P 图师

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,点击「审核并执行」。我们还可以选择光线模型,将背景图片删除,在「Background Source」中选择 Left Light(左侧光)或 Right Light(右侧光),然后点击「Relight」生成。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。该样例使用的是背景图片混合模型,我们可以更换其他的背景图片。
原创
发布博客 2024.10.24 ·
187 阅读 ·
5 点赞 ·
0 评论 ·
4 收藏

助力解析化学图像生成文本分析,化学大语言模型 ChemVLM 来啦!

该模型旨在解决化学图像理解与文本分析之间的不兼容问题,通过结合视觉 Transformer (ViT)、多层感知机 (MLP) 和大型语言模型 (LLM) 的优势,实现了对化学图像和文本的全面推理。可以看到模型针对图像准确描述了图像的内容是黄色的液氮罐,接着我们可以继续问它一个问题,比如我们输入「液氮的化学分子式是什么」。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A100的算力和 PyTorch 的镜像,点击「审核并执行」。确认模型信息无误后,点击「继续执行」。
原创
发布博客 2024.09.25 ·
245 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

打工人必备,一键完成 PDF 文档内容提取,帮你实现工作效率翻倍!!

此外,MinerU 也支持从包含广告等干扰信息的网页、电子书中快速解析和抽取正式内容,从而有效提高 AI 语料的准备效率。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090的算力和 PyTorch 的镜像,点击「审核并执行」。进入 Demo 页面后,我们就可以上传 PDF 文件来进行提取了,需要注意的是上传的 PDF 文件大小不要超过 5 兆。我们选择示例里的一篇论文进行演示。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。
原创
发布博客 2024.09.14 ·
331 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

表情迁移大法,LivePortrait 帮你快速处理图片!

平台会自动选择合适的算力资源和镜像版本,这里使用的是NVIDIA RTX 4090 的算力和 PyTorch 的镜像,点击「审核并执行」。首先是最上方的,我们可以在 Image 栏中插入图片,在 Video 栏中插入表情参考的视频,点击生成后,模型就可以生成一段图片中人物做出相应动作的视频。用户可以自动选择改变眉毛形状,嘴巴大小,是否做了 wink 动作以及微笑程度等来生成新的图片,同时我们也可以改变面部的整体位置。在下方参数栏中可以选择是更注重视频的表情或是动作以及动作的流畅程度等。
原创
发布博客 2024.09.10 ·
446 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

快速理解视频内容并回答问题,视频理解描述模型 Flash-VStream 上线!

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A6000的算力和 PyTorch 的镜像,点击「审核并执行」。上传好视频后,询问「Describe the video briefly」,让它来帮我们简单描述下视频内容,点击「Send」即可对视频内容进行提问。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。如果我们想上传新的视频进行对话,需要先点击「Clear history」,然后再上传新的视频。进入到教程界面后,点击右上角「克隆」。
原创
发布博客 2024.09.06 ·
220 阅读 ·
6 点赞 ·
0 评论 ·
5 收藏

单图生成 2D 和 3D 人物,高质量图像处理模型 CharacterGen来啦!

CharacterGen的另一个核心组成部分是基于Transformer的、可泛化的稀疏视图重建模型,它有助于从多视图图像创建详细的3D模型。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090算力和 PyTorch 的镜像,点击「审核并执行」。需要注意的是,如果我们想要生成 3D 模型,需要先完成 2D 生成再进行 3D 生成。可以看到模型生成了 4 个方向的姿态,点击「Generate 3D Mesh」生成 3D 模型。当返回一个新的终端后,接着输入「bash run.sh」。
原创
发布博客 2024.08.30 ·
395 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

超越 SD3的文生图神器!FLUX.1-schnell 一键部署教程,效果太牛了

FLUX.1 [schnell] 是迄今为止最先进的 few-step 模型,其表现不仅优于同类竞争对手,还优于 Midjourney v6.0 和 DALL·E 3 (HD) 等强大的非蒸馏模型。可以看到生成的图片质量还是很高的。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A6000的算力和 PyTorch 的镜像,点击「审核并执行」。Advanced Settings 提供了一些可以调整的参数,我们可以根据自己的需要去更改输出图片的长度或者宽度以及推理的步数等。
原创
发布博客 2024.08.29 ·
462 阅读 ·
8 点赞 ·
0 评论 ·
6 收藏

PhotoMaker V2 来了,快速生成高质量写真!

近期,PhotoMaker 出了 V2 版本,PhotoMaker V2 继承了 PhotoMaker V1 的良好特性,如高质量和多样化的生成能力,以及强大的文本控制,但在角色一致性和可控性上都有了大提升。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,点击「审核并执行」。:选择希望生成的图片的特点。这里需要注意的是,需要加上 img 这三个字母,因为这是模型的 trigger word,如果模型没有识别到就无法进行输出。
原创
发布博客 2024.08.26 ·
348 阅读 ·
6 点赞 ·
0 评论 ·
5 收藏

语音转文字神器!Whisper 可实现实时转录,打工人必备!

平台会自动为容器选配合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力资源和 PyTorch 的镜像,别忘了使用文章开头的邀请链接,get 免费时长!选择好后,点击「下一步:审核」即可。系统分配资源完成后,待状态显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。登录到 OpenBayes 平台后,打开「公共教程」,找到「Whisper Web 在线语音识别工具」的教程。平台在克隆过程中会自动为容器绑定所需要的数据,不需要我们再手动配置,直接点击「下一步:选择算力」。
原创
发布博客 2024.08.21 ·
679 阅读 ·
6 点赞 ·
0 评论 ·
2 收藏

Lvmin Zhang 新作!Paints-Undo 一键帮你拆解绘画过程

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,点击「下一步:审核」。* Operation Steps 可以选择不同的值,这里的值代表的是生成的关键帧的位置。值越大,生成的关键帧的图像与我们所给的图片越相近。登录到 OpenBayes 平台后,打开「公共教程」,找到「Paints-Undo -张图生成绘画全过程 Demc」的教程。* CFG Scale 表示图像的相关性,这里的值越小,生成图像的随机性就越大。我们选择下方的一个样例进行测试。
原创
发布博客 2024.08.15 ·
176 阅读 ·
8 点赞 ·
0 评论 ·
4 收藏

基于 GAN 的超分辨率处理方案,AuraSR 一键增强图像分辨率

论文中的一种变体:基于 GAN 的超分辨率处理方案,能够智能识别图片中的细节信息,并在放大图片的同时,自动补充缺失的细节。平台会自动选配合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,别忘了使用文章开头的邀请链接,get 免费时长!系统分配资源完成后,待状态显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。登录到 OpenBayes 平台后,打开「公共教程」,找到「AuraSR 基于 GAN 的超分辨率图像放大 Demo」的教程。
原创
发布博客 2024.08.13 ·
331 阅读 ·
5 点赞 ·
0 评论 ·
9 收藏

开源 AI 人像视频合成框架!MegActor 一键启动教程

系统分配资源完成后,待状态显示为「运行中」后,由于该项目需要额外的环境配置,在容器启动完成后项目会自动下载所需依赖,等待 5 至 6 分钟即可通过 API 地址进入该项目操作页面。平台会自动为模型选配好合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,别忘了使用文章开头的邀请链接,可以 get 免费时长!选择好后,点击「下一步:审核」即可。登录到 OpenBayes 平台后,打开「公共教程」,找到「MegActor 人像动画生成器 Demo」的教程。
原创
发布博客 2024.08.13 ·
338 阅读 ·
5 点赞 ·
0 评论 ·
1 收藏

代替 Midjourney?ComfyUI Stable DIffusion 3 运行教程

平台会自动为模型选择适配的算力资源和镜像版本,这里选择的算力是 NVIDIA RTX 4090 和 PyTorch 的镜像,别忘了使用开头的邀请码注册,Get 新用户免费的 RTX 4090,然后点击「下一步:审核」。登录到 OpenBayes 平台后,点击「公共教程」,找到「ComfyUl Stable Diffusion3 工作流在线教程」的教程。稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,点击 API 地址处的链接进入模型页面。进入到教程界面后,点击右上角「克隆」。
原创
发布博客 2024.08.05 ·
473 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

以视觉为中心的多模态大型语言模型 Cambrian-1 在线运行教程

返回工作空间,再打开一个新的终端,输入命令 bash model.sh ,当系统输出 Uvicorn running on 一个链接时表示模型已配置完成,然后我们返回到之前的模型 Demo 界面,点击刷新,可以看到可以选择模型了。稍等 15s 左右,打开一个新的终端,输入命令 bash gradio.sh,模型将会输出一个 Running on public URL 的链接,我们点击进入。模型较大,需要使用 A6000 运行,选择 A6000 算力和 PyTorch 镜像后,点击「下一步:审核」。
原创
发布博客 2024.07.26 ·
469 阅读 ·
3 点赞 ·
0 评论 ·
10 收藏

高分辨率框架 HiDiffusion 运行教程,快速生成高质量 8k 图像

这是一种无需训练即可提高预训练扩散模型的分辨率和速度的方法,通过将 HiDiffusion 应用于各种预训练的扩散模型,不仅可以将图像生成的分辨率提高至 4096×4096,而且能将图像生成速度提升 1.5 至 6 倍。上传一张参考图片后,通过输入正向提示词与逆向提示词进行图像的生成。首先上传一张需要修复的图像以及一张修复位置标记图,修复区域中的黑色区域是冻结的区域,表示我们不需要进行修改的区域,白色区域为需要修改的区域。生成图像中,第一张为原图像的轮廓,第二张为根据这个轮廓进行生成的图像。
原创
发布博客 2024.07.26 ·
670 阅读 ·
21 点赞 ·
0 评论 ·
19 收藏

强势超越 Llama3? Gemma2 中文版谷歌开源大模型 Gemma2-9B-Chinese-Chat 教程来了

进入 OpenBayes 平台后,打开「公共教程」,找到「一键部署 Gemma-2-9B-Chinese-Chat」的教程。比如我们输入「我的蓝牙耳机坏了,我该去看牙科还是耳鼻喉科」,它给我们的回答非常合理,中文理解能力非常优秀。Temperature 可以改变模型输出的随机性,Temperature 的值越大,模型的输出越随机;等待系统分配资源完成后,将鼠标悬停在「API 地址」处,点击上方链接即可进入 Demo 界面。算力选择 RTX 4090,别忘了使用链接注册哦,选择后直接点击「审核并执行」。
原创
发布博客 2024.07.19 ·
350 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

YOLOv10 目标检测算法使用教程

YOLOv10是由清华大学研究人员基于 Ultralytics Python 包开发的实时目标检测方法,旨在解决之前YOLO 版本在后处理和模型架构方面的不足,通过消除非最大抑制(NMS)和优化各种模型组件,YOLOv10 在显著降低计算开销的同时实现了最先进的性能。登录到 OpenBayes 平台后,点击「公共教程」,在公共教程中找到「YOLOv10 实时端到端物体检测」的教程。算力选择 4090,有免费的赠送时长,选择 PyTorch 镜像后,点击「下一步:审核」,「继续执行」。
原创
发布博客 2024.07.12 ·
258 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏
加载更多