自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(218)
  • 收藏
  • 关注

原创 全网最强数字人大盘点,一口气看完!(整合包)

MuseTalk是腾讯推出的一款数字人项目,支持实时音频驱动的唇部同步数字人,MuseTalk的核心技术能根据音频信号自动调整数字人物的面部图像,确保唇形与音频内容高度一致,只需输入音频,你的数字角色就能实现完美的口型同步。:相比Hallo,LivePortrait生成的数字人效果不但好,而且,对于配置要求也降低了很多,据我的评测,需要8G显存的显卡即可流畅运行,6G显存也可运行。:Hallo生成的数字人效果虽然好,但真的,它非常吃机器性能,据我的评测,需要10G显存以上的显卡才能跑得动。

2024-07-19 11:31:18 538

原创 开源最强数字人又又又来了,无所谓,我又出手了!(全网首发)

它不仅可以独立使用音频或面部关键点生成肖像视频,更可以通过音频和选定的面部关键点的组合,创造出更加丰富、细腻的动态效果。随着AI技术的飞速发展,开源数字人技术的竞争愈发激烈,各大厂纷纷亮出自家的王牌产品。这不,继百度的Halo、快手的LivePortrait之后,阿里也重磅推出了他们引以为傲的数字人——EchoMimic。EchoMimic的诞生,不仅仅是阿里在数字人领域的一次尝试,更是对现有技术的一次革新。以下是我亲测,使用EchoMimic生成的数字人,效果非常强悍,感兴趣的友友们,千万不要错过哦~

2024-07-17 10:47:54 948

原创 开源最强数字人,一键整合包来啦!

LivePortrait的神奇之处在于,它不仅能够精确控制眼睛的注视方向和嘴唇的开合动作,还能处理多个人物肖像的无缝拼接。你可以将不同的人物特征合并到一个视频中,而且这些人物之间的过渡将平滑自然,不会产生任何突兀的边界效果。更令人惊叹的是,它在RTX 4090 GPU上的生成速度达到了每帧12.8毫秒,这比现有的扩散模型方法快了不止一星半点。快手的LivePortrait项目,不仅仅是一项技术的突破,更是一次创意的革命。最近,不仅快手的可灵异常火爆,快手更是开源了一个让人惊艳的数字人项目——

2024-07-12 16:08:12 212

原创 喂饭级AI语音生成神器Plus版来了!(懒人包)

按钮,等待处理即可,处理速度非常快,在底部可以看到合成的全新音频了。经过我的测试,生成的语音效果也非常强哦,拿去做数字人的音频,或者直接合成一些音频内容,比如电子书,都是非常棒的选择!有不少AI工具可以合成语音,但要不就是收费的,要不就是在网页端使用,有隐私泄露风险。最突出的功能是情感合成,允许你创建具有多种情感的语音,包括快乐、兴奋、悲伤、愤怒等,而且可以直接通过提示词来控制情感;老规矩,大家自行在本地部署比较麻烦,已经为大家制作好了一款离线整合包了,下载到本地解压即用。,能合成不同情感的语音。

2024-07-11 15:47:01 175

原创 指哪打哪,重绘神器!我已出手…

MimicBrush实现了真正的零样本图像编辑,你不需要提供原始目标图像,只需提供一个包含期望效果的参考图像,MimicBrush就能通过参考仿制的方式实现编辑效果。MimicBrush的神奇之处在于,它能让你轻松地在一张图片上指定需要编辑的区域,然后用另一张图片的风格来进行局部重绘。,它的问世,无疑给图像编辑领域带来了一场革命,它就像魔法师手中的魔杖,轻轻一挥,就能让图片焕然一新。等待片刻即可看到生成的全新图片,以下是我亲测的生成结果,可玩度很高,感兴趣的朋友,千万不要错过哦~】,免费获得本文资源~

2024-07-02 13:07:27 443

原创 免费!AI视频一键转绘,​哎哟不错哦~

它通过一个智能的“特征银行”,存储了之前帧的信息,这样在处理新帧时,就能快速调用这些信息,大大提升了处理速度和效率。而且,它还能和最新的图像扩散模型无缝对接,无需任何微调,就能展现出惊人的适应性和效率。它不仅开启了视频处理的新纪元,更以其独特的技术魅力,将实时视频转换技术推向了一个全新的高度。你正在看一个视频,突然间,视频中的人物换了张脸,或者整个场景风格大变,这不再是科幻电影里的场景,StreamV2V让它变成了现实。,它基于一种神奇的扩散模型,实现了视频到视频的一键转绘。3. 选择你喜欢的风格。

2024-06-25 10:31:39 328

原创 爆了!5个yyds的开源项目!

界面简洁,操作直观,而且功能多多,比如BT和磁力链任务、选择性下载BT部分文件、多任务同时下载、64线程下载、限速设置、下载完成通知等等。如果你是Windows用户,那么这个鼠标手势工具WGestures绝对不容错过,它支持Windows 7/8/10/11系统,让你的鼠标操作更加高效。朋友们,今天我要来跟大家聊聊几个超级棒的开源项目,简直是yyds级别,绝对让你眼前一亮!这是一个开源插件,可以在紧急情况下快速提交你的本地代码,让你的代码安全无忧。,都有哪些项目是大家感兴趣的,我们尽快安排制作整合包~

2024-06-24 10:16:01 325

原创 3个火火火的AI项目,开源了!

不仅如此,这个模型还能够理解语音的上下文,能够生成高度表现力和多样化的语音,让小说和推文都充满了情感和生动感。友友们,今天我要给你们安利三个超酷的开源项目,它们都和AI有关,而且每一个都能让你的日常生活变得更加有趣和便捷!一个充满乐趣的AI角色扮演项目——SillyTavern,在这个项目中,你可以自己创建各种角色,然后通过聊天或角色扮演与这些自定义的角色进行互动。开源社区是一个充满创意和分享的地方,我们每个人都可以在这里找到属于自己的乐趣,也可以贡献自己的力量。接下来,我要介绍的是一个叫做。

2024-06-18 10:36:20 415

原创 AI绘画界的赛博佛祖,开源最强SD3它来了!(整合包)

这一次,Stability AI不仅再次证明了他们在AI绘画界的领先地位,更以慷慨的开源精神,将先进的AI技术无偿分享给了全球的用户和开发者。加载成功后,项目会自动打开一个简单的用户界面,接下来在右侧点击“Load”按钮,将下载的SD3工作流文件导入(大家别忘了下载哈),其余配置采用默认即可。:与AMD和NVIDIA®进行了优化,确保了在最新的APU、消费级GPU及企业级GPU上的性能,大大增强了其图像生成的效率和质量。这次发布的是Medium版本,在多个方面展现出惊人的能力和效率,堪称。

2024-06-17 11:29:30 489

原创 洋人道歉,「国产」出品,全球最强端侧多模态大模型!(懒人包)

面壁智能的首席科学家刘知远教授在知乎上发表言论,直指Llama3-V实质上是对他们的MiniCPM-Llama3-V 2.5的一个简单“套壳”。在舆论的压力和事实的推动下,Llama3-V的作者团队不得不删除了相关评论,并最终发表公开道歉,承认了其行为,并将Llama3-V从各大平台撤下。它的成功,不仅是技术的胜利,也是中国AI在全球舞台上的一次重要展示。:MiniCPM-Llama3-V 2.5在复杂图像和文本的识别与理解上有着出色的表现,无论是长图、难图还是长文本,都能精准识别,解码效率大大提高。

2024-06-14 16:01:25 453

原创 开源超闭源?ChatGPT危!

Qwen2的影响力远不止于此,它的API已经集成到了阿里云的百炼平台,同时,全球众多开源平台和工具也迅速宣布支持Qwen2,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等。Qwen2的72B模型,其性能不仅超过了国外知名的Llama3-70B模型,还超越了多个国内的闭源大模型,如文心4、Moonshot-v1-8K等。说你行你就行,不行也行,说你不行,行也不行。】,免费获得本文资源~

2024-06-13 10:24:17 574

原创 标星好多好多k,这2个开源项目绝了!

在这个信息爆炸的世代,不妨让我给大家精选并介绍一些优质的开源项目,让大家感受到开源世界的美好。

2024-06-13 10:16:41 388

原创 清华出品,开源最强,我又出手了(全网首发!)

他们不仅引入了大语言模型进入数据筛选流程,进行了高达10T的高质量多语言数据训练,数据量是ChatGLM3-6B模型的三倍以上,还采用了FP8技术进行高效的预训练,训练效率提高了惊人的3.5倍。多模态能力也得到了提升,新推出的GLM-4V-9B能够处理高达1120 x 1120分辨率的输入,这在降低计算和部署开销的同时,还保持了出色的文本和图像处理能力。②在长文本能力上,GLM-4-9B模型的上下文处理能力从128K扩展到了1M token,可以同时处理高达200万字的输入,相当于两本《红楼梦》的长度!

2024-06-11 11:24:27 301

原创 这3个牛哄哄的AI项目开源了!

只需提供开始和结束的两帧图片,ToonCrafter就能自动生成中间的动画帧,实现平滑的过渡效果。AI技术的崛起,无疑是科技发展史上的一座里程碑,很可能是第四次工业革命的代表。传统动画制作的流程繁琐,著名的动画大师宫崎骏一直保持着手绘制作动画电影的习惯,比如时长119分钟的《哈尔的移动城堡》,总共手绘了14.8万张的画稿!它支持在高达20FPS的帧率下,进行视频到视频的转换,实现实时效果。这三个项目,无疑都是AI领域的佼佼者。未来,随着技术的进一步发展,我们有理由相信,AI将在更多领域展现其独特的魅力。

2024-06-07 11:58:07 368

原创 开源最强文本转语音AI,免费懒人包它来了!

这个项目的火爆程度可不是盖的,自发布以来,短短几天时间内,其在 GitHub 上的Star数量已破万,作者本人甚至豪言,ChatTTS突破了开源天花板,我亲测了一下,真的很强!这款模型不仅在语言处理上展现了强大的实力,还引入了一系列细粒度控制功能,如笑声、停顿、语气词的插入,极大地丰富了语音的表达性和真实感。4. 智能客服系统:利用ChatTTS,企业可以打造出能够流畅对话的智能客服系统,不仅可以提供标准答案,还可以根据客户的情绪和反应进行适当的调整和响应。1. 在文本框中输入你想要转换的文案。

2024-06-04 15:43:37 485 1

原创 免费!手把手教你用扣子搭建个人知识库

构建一个个人知识库,不仅可以帮助我们更好地存储这些信息,还能在我们需要的时候提供快速的搜索和回答,极大地提高我们的工作效率和学习效率。很多人都在寻找一个高效的方式来构建个人知识库,好消息是,随着AI大模型的兴起,每个人都有机会拥有一个熟悉自身的专属AI助手。通过扣子,你可以非常容易地搭建起一个属于自己的AI知识库,无需复杂的编程技能,就可以享受到大数据时代的便捷。这样,后续你提出问题时,Bot会优先搜索你的个人知识库来提供答案,记得要把修改后的bot,重新发布一下哦~),将你的知识库添加到Bot中。

2024-06-03 15:54:14 540

原创 手机“本地”也能玩转AI大模型 - 万物皆可AI

随着AI技术的不断进步,MiniCPM-V的推出无疑为我们打开了一个全新的世界,一个我们可以在手机上直接与高级AI模型互动的世界。在OCR的性能测试中,MiniCPM-V可以处理高达180万像素的图像,并且在OCRBench的测试中得分高达725分,超越了许多知名的商用闭源模型,如GPT-4o和Gemini Pro。,可以说它将AI技术的应用推向了一个全新的高度,让我们能够将GPT-4V级的多模态大模型直接部署在我们的手机上,而且完全不需要联网,真正的手机本地玩AI大模型,万物皆可AI!

2024-05-29 12:08:45 378

原创 免费无限换脸,火了,图片/视频/直播都行!

效果预览 (Preview):完成上述两步后,软件会自动开始运行,之后会把换脸预览显示在这个区域。设置人脸(Source):点击这个区域,打开文件管理器,选择一张带清晰完整人脸图片就可以了(注意图片名字用英文或数字)。查看结果(OUTPUT):换脸成功之后,最终结果显示在output这里,点击右上角的下载图标,就可以把结果保存到本地。大家按需选择后,点击生成,即可开始体验,下图是我实测的换脸效果,简直太强大了!设置目标(Target):点击这个区域,选择待换脸的目标图片,或者视频。

2024-05-28 11:17:24 772

原创 爽!AI手绘变插画,接单赚爆了!

字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,是图像处理和机器学习领域的一项重要突破,它通过一种创新的方法显著提升了模型在各个推理步骤下的性能,同时保持模型体积的精简。这不仅展示了字节跳动在图像模型蒸馏技术方面的领先地位,也为整个人工智能社区提供了一种全新的工具,用于提升模型的推理效率和性能。的AI项目,可以实现一键手绘变插画的功能,而且它搭载了字节出品的超快速生成图片的AI大模型Hyper-SD15,可以实现几乎实时生成图片,有了它,拿去接一些手绘商单分分钟出图,简直赚爆了!

2024-05-26 15:23:18 470

原创 手把手教你,让Kimi做你的专属AI客服,免费

选择发布平台,可以看到有微信公众号(服务号)、微信公众号(订阅号),一般大家需要发布到订阅号上,需要完成配置,因此点击订阅号 的【配置】按钮。接下来,在Bot的设置界面,选择中间顶部的模型选项卡,在弹出的模型设置窗口中选择“moonshot(128k)”,这是Kimi使用的模型,已经被优化用于中文和长文本深度理解。通过今天的教程,你不仅可以学会如何搭建一个AI客服,更重要的是,你可以看到AI技术如何在实际场景中应用,提高我们的工作效率和服务水平。回到之前的弹窗,输入复制的AppID,继续发布。

2024-05-23 11:39:10 287

原创 杀疯了!首个懂中文的AI绘画大模型——混元DiT它来了(整合包)

混元-DiT不仅为中文用户带来了前所未有的便利,也为全球的创作者开辟了新的可能性。无论是中文的成语还是中国传统文化,如古诗文,这款模型都能精准捕捉其精髓,并在生成的图像中完美呈现。:混元-DiT能够捕捉到文本中的细节,并精确地反映在生成的图像中。可以说,用户的每一个小要求都能被注意到并得到满足,无论是特定的情绪色彩还是复杂的场景布局。特别值得一提的是,混元-DiT生成图片的效果也特别好,在文生图(文本到图像)的领域表现出了非常显著的优势,甚至在多个方面超越了著名的SDXL模型。关注公众号Glen,回复【

2024-05-22 10:24:50 556

原创 字节跳动震撼出品 - 单图即可克隆你的专属数字分身PuLID

然而,传统的方法需要对每个不同的身份进行繁琐的调整,既费时又昂贵。AI时代来了,字节跳动仍然是非常刚猛,开源闭源齐下阵,前不久闭源大模型豆包降价99%,把大模型价格疯狂打了下来。下面是我亲测,使用同一张图像作为参考,生成的不同风格人像。PuLID技术的另一个吸引人之处在于,它能够尽可能地保持图像元素的一致性,包括背景、光照、构图和风格等。与传统方法相比,PuLID技术在保持高身份保真度的同时,最大限度地减少了对原始图像风格和背景的干扰。为了方便大家的使用,我又出手了,为大家制作了一款离线整合包。

2024-05-20 12:12:34 421

原创 AI一键就能画漫画了?AI又换了个领域大杀特杀!

只需简单提供一个故事大纲,StoryDiffusion便能将其转化为一部流畅的漫画或视频,这对于各种规模的内容创作者来说,都是一种极大的助力。StoryDiffusion不仅仅是一款AI工具,它更是打开创意大门的钥匙,这种方式将极大地释放创作者的创意潜力,无需复杂的绘图技能,任何人都可以成为故事的创造者,甚至已经听说有人拿来在小红书上接单赚钱了!如果你也对内容创作充满热情,不妨试试这款工具,也许下一个受欢迎的漫画或视频故事的作者就是你!:用户首先需要选择一个合适的预训练模型,这将是生成故事的基础。

2024-05-17 10:33:55 449

原创 地表最强ChatGPT爆了!我来告诉你,它都有什么用

OpenAI刚刚发布了全新的 "GPT-4o",它不仅可以通过语音、视觉和文本进行推理,还在速度和价格上有了巨大的突破。GPT-4o的强大不仅体现在语言处理上,它还可以充当盲人的眼睛,为盲人提供实时的指路服务。接下来,我将带大家看看GPT-4o的一些可能的应用场景,这些场景将如何颠覆我们的日常生活。孩子在学习时遇到难题,GPT-4o 可以直接读取屏幕上的题目,通过语音与孩子和家长实时互动,迅速解决问题。GPT-4o配备了一个全新的语音助手,不仅能够处理中断,还能实时响应,甚至可以捕捉到使用者的情绪。

2024-05-16 09:51:50 338

原创 注入灵魂 - AI一键照片打光IC-Light

之后即可看到处理后的图片,当你看到处理后的图片时,你会惊叹于IC-Light如何给你的照片“注入灵魂”,能让一些开始很AI味的图片,也真实了起来,仿佛你置身于一个全新的世界!这款工具利用先进的机器学习技术,能够根据简单的文本提示或背景图像,调整照片的光照效果,使其与新环境或设定的氛围完美融合。:通过输入描述性的文字,如“温暖的阳光”、“昏暗的灯光”,IC-Light可以生成具有特定光照氛围的图像。:如果你有特定的背景图,IC-Light能根据这一背景调整前景物体的光照,创造出和谐的视觉效果。

2024-05-15 09:43:54 501

原创 免费无限换脸 - 最强AI换脸Facefusion整合包最新版来啦!

①该项目建议使用英伟达显卡运行(该版本做了优化,1080等老显卡应该也可以跑,大家可以自行测试一下),CPU也能跑,可以在界面中选择使用CPU还是GPU运行。FaceFusion不仅仅是一款换脸软件,它更是一个多功能的数字人和实时直播助手,真正开启了个性化媒体的新时代。为了方便用户,我特别为大家准备了一个离线懒人包,包含了所有必要的文件和配置,你只需简单几步,就可以开始使用FaceFusion!:更新后的版本优化了对显卡的需求,使得即使是显存较小的电脑也能快速运行,这让更多的用户能够体验到AI换脸的魔力。

2024-05-14 10:18:00 837

原创 疯狂为你省钱 - Al一键虚拟试衣整合包

通过这样的工具,大家可以在没有实际模特的情况下,以更低的成本和更高的效率展示他们的产品。对于追求效率和成本效益的商家来说,OMS-Diffusion无疑是一种值得尝试的新兴技术,感兴趣的朋友,千万不要错过!这种技术的应用,不仅节省了成本,还加速了新服装上市的速度,让消费者能更直观地看到服装的实际穿着效果。如果你手头有更高效的工具或权重,如SAM,不妨尝试替换它,以实现更清晰的背景分离效果。在今天的数字时代,中小服装商家以及各种带货人,面临着各种挑战,其中之一就是模特拍摄的高成本。】,免费获得本文资源~

2024-05-13 12:09:43 918

原创 火遍全网的“黏土滤镜”一键整合包 - 免费给大家安排!

简单来说,黏土滤镜是一种AI图像处理技术,它通过分析上传的照片,模仿黏土动画中的质感和视觉风格,将照片中的人物、动物或风景转换成仿佛由黏土塑造出的形象。无论你是想为自己的社交媒体增添一些创意图片,还是想探索AI图像处理的魅力,这个黏土滤镜的离线包都将是一个不错的选择。其中,Remini这款应用率先推出了这一功能,提供了一周的免费试用,不过需要注意的是,过后若要继续使用,则需要进行订阅付费,并且用户还需考虑上传图片时的隐私风险。为了方便大家的使用,我又出手了,为大家制作了一款离线整合包。

2024-05-09 11:43:30 335

原创 霸榜!近期不容错过的3个AI开源项目,来了

在人工智能领域的迅速发展下,各种AI开源项目如雨后春笋般涌现,今天就来为大家介绍近期三个热门的AI开源项目,它们不仅技术前沿,而且非常实用,对于技术爱好者和业界专家来说,绝对不容错过。技术的进步正在推动各行各业的变革,而这些开源项目正是这种变革的最前沿,这些AI开源项目有可能为你的工作带来革命性的改变。无论是在线直播还是线下推广,这个模型都是商家的得力助手。这是一个利用人工智能进行商品销售的模型,它可以根据商品的特点制定精确的推广策略,并用生动的语言描述产品,极大地激发消费者的购买欲望。

2024-05-09 11:35:20 439

原创 AI绘图神器!InstantStyle保留风格进行文本到图像生成

第一种技术是利用CLIP的全局特征来进行内容的提取,这意味着它可以从任何给定的图像中清晰地区分出内容与风格,从而避免了所谓的“内容泄露”现象。最近,一个名为InstantStyle的全新框架引起了广泛关注,它是一个创新的文本到图像生成框架,其核心功能在于能够有效地分离风格与内容,保留风格进行文本到图像生成,为创意工作者提供了前所未有的自由和灵活性。通过InstantStyle,我们不仅看到了AI技术在艺术创作中的应用,更看到了技术如何帮助人们突破传统的限制,开启创造力的新纪元。感兴趣的朋友,快去看看吧~

2024-05-08 11:28:50 440

原创 字节跳动最新力作:最先进的AI绘画加速技术(之一)

这不仅展示了字节跳动在图像模型蒸馏技术方面的领先地位,也为整个人工智能社区提供了一种新的工具,可以用于提升模型的推理效率和性能。在今天的高速发展的AI领域中,字节跳动的Lightning团队再次引领科技前沿,他们发布了一种革命性的图像处理技术——Hyper-SD图像模型蒸馏算法,甚至能做到实时快速生成图片。Hyper-SD利用了一种独特的“分段轨迹一致性蒸馏”技术,这意味着它可以在确保原始ODE轨迹完整性的同时,进行有效的信息提取和模型优化。为了方便大家的使用,我又出手了,为大家制作了一款离线整合包。

2024-05-07 11:54:41 265

原创 阿里巴巴出品 - FunClip自动化短视频编辑,自动高效,节省时间!

这意味着,无论视频中的对话有多快,FunClip都能够轻松捕捉并转化为可编辑的文本,大大提高了剪辑的效率和准确性。此外,FunClip支持多段剪辑功能,用户可以自由组合视频中的多个片段,创作出结构更丰富、内容更充实的视频作品。无论你是视频制作新手,还是寻求提高工作效率的专业人士,FunClip都能帮你轻松应对各种剪辑挑战,释放你的创造力。它集成了先进的CAM++说话人识别模型,可以识别视频中不同说话人的声音,并允许用户只裁剪特定说话人的视频段落,这在制作访谈或多人对话的视频时尤其方便。大家下载解压到本地。

2024-05-06 15:47:28 699

原创 最强开源大模型Llama-3中文特别版来了!

llama3-Chinese-chat”是一个由开发者Ke Bai创建的GitHub项,这个项目基于Meta的Llama-3-8B-Instruct模型进行了微调,专门优化了中文处理的效果。最近,Meta公司再次引起了技术界的广泛关注,他们推出了新一代开源大模型——Llama 3,这个模型不仅提高了技术的可访问性,也为AI的未来开辟了新的道路。Llama 3在发布时包括了两个版本,8B和70B,这两个模型的规模巨大,性能强大,分别对标业界的顶尖AI模型。加载成功后,项目会自动打开浏览器加载主界面。

2024-05-01 09:05:12 639 1

原创 马赛克,克星,又火一个,懒人包!

所以,如果你对高效、便捷的图像处理感兴趣,不妨试试这款工具,它定将为你的图像处理带来革命性的改变。但有了InstructIR,你只需要输入如“请帮我清除照片中的雨滴并保持图像清晰”这样的自然语言指令,这款工具就能自动为你呈现一张清晰如初的照片!这不仅仅是一个普通的图像处理工具,而是一种革命性的技术,能够通过简单的人类书面指令,对各种退化的图像进行高质量的恢复。”,整个程序就会自动运行。我使用了“提升图片亮度”的提示词,上传了一张较为昏暗的图片,处理后的效果非常令人满意,细节更加清晰可见。

2024-04-28 11:09:38 381

原创 AI全自动公司?AI生成、运营、迭代优化,难道这就是未来吗?

这个想法听起来像是科幻小说中的情节,但随着AI技术的飞速发展,这种场景可能不久的将来就会成为现实。这种AI的应用将极大地降低编程的门槛,使非技术背景的人也能实现自己的创意。此外,这样的技术也将推动个性化和定制化产品的发展。OpenCodeInterpreter作为一种开创性的工具,它利用了名为Code-Feedback的独特数据集,包含了68K多轮的交互,用户的指令和编译器的反馈一应俱全。在这个AI的浪潮中,各种创意和奇思妙想不断涌现,甚至有人开创了全员AI的公司,自动炒股,听起来是不是非常科幻?

2024-04-27 09:12:05 344

原创 爽!极品AI大模型,抓紧收藏!

这些模型利用了DeepSeekAI自研的语言模型DeepSeek-LLM和视觉编码器SigLIP-L的组合,能够处理不同分辨率的图像输入,其中70亿参数规模的模型支持1024×1024分辨率图像的输入,而13亿参数规模的模型支持384×384分辨率图像输入。特别是70亿参数的DeepSeek-VL-7B模型,在多模态理解能力评测数据集上取得了领先的成绩,证明了其在高精度多模态任务处理上的优势。下图是我亲测的该大模型可以识别图片的内容,并给出回答,输入提示词:跟使用其他AI大模型一样,输入图片,输入提示词。

2024-04-23 16:16:23 249

原创 震撼发布 - 本地运行最强开源大模型Llama 3整合包,创作无限可能!

③打开页面后,首选选择“Model”选项卡,在Model中,选择“Meta-Llama-3-8B-Instruct.Q8_0.gguf”模型文件,继续点击“Load”,等待模型加载。与Llama-2相比,Llama-3使用了15T tokens的训练数据,在推理、数学、代码生成、指令跟踪等能力获得大幅度提升。Llama-3-8B:与之前一个版本的Llama 2 70B一样强大,在参数量小了接近10倍的情况下,性能竟然基本一致,而且可以在消费级显卡上愉快地玩耍。制作,老规矩,还是无套路直接分享给大家。

2024-04-21 10:07:07 987

原创 最强AI换脸软件Facefusion又又又更新啦,支持直播实时换脸!

号称“下一代换脸和数字人生成神器”的Facefusion软件在2024年4月13日发布了最新的2.5.0版本,带来了一系列的更新和改进,使得人脸融合和分析技术更加易用和高效。:集成了ddcolor和deoldify模型,引入了帧着色器功能,能够为黑白视频帧添加颜色,使其看起来更加生动。:换脸成功之后,最终结果显示在output这里,点击右上角的下载图标,就可以把结果保存到本地。:进行了实验性的功能拓展,支持5到68个人脸特征点的估计,增强了面部追踪的精度。:点击这个区域,选择待换脸的目标图片,或者视频。

2024-04-19 16:16:40 1408 3

原创 家人们,谁懂啊?高品质毛茸茸萌物生成专用模型,谁不爱啊!

SeaArt-Furry-XL-1.0旨在为毛茸茸爱好者和艺术家提供准确而详细的生成工具,鼓励合作以丰富毛茸茸的生态系统。那今天给大家分享一个萌物生成专用模型SeaArt-Furry-XL-1.0,专注于高品质毛茸茸艺术图像创作,让你爱不释手,停不下来!②双击一键启动程序后,会打开一个命令提示窗口,项目会自动运行。项目运行一段时间后,会在右侧展示出生成的图片,下图是我亲测生成的萌物图片,不但质量高,清晰度还非常好。老规矩,大家自行在本地部署比较麻烦,已经为大家制作好了一款离线整合包了,下载到本地解压即用。

2024-04-17 09:58:44 241

原创 免费无限换脸神器Facefusion最新版(支持数字人)

Facefusion新版本升级了人脸解析能力,并且支持由图片生成数字人。下面重点介绍一下升级的功能点。

2024-04-16 15:55:09 738

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除