glenji
码龄10年
关注
提问 私信
  • 博客:295,750
    295,750
    总访问量
  • 216
    原创
  • 19,456
    排名
  • 366
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2014-08-06
查看详细资料
  • 原力等级
    成就
    当前等级
    4
    当前总分
    689
    当月
    3
个人成就
  • 获得347次点赞
  • 内容获得15次评论
  • 获得607次收藏
  • 代码片获得1,108次分享
创作历程
  • 46篇
    2024年
  • 12篇
    2022年
  • 25篇
    2015年
  • 138篇
    2014年
成就勋章
TA的专栏
  • AI
    45篇
  • Python基础
    12篇
  • 编程基本功
    64篇
  • C++基础复习
    8篇
  • 排序算法
    2篇
  • 数据结构
  • 计算机网络
    7篇
  • Oracle
    1篇
  • 心得体会
    49篇
  • 笔试面试
    12篇
  • 产品经理
    14篇
  • Android
    7篇
兴趣领域 设置
  • Python
    python
  • 大数据
    sql
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

180人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

开源最强AI视频生成加速版!(整合包)

智谱AI秉承“以先进技术,服务全球开发者”的理念,宣布将与「清影」同源的视频生成模型——CogVideoX开源,以期让每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。让一部分人,看见AI并连接。经过我亲测,运行期间显存要求大幅降低到了15G左右,在开启虚拟显存的情况下,甚至8G、10G显存的民用级显卡,也是可以运行的哟~(这个决定在AI领域引起了不小的震动,因为它打破了目前主流AI视频模型闭源的现状,为AI技术的普及和创新提供了新的可能性。
原创
发布博客 2024.08.13 ·
1003 阅读 ·
23 点赞 ·
0 评论 ·
20 收藏

爆火二次元跳舞小姐姐 - AI免费无限生成!

Diffutoon 是一款由阿里巴巴达摩院开源的视频转动漫AI工具,它可以将真人视频转换成动漫风格,它能够处理极高分辨率和快速运动的视频。通过逆向扩散过程,扩散模型能够从简单分布中的一个点开始,逐步将其扩散到期望的复杂数据分布,从而生成新的数据样本。Diffutoon 的出现,为视频创作带来了新的可能性,让创作者可以轻松创作出具有动漫风格的视频作品。据我了解,用SD、Comfyui等工具,也可以做出来这种效果的视频,但是吧,请等一下。以下是我亲测的结果,效果还是蛮不错的,感兴趣的友友千万不要错过哦~
原创
发布博客 2024.08.07 ·
476 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

10倍提速,最强AI数字人新版!(整合包)

我是Glen,原鹅厂、字节高级产品经理,现AI公司创始人。它不仅可以独立使用音频或面部关键点生成肖像视频,更可以通过音频和选定的面部关键点的组合,创造出更加丰富、细腻的动态效果。随着AI技术的飞速发展,开源数字人技术的竞争愈发激烈,各大厂纷纷亮出自家的王牌产品。EchoMimic的诞生,不仅仅是阿里在数字人领域的一次尝试,更是对现有技术的一次革新。随着AI技术的不断推出,让我们能体验到越来越强的开源AI数字人,如果你对数字人技术充满好奇,如果你想亲手体验数字人带来的震撼效果,那么现在就是最好的时机。
原创
发布博客 2024.08.07 ·
705 阅读 ·
5 点赞 ·
0 评论 ·
11 收藏

开源最强AI大模型又来?我会出手(整合包)

我是Glen,原鹅厂、字节高级产品经理,现AI公司创始人。“人要是行,干一行行,一行行行行,人要是不行,干一行不行,一行不行行行不行。说你行你就行,不行也行,说你不行,行也不行。一时间,大模型百花齐放,开源的有阿里千问、清华GLM、百川、零一,闭源的有Kimi。如下图中,有人对各大模型进行了评测,可以看到Llama 3.1超大杯405B,在各项指标不仅远远超越各大厂商的模型,更是已经。为大家准备了一个免费整合包,这次带来的是中杯8B尺寸的大模型,并且采取了4b量化处理,让大家在本地也可以非常流畅的运行。
原创
发布博客 2024.07.30 ·
450 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

这个AI,让工作变得无聊?还有这种好事?

Cradle的核心原理:利用AI大模型作为基础框架,通过从屏幕帧中收集有用的视觉和文本信息,然后自我反思、任务推断、技能策划、动作规划,最终生成可执行的动作序列。强大的智能体会是未来AI发展不可或缺的一步,未来我们可能不再需要手动操作电脑,只需要告诉Cradle我们的需求,它就能自动完成所有的任务。理论上,使用任何软件,甚至是复杂的游戏,都可以很容易地转换为AI智能体的工作流。Cradle框架,听起来就像是科幻电影里的某个神秘组织,但它实际上是一个能够通过人类使用的统一界面执行复杂计算机任务的框架。
原创
发布博客 2024.07.26 ·
369 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

快手可灵收费?没关系,免费整合包来了!AI一键就可以生成视频啦!

EasyAnimate是一套基于Transformer架构的视频生成框架,它通过扩展DiT框架引入了运动模块,增强了对时间动态的捕捉能力,确保生成视频的流畅性和一致性。随着技术的不断进步,我们有理由相信,以EasyAnimate为代表的AI视频生成工具,将在未来的视频生成领域扮演越来越重要的角色。这个跨越时空的老照片的故事,大概可灵生成视频功能,一共生成了120个视频,才找到这几个可以用的,并做成了视频。德芙看到你都要甘拜下风。最骚的是,黄牛已经出动了,有人竟然加我,问我要不要可灵账号,“50一个V我”?
原创
发布博客 2024.07.24 ·
1025 阅读 ·
6 点赞 ·
0 评论 ·
12 收藏

全网最强数字人大盘点,一口气看完!(整合包)

MuseTalk是腾讯推出的一款数字人项目,支持实时音频驱动的唇部同步数字人,MuseTalk的核心技术能根据音频信号自动调整数字人物的面部图像,确保唇形与音频内容高度一致,只需输入音频,你的数字角色就能实现完美的口型同步。:相比Hallo,LivePortrait生成的数字人效果不但好,而且,对于配置要求也降低了很多,据我的评测,需要8G显存的显卡即可流畅运行,6G显存也可运行。:Hallo生成的数字人效果虽然好,但真的,它非常吃机器性能,据我的评测,需要10G显存以上的显卡才能跑得动。
原创
发布博客 2024.07.19 ·
761 阅读 ·
17 点赞 ·
0 评论 ·
15 收藏

开源最强数字人又又又来了,无所谓,我又出手了!(全网首发)

它不仅可以独立使用音频或面部关键点生成肖像视频,更可以通过音频和选定的面部关键点的组合,创造出更加丰富、细腻的动态效果。随着AI技术的飞速发展,开源数字人技术的竞争愈发激烈,各大厂纷纷亮出自家的王牌产品。这不,继百度的Halo、快手的LivePortrait之后,阿里也重磅推出了他们引以为傲的数字人——EchoMimic。EchoMimic的诞生,不仅仅是阿里在数字人领域的一次尝试,更是对现有技术的一次革新。以下是我亲测,使用EchoMimic生成的数字人,效果非常强悍,感兴趣的友友们,千万不要错过哦~
原创
发布博客 2024.07.17 ·
1185 阅读 ·
19 点赞 ·
0 评论 ·
17 收藏

开源最强数字人,一键整合包来啦!

LivePortrait的神奇之处在于,它不仅能够精确控制眼睛的注视方向和嘴唇的开合动作,还能处理多个人物肖像的无缝拼接。你可以将不同的人物特征合并到一个视频中,而且这些人物之间的过渡将平滑自然,不会产生任何突兀的边界效果。更令人惊叹的是,它在RTX 4090 GPU上的生成速度达到了每帧12.8毫秒,这比现有的扩散模型方法快了不止一星半点。快手的LivePortrait项目,不仅仅是一项技术的突破,更是一次创意的革命。最近,不仅快手的可灵异常火爆,快手更是开源了一个让人惊艳的数字人项目——
原创
发布博客 2024.07.12 ·
615 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

喂饭级AI语音生成神器Plus版来了!(懒人包)

按钮,等待处理即可,处理速度非常快,在底部可以看到合成的全新音频了。经过我的测试,生成的语音效果也非常强哦,拿去做数字人的音频,或者直接合成一些音频内容,比如电子书,都是非常棒的选择!有不少AI工具可以合成语音,但要不就是收费的,要不就是在网页端使用,有隐私泄露风险。最突出的功能是情感合成,允许你创建具有多种情感的语音,包括快乐、兴奋、悲伤、愤怒等,而且可以直接通过提示词来控制情感;老规矩,大家自行在本地部署比较麻烦,已经为大家制作好了一款离线整合包了,下载到本地解压即用。,能合成不同情感的语音。
原创
发布博客 2024.07.11 ·
255 阅读 ·
6 点赞 ·
0 评论 ·
3 收藏

指哪打哪,重绘神器!我已出手…

MimicBrush实现了真正的零样本图像编辑,你不需要提供原始目标图像,只需提供一个包含期望效果的参考图像,MimicBrush就能通过参考仿制的方式实现编辑效果。MimicBrush的神奇之处在于,它能让你轻松地在一张图片上指定需要编辑的区域,然后用另一张图片的风格来进行局部重绘。,它的问世,无疑给图像编辑领域带来了一场革命,它就像魔法师手中的魔杖,轻轻一挥,就能让图片焕然一新。等待片刻即可看到生成的全新图片,以下是我亲测的生成结果,可玩度很高,感兴趣的朋友,千万不要错过哦~】,免费获得本文资源~
原创
发布博客 2024.07.02 ·
472 阅读 ·
3 点赞 ·
0 评论 ·
6 收藏

免费!AI视频一键转绘,​哎哟不错哦~

它通过一个智能的“特征银行”,存储了之前帧的信息,这样在处理新帧时,就能快速调用这些信息,大大提升了处理速度和效率。而且,它还能和最新的图像扩散模型无缝对接,无需任何微调,就能展现出惊人的适应性和效率。它不仅开启了视频处理的新纪元,更以其独特的技术魅力,将实时视频转换技术推向了一个全新的高度。你正在看一个视频,突然间,视频中的人物换了张脸,或者整个场景风格大变,这不再是科幻电影里的场景,StreamV2V让它变成了现实。,它基于一种神奇的扩散模型,实现了视频到视频的一键转绘。3. 选择你喜欢的风格。
原创
发布博客 2024.06.25 ·
625 阅读 ·
6 点赞 ·
0 评论 ·
1 收藏

爆了!5个yyds的开源项目!

界面简洁,操作直观,而且功能多多,比如BT和磁力链任务、选择性下载BT部分文件、多任务同时下载、64线程下载、限速设置、下载完成通知等等。如果你是Windows用户,那么这个鼠标手势工具WGestures绝对不容错过,它支持Windows 7/8/10/11系统,让你的鼠标操作更加高效。朋友们,今天我要来跟大家聊聊几个超级棒的开源项目,简直是yyds级别,绝对让你眼前一亮!这是一个开源插件,可以在紧急情况下快速提交你的本地代码,让你的代码安全无忧。,都有哪些项目是大家感兴趣的,我们尽快安排制作整合包~
原创
发布博客 2024.06.24 ·
388 阅读 ·
3 点赞 ·
0 评论 ·
6 收藏

3个火火火的AI项目,开源了!

不仅如此,这个模型还能够理解语音的上下文,能够生成高度表现力和多样化的语音,让小说和推文都充满了情感和生动感。友友们,今天我要给你们安利三个超酷的开源项目,它们都和AI有关,而且每一个都能让你的日常生活变得更加有趣和便捷!一个充满乐趣的AI角色扮演项目——SillyTavern,在这个项目中,你可以自己创建各种角色,然后通过聊天或角色扮演与这些自定义的角色进行互动。开源社区是一个充满创意和分享的地方,我们每个人都可以在这里找到属于自己的乐趣,也可以贡献自己的力量。接下来,我要介绍的是一个叫做。
原创
发布博客 2024.06.18 ·
713 阅读 ·
4 点赞 ·
0 评论 ·
7 收藏

AI绘画界的赛博佛祖,开源最强SD3它来了!(整合包)

这一次,Stability AI不仅再次证明了他们在AI绘画界的领先地位,更以慷慨的开源精神,将先进的AI技术无偿分享给了全球的用户和开发者。加载成功后,项目会自动打开一个简单的用户界面,接下来在右侧点击“Load”按钮,将下载的SD3工作流文件导入(大家别忘了下载哈),其余配置采用默认即可。:与AMD和NVIDIA®进行了优化,确保了在最新的APU、消费级GPU及企业级GPU上的性能,大大增强了其图像生成的效率和质量。这次发布的是Medium版本,在多个方面展现出惊人的能力和效率,堪称。
原创
发布博客 2024.06.17 ·
934 阅读 ·
3 点赞 ·
0 评论 ·
8 收藏

洋人道歉,「国产」出品,全球最强端侧多模态大模型!(懒人包)

面壁智能的首席科学家刘知远教授在知乎上发表言论,直指Llama3-V实质上是对他们的MiniCPM-Llama3-V 2.5的一个简单“套壳”。在舆论的压力和事实的推动下,Llama3-V的作者团队不得不删除了相关评论,并最终发表公开道歉,承认了其行为,并将Llama3-V从各大平台撤下。它的成功,不仅是技术的胜利,也是中国AI在全球舞台上的一次重要展示。:MiniCPM-Llama3-V 2.5在复杂图像和文本的识别与理解上有着出色的表现,无论是长图、难图还是长文本,都能精准识别,解码效率大大提高。
原创
发布博客 2024.06.14 ·
495 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

开源超闭源?ChatGPT危!

Qwen2的影响力远不止于此,它的API已经集成到了阿里云的百炼平台,同时,全球众多开源平台和工具也迅速宣布支持Qwen2,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等。Qwen2的72B模型,其性能不仅超过了国外知名的Llama3-70B模型,还超越了多个国内的闭源大模型,如文心4、Moonshot-v1-8K等。说你行你就行,不行也行,说你不行,行也不行。】,免费获得本文资源~
原创
发布博客 2024.06.13 ·
635 阅读 ·
4 点赞 ·
0 评论 ·
9 收藏

标星好多好多k,这2个开源项目绝了!

在这个信息爆炸的世代,不妨让我给大家精选并介绍一些优质的开源项目,让大家感受到开源世界的美好。
原创
发布博客 2024.06.13 ·
427 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

清华出品,开源最强,我又出手了(全网首发!)

他们不仅引入了大语言模型进入数据筛选流程,进行了高达10T的高质量多语言数据训练,数据量是ChatGLM3-6B模型的三倍以上,还采用了FP8技术进行高效的预训练,训练效率提高了惊人的3.5倍。多模态能力也得到了提升,新推出的GLM-4V-9B能够处理高达1120 x 1120分辨率的输入,这在降低计算和部署开销的同时,还保持了出色的文本和图像处理能力。②在长文本能力上,GLM-4-9B模型的上下文处理能力从128K扩展到了1M token,可以同时处理高达200万字的输入,相当于两本《红楼梦》的长度!
原创
发布博客 2024.06.11 ·
329 阅读 ·
4 点赞 ·
0 评论 ·
9 收藏

这3个牛哄哄的AI项目开源了!

只需提供开始和结束的两帧图片,ToonCrafter就能自动生成中间的动画帧,实现平滑的过渡效果。AI技术的崛起,无疑是科技发展史上的一座里程碑,很可能是第四次工业革命的代表。传统动画制作的流程繁琐,著名的动画大师宫崎骏一直保持着手绘制作动画电影的习惯,比如时长119分钟的《哈尔的移动城堡》,总共手绘了14.8万张的画稿!它支持在高达20FPS的帧率下,进行视频到视频的转换,实现实时效果。这三个项目,无疑都是AI领域的佼佼者。未来,随着技术的进一步发展,我们有理由相信,AI将在更多领域展现其独特的魅力。
原创
发布博客 2024.06.07 ·
442 阅读 ·
3 点赞 ·
0 评论 ·
6 收藏
加载更多