《AI生成式工具使用》之:AI文本生视频(二战!)

目录

背景说明及目标

尝试练手

1、豆包AI之图片生成

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

         2)可灵AI文本生视频

总结

关注我,躺不平就一起卷吧


背景说明及目标

        想在抖音上创建账号,主要用于日常读书分享。抖音流量大,因为是视频平台,所以需要制作视频。因本人从没有过这方面的经验,所以思考是否可以考虑借助外部工具。       

        背景:想运营一个抖音的读书账号:斯斯讲书。第一本要分享的书名叫《急救比医生快一步》

        目标:做一个预告视频,预告一下,希望能吸引关注。以预告做一个入门练习,熟悉了后面的所有分享就可以用AI生成视频,而我只需要专注于读书分享的文案就可以。

        上一篇“《AI生成式工具使用》之:自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿,导致生成的“玩意儿”一言难尽。重新做了梳理,决定二战AI文本生视频!

        学习中的小总结:AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的,并不是有了AI工具,所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率,事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸,在写作、画图、视频这块完全门外汉的我,显然是既没有相关的工作能力,又没有创作思维,手上拿个AI也是个棒槌。

        不过一生要强的中国女人,为了省钱,就是得一人身兼多职,AI文本生视频怎么滴都得拿下,也就只能蹒跚学步了。毕竟AI这股潮流,谁都得赶一赶。

尝试练手

        想象中的预告片描述:

        远景:拥挤繁忙的早高峰,街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来,由远及近,再匆匆驶离

        中景:医院的急救大厅,医生护士匆忙的进行着抢救,家属慌乱的呼唤着病人的名字

        近景:逆光的太平间的大门

1、豆包AI之图片生成

  • 下载豆包App,可通过抖音绑定注册登录
  • 登陆后进入主界面,选择下方"图片生成"

  • 在图片生成页面,比例选择9:16(手机竖屏显示),点击”+添加特征词“
  • 镜头视角:全景;光线:自然光;风景:城市景观;人像:无,点击"添加"
  • 继续补充输入"拥挤繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车",点击发送按钮,生成图片如下:

        (问题:地点没有在中国,生成的人物和地点都是外国,车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪,有人头是反的,缺胳膊少腿儿的。)

  • 重新生成,修改特征词如下:“全景、自然光、城市景观、北京繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车”,点击发送按钮,生成图片如下:

        (问题:依旧是行人在机动车道上乱窜,没有交规。如果不看细节倒也还能接受。)

  • 重新生成:“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。比例9:16”,生成图片如下:

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

 

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜、慢速、标准模式、3s,生成视频如下:

        (问题:生成图片时没有细看,现在图片生视频,图片上的车动起来之后发现了逻辑错误的地方,急救车逆向行驶了!!!!)

        (问题:车的行驶状态飘忽,总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西!!!)

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

  • 填写文案“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜,慢速,3s,9:16,生成视频如下:

         (问题:中文乱码,出现了警车。给出的是清晨,画面太暗了。调整文本重新再试一下)

  • 调整文案“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,不要出现警车”,随机运镜,慢速,3s,9:16,生成视频如下:

        (问题:改成上午了,还是没有很亮的感觉。另外!!!!MD!!!真的吓人,边上出鬼东西了!!!!!)

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,实际上等了近3个小时均未能生成成功。

         2)可灵AI文本生视频

  • 文案输入“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,生成视频如下(忘记选9:16了,但不影响其生成的内容):

        (问题:一言难尽,一台晃晃悠悠的老头乐??边上出现的诡异车..)

总结

        AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景,逻辑问题会很随机的出现,输出的结果不确定性很大!另外,出现中文的地方都是乱码!!!问题蛮大的。

        像我的实际需求可能更偏向于真实存在的场景,因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。

        另外还有个AI Mate App,可以直接输入文案(可以是故事),然后生成视频。因为没有试用功能,直接就需要充钱使用,风险蛮大的,暂时未测试。

        即梦AI也有类似AI Mate的故事创作功能,但需要充值VIP,暂时未测试。

        依旧没有完成目标,没能按照需求生成想要的视频。但至少验证了,我的需求没办法通过AI完全满足。得学习基础剪辑,或者试试AI剪辑功能。        

关注我,躺不平就一起卷吧

        顺便厚颜的打个广告,♥关注我♥,发布的文章专辑涉及到嵌入式开发、AI知识、日常调试bug记录、AI工具使用记录等。

<think>好的,用户想查询与“豆包”相关的信息。首先需要明确用户的具体需求,因为“豆包”可能有多种含义。最常见的理解是食物豆包,一种传统面食,以红豆沙为馅料。另外,“豆包”也可能是某个品牌、应用或产品的名称,比如字节跳动旗下的AI助手“豆包”。 首先,应该进行网络搜索来确认“豆包”的不同含义和相关信息。通过搜索结果,发现主要有两个方向:一是传统食物豆包,二是字节跳动推出的AI工具。需要分别整理这两方面的信息,确保回答全面。 关于食物豆包,需要介绍其定义、制作方法、地域差异等。例如,北方地区的豆包通常为圆形,而南方可能有不同做法。此外,豆包的历史背景和文化意义也值得提及,比如在特定节日的食用习俗。 关于字节跳动的豆包AI,需说明其功能、应用场景以及如何访问。需要查找官方资料,确认其作为多模态AI模型的定位,支持文本、图像、语音处理,覆盖写作、编程、翻译等用途。同时,提供下载和访问方式,如官方网站或应用商店链接。 在整合信息时,需分点说明,避免使用步骤词汇,保持自然分段。每个部分都要引用来源,但不要集中在末尾。例如,在介绍食物豆包时,引用美食网站的描述;在AI部分,引用官方发布的信息。 最后,成相关问题需要考虑用户可能的后续疑问,比如制作方法、地区差异、AI功能对比等。确保问题与回答内容紧密相关,帮助用户深入探索。</think>豆包主要有两种常见含义,根据使用场景可分为传统食品和AI工具: **一、传统食品豆包** 北方传统面食,以小麦粉或糯米粉为外皮,包裹红豆沙等甜味馅料蒸制而成。常见于华北、东北地区,山西、河北等地有冬至食用习俗。制作时需将红豆浸泡6小时,文火熬煮至绵软,加糖捣碎成馅,面团发酵后包制蒸熟。 **二、字节跳动AI工具** 1. 多模态AI助手,支持文本、图像、语音交互,提供写作辅助、编程协助、多语言翻译等功能 2. 访问方式: ```python # 官网地址 url = "https://www.doubao.com" # 移动端下载 import webbrowser webbrowser.open("appstore://doubao") ``` 3. 技术特征: $$ f(x) = \sum_{i=0}^{n} \alpha_i \phi(\mathbf{w}_i^T \mathbf{x} + b_i) $$ 采用混合专家模型架构,支持动态任务分配 **三、地域差异对比** | 特征 | 北方豆包 | 南方豆包变体 | |-----------|-----------|--------| | 外皮材质 | 小麦粉/糯米粉 | 粘米粉 | | 形状 | 圆形 | 半月形 | | 常见馅料 | 纯豆沙 | 豆沙混合坚果 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT搬砖客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值