【2022 CCF BDCI文心大模型创意项目】使用文心大模型制作《十五的月亮》MV

一、使用文心大模型制作《十五的月亮》MV

在文心大模型ERNIE-ViLG文生图模型地址:https://wenxin.baidu.com/moduleApi/ernieVilg) 能力很强,最近一段时间,各式各样的创意层出不穷,看的我是心花怒放,恰好中秋快到了,自己也打算做一个。

文心大模型制作MV《十五的月亮》_哔哩哔哩_bilibili
https://www.bilibili.com/video/BV1PY4y1M7Ac/

本文参考自:磊哥哥【使用文心大模型制作MV - 飞桨AI Studio】

主要步骤:

  • 以歌词为prompt,自动生成MV图片素材

  • 自动配合歌曲音乐,合成图片素材为MV

二、制作步骤

1.ak和sk申请

这一步主要就是获取官方的ak和sk
登录文心大模型官网 https://wenxin.baidu.com/moduleApi后,在顶部选择

右上角“创建API key”,记住这两个key,在之后会用到。当然,你也不要和别人分享你的key,好好保存。

2.编辑Promot

以歌词为基准,进行描述性修改

三、运行项目

1.fork项目

直接fork磊哥哥项目,即可

2.添加风格描述

可以参考 文心大模型-产业级知识增强大模型Promot指南,如比较喜欢像素艺术,可以在生成时,text后添加像素艺术即可。有多重艺术风格可选:

promot修改:

for index, txt in enumerate(self.lrcs):
    print(index, txt)
    if index >= startindex:
        textlist = txt.split("@:")
        if len(textlist) > 1 and textlist[-1] is not '':
            txt = textlist[-1]
        txt = txt.replace("\n", "")
        txt = txt + "中国风,像素艺术"
        print("real text:", txt)
        idict = self.getImageDict(txt)

        self.readAndSave(idict, text=txt, ind=index)

3.参考指南

「公式」= 图片主体,细节词,修饰词

在这里插入图片描述

Prompt:蒙娜丽莎,赛博朋克,宝丽来,33毫米,
蒸汽波艺术

drawing

Prompt:火焰,凤凰,少女,未来感,高清,3d,
精致面容,cg感,古风,唯美,毛发细致,上半身立绘

drawing

Prompt:巨狼,飘雪,蓝色大片烟雾,毛发细致,
烟雾缭绕,高清,3d,cg感,侧面照

drawing

Prompt:浮世绘日本科幻哑光绘画,概念艺术,
动漫风格神道寺禅园英雄动作序列,包豪斯
美学相关的词汇: https://aesthetics.fandom.com/wiki/List_of_Aesthetics

DALL-E 2 的 Prompt 技巧资料: https://docs.google.com/document/d/11WlzjBT0xRpQhP9tFMtxzd0q6ANIdHPUBkMV-YB043U/edit

DiscoDiffusion Prompt 技巧资料: https://docs.google.com/document/d/1l8s7uS2dGqjztYSjPpzlmXLjl5PM3IGkRWI3IiCuK7g/edit

四、生成图概略

五、代码

import wenxin_api
from wenxin_api.tasks.text_to_image import TextToImage
import requests
import argparse
import sys
import os

styleDict = ["油画", "水彩", "卡通", "粉笔画", "儿童画", "蜡笔画"]


class MV:
    def __init__(self):
        pass

    def getImageDict(self, text):
        input_dict = {
            "text": text,
            "style": self.style,
        }
        return TextToImage.create(**input_dict)

    def readAndSave(self, imgDict, text=None, ind=0):
        for index, url in enumerate(imgDict['imgUrls']):
            r = requests.get(url)
            imgName = ""
            if text is None:
                imgName = imgName + url.split('/')[-1] + '.png'
            else:
                imgName = imgName + str(ind) + "_" + text + "_" + str(index) + '.png'
            out_ii = os.path.join(self.songName, imgName)
            with open(out_ii, 'wb') as f:
                f.write(r.content)
            f.close()

    def make(self, lrc=None, songName=None, style=0, startindex=0):
        if style < 6 and style >= 0:
            self.style = styleDict[style]
        else:
            try:
                sys.exit(0)
            except:
                print("Wrong Style")

        self.lrcs = []

        if os.path.exists(lrc):
            with open(lrc, 'r', encoding='UTF-8') as fp:
                lines = fp.readlines()
                for line in lines:
                    self.lrcs.append(line)
        else:
            self.lrcs.append(lrc)

        print(self.lrcs)

        if songName is not None:
            self.songName = songName
        else:
            if os.path.exists(lrc):
                self.songName = os.path.basename(lrc).split(".")[0]
            else:
                self.songName = lrc
        os.makedirs(self.songName, exist_ok=True)

        for index, txt in enumerate(self.lrcs):
            print(index, txt)
            if index >= startindex:
                textlist = txt.split("@:")
                if len(textlist) > 1 and textlist[-1] is not '':
                    txt = textlist[-1]
                txt = txt.replace("\n", "")
                txt = txt + "中国风,像素艺术"
                print("real text:", txt)
                idict = self.getImageDict(txt)

                self.readAndSave(idict, text=txt, ind=index)


wenxin_api.ak = "xxxxxxxx"
wenxin_api.sk = "xxxxxxxxx"

mv = MV()


def main(args):
    mv.make(args.lrc, args.songName, args.style, args.startindex)


if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--lrc', type=str, required=True)
    parser.add_argument('--songName', type=str, required=False)
    parser.add_argument('--style', type=int, default=0, required=False)
    parser.add_argument('--startindex', type=int, default=0, required=False)
    args = parser.parse_args()
    main(args)
!python main.py --lrc 十五的月亮.txt --style 油画

此文章为搬运
原项目链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值