【抢鲜体验】通义灵码试用体验，大模型帮你写代码

忘尘~

已于 2024-04-12 13:05:49 修改

阅读量552

点赞数 6

分类专栏： # AI 文章标签： python 通义灵码

于 2024-04-12 11:35:08 首次发布

本文链接：https://blog.csdn.net/bobyuan888/article/details/137673073

版权

AI 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近大模型比较火，我也想部署一下，想拥有一个属于自己的AI，于是就在modelscope上down了一份代码，并且modelscope还送了36小时服务器体验，那就开搞吧！

以下是启动大模型的代码：

from modelscope import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained(
    "qwen/Qwen1.5-0.5B-Chat-GPTQ-Int4",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("qwen/Qwen1.5-0.5B-Chat-GPTQ-Int4")

prompt = "给我一份上海旅游的旅行计划"
messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

大模型很快就给了我一份回答：

当然可以，以下是一份上海旅游的旅行计划：

第一天：早上：
- 上午7:00出发，前往上海浦东国际机场。
- 预约酒店入住。
- 全天游览外滩、南京路步行街和陆家嘴金融区。

第二天：
- 早起去外滩散步，欣赏美丽的海景。
- 参加上海博物馆，了解中国古代历史。
- 上午9:30返回酒店休息。
- 下午参观世博园，观赏世界各地的展览。

第三天：
- 早上8:00起床，前往迪士尼乐园。下午乘坐地铁前往徐家汇站下车，乘坐公交车前往外滩。
- 逛上海新天地购物区，体验上海的生活气息。
- 晚上回到酒店休息。

第四天：
- 游玩田子坊或静安寺周边的景点，感受上海的艺术氛围。
- 吃一顿上海特色美食，如小笼包、生煎等。
- 返回酒店休息。

第五天：
- 早上8:00起床，前往科技园区，参与一些高科技活动。
- 参加上海音乐节，享受音乐带来的乐趣。
- 上午10:00返回酒店休息。

第六天：
- 出发去黄浦江边，观看长江夜景，享受宁静的夜晚。
- 下午返回酒店休息。

第七天：
- 参加上海迪士尼乐园的一日游，结束这次在上海的旅行。

希望这个旅行计划能帮助你！

但是，我想要实现多轮对话，大模型的代码我又看不太懂，按照以前肯定就是去网上搜各种方案，再一个一个试，但今天我们要隆重请出今天要推荐的对象：

登场吧————通义灵码！！！

我在IDE的通义灵码插件中询问：“能否将上面这段代码，改成多轮对话的形式？”

通义灵码想了一会儿后，就开始帮我一行一行地写代码了（露出地主老财微笑脸的我）。

不到一分钟，就给我生成好了：

from modelscope import AutoModelForCausalLM, AutoTokenizer

device = "cuda"

def initialize_dialogue():
    model = AutoModelForCausalLM.from_pretrained(
        "qwen/Qwen1.5-0.5B-Chat-GPTQ-Int4",
        device_map="auto"
    )
    tokenizer = AutoTokenizer.from_pretrained("qwen/Qwen1.5-0.5B-Chat-GPTQ-Int4")
    return model, tokenizer

def generate_response(model, tokenizer, prompt, dialogue_history):
    messages = [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to(device)

    generated_ids = model.generate(
        model_inputs.input_ids,
        max_new_tokens=512
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    return response

def multi_dialogue():
    model, tokenizer = initialize_dialogue()
    dialogue_state = {"history": [], "current_round": 0}

    while True:
        print(f"\nRound {dialogue_state['current_round'] + 1}:")
        user_input = input("请输入您的问题或指令，或输入 'quit' 以结束对话：")
        
        if user_input.lower() == "quit":
            break

        dialogue_state["history"].append({"role": "user", "content": user_input})
        prompt = "".join([message["content"] for message in dialogue_state["history"]])
        response = generate_response(model, tokenizer, prompt, dialogue_state["history"])
        dialogue_state["history"].append({"role": "system", "content": response})
        dialogue_state["current_round"] += 1

        print(f"助手回复：{response}")

if __name__ == "__main__":
    multi_dialogue()

真强！能抵得上一个初级程序员了！后续我还会继续使用，分享更多使用案例！