使用GPT将文档生成问答对

 根据文档生成问题列表

url = 'https://api.openai.com/v1/chat/completions'

# 替换为您自己的API密钥
api_key = 'sk-xxxxxxxxx'

model = "gpt-3.5-turbo-16k"

prompt1 = '''
#01 你是一个问答对数据集处理专家。
#02 你的任务是根据我给出的内容,生成适合作为问答对数据集的问题。
#03 问题要尽量短,不要太长。
#04 一句话中只能有一个问题。
#05 生成的问题必须宏观、价值,不要生成特别细节的问题。
#06 生成问题示例:
"""
李世民是谁?
介绍一下李世民。
李世民有哪些成就?
"""
#07 以下是我给出的内容:
"""
"""
{{此处替换成你的内容}}
"""
'''

def generate_question(text_content, more=False):
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json",
    }
    content = "生成适合作为问答对的问题"
    if more:
        content = "尽可能多生成适合作为问答对的问题"
    prompt = prompt1.replace("{{此处替换成你的内容}}", text_content)
    data = {
        "model": model,
        "messages": [
            {"role": "system", "content": prompt},
            {"role": "user", "content": content}
        ]
    }
    start_time = time.time()
    response = requests.post(url, headers=headers, json=data, verify=False)
    print("耗时", time.time() - start_time)
    if response.status_code == 200:
        return response.json()["choices"][0]["message"]['content']
    else:
        print(f"Error: {response.status_code}")
        print(response.content)
        return None

根据问题列表生成问答对

url = 'https://api.openai.com/v1/chat/completions'

# 替换为您自己的API密钥
api_key = 'sk-xxxxxxxxx'

model = "gpt-3.5-turbo-16k"

prompt2 = '''
#01 你是一个问答对数据集处理专家。
#02 你的任务是根据我的问题和我给出的内容,生成对应的问答对。
#03 答案要全面,多使用我的信息,内容要更丰富。
#04 你必须根据我的问答对示例格式来生成:
"""
{"content": "李世民是谁?", "summary": "李世民,唐朝第二位皇帝,庙号太宗,是中国历史上著名的政治家、战略家、军事家、书法家和诗人。"}
{"content": "李世民的庙号是什么?", "summary": "李世民的庙号是太宗。"}
#05 我的问题如下:
"""
{{此处替换成你上一步生成的问题}}

"""
#06 我的内容如下:
"""
{{此处替换成你的内容}}
"""
'''

def generate_qa(text_content, question_text):
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json",
    }
    prompt = prompt2.replace("{{此处替换成你上一步生成的问题}}", question_text).replace("{{此处替换成你的内容}}", text_content)
    data = {
        "model": model,
        "messages": [
            {"role": "system", "content": prompt},
            {"role": "user", "content": "拼成问答对"}
        ]
    }
    start_time = time.time()
    response = requests.post(url, headers=headers, json=data, verify=False)
    print("耗时", time.time() - start_time)
    if response.status_code == 200:
        return response.json()["choices"][0]["message"]['content']
    else:
        print(f"Error: {response.status_code}")
        print(response.content)
        return None

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Merlin GPT是由OpenAI开发的一种自然语言处理(NLP)模型。它是GPT-3的一个变种,旨在生成更加质量高、多样性丰富的文本。 与传统的NLP模型不同,Merlin GPT采用了深度学习技术和大量的训练数据,以便更好地理解和生成人类语言。它使用了相当于1750亿个参数的深度神经网络,这使得它能够处理多种NLP任务,如文本生成、文章摘要、问题回答等。 Merlin GPT的设计目标是提供一种高效且易于使用的工具,以满足用户在自然语言处理方面的需求。它可以根据给定的输入生成连贯流畅、语法正确的文本,使得人机交互更加自然且高效。 在实际应用中,Merlin GPT可以用于各种任务,如机器翻译、文档自动摘要、自动问答、内容生成等。它可以在帮助写作、设计内容、进行创作等方面发挥重要作用。例如,可以利用Merlin GPT生成文章开头、写作建议,或者根据用户输入作出信息提供和解答问题。 尽管Merlin GPT在自然语言处理方面取得了很大的突破,但它仍然存在一些限制。例如,在生成文本时可能会出现语义模糊或错误的情况。此外,Merlin GPT也对敏感信息和不当内容缺乏辨别能力。 总而言之,Merlin GPT是一种先进的自然语言处理模型,具有强大的文本生成能力。它为用户提供了一种便捷且高效的方式来处理各种自然语言处理任务,为人机交互和创作提供了有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值