Ragas实践问题记录2 AttributeError: ‘TestsetGenerator‘ object has no attribute ‘generate_with_llama_index_d

JerriZ.

已于 2024-06-18 11:04:19 修改

阅读量501

点赞数 15

分类专栏： ragas问题记录文章标签： llama 人工智能 python

于 2024-06-18 11:01:57 首次发布

本文链接：https://blog.csdn.net/z603220/article/details/139767209

版权

ragas问题记录专栏收录该内容

2 篇文章 0 订阅

订阅专栏

报错问题

依然是在尝试官方文档“Compare LLMs using Ragas Evaluations”的“Create synthetic test data”步骤发生报错。官方文档以及文档中代码如下：

Ragas：Compare LLMs using Ragas Evaluations

官方文档中的代码：

import os
from llama_index import download_loader, SimpleDirectoryReader
from ragas.testset import TestsetGenerator
from ragas.testset.generator import TestsetGenerator
from ragas.testset.evolutions import simple, reasoning, multi_context
from langchain_openai import ChatOpenAI, OpenAIEmbeddings

os.environ['OPENAI_API_KEY'] = 'Your OPEN AI key'

# load documents
reader = SimpleDirectoryReader("./arxiv-papers/",num_files_limit=30)
documents = reader.load_data()

# generator with openai models
generator_llm = ChatOpenAI(model="gpt-3.5-turbo-16k")
critic_llm = ChatOpenAI(model="gpt-4")
embeddings = OpenAIEmbeddings()

generator = TestsetGenerator.from_langchain(
    generator_llm,
    critic_llm,
    embeddings
)

distributions = {
    simple: 0.5,
    multi_context: 0.4,
    reasoning: 0.1
}

# generate testset
testset = generator.generate_with_llama_index_docs(documents, 100,distributions)
testset.to_pandas()

接着报错如下：

解决方案

这其实是官方文档中有一处写错了，不应该是“generate_with_llama_index_docs”，而是“generate_with_llamaindex_docs”

修改后代码：

记得把openai api key换成自己的

import os
from llama_index import download_loader, SimpleDirectoryReader
from ragas.testset import TestsetGenerator
from ragas.testset.generator import TestsetGenerator
from ragas.testset.evolutions import simple, reasoning, multi_context
from langchain_openai import ChatOpenAI, OpenAIEmbeddings

os.environ['OPENAI_API_KEY'] = 'Your OPEN AI key'

# load documents
reader = SimpleDirectoryReader("./arxiv-papers/",num_files_limit=30)
documents = reader.load_data()

# generator with openai models
generator_llm = ChatOpenAI(model="gpt-3.5-turbo-16k")
critic_llm = ChatOpenAI(model="gpt-4")
embeddings = OpenAIEmbeddings()

generator = TestsetGenerator.from_langchain(
    generator_llm,
    critic_llm,
    embeddings
)

distributions = {
    simple: 0.5,
    multi_context: 0.4,
    reasoning: 0.1
}

# generate testset
testset = generator.generate_with_llamaindex_docs(documents, 100,distributions)
testset.to_pandas()

就没问题啦