def dataset_to_text(dataset, output_filename="data.txt"):
with open(output_filename, "w") as f:
for t in dataset["text"]:
print(t, file=f)
对于数据集中的每个文本项(t
),它使用 print
函数将文本写入已打开的文件。file=f
参数将输出定向到文件而不是控制台。
使用示例:
- 你可以使用这个函数将数据集(特别是具有 "text" 属性的数据集)转换为文本文件。例如:
-
my_dataset = {"text": ["这是文本 1", "这是文本 2", "这是文本 3"]} dataset_to_text(my_dataset, "output_file.txt")
这将创建一个名为 "output_file.txt" 的文件,其内容如下
-
这是文本 1 这是文本 2 这是文本 3