将.ipynb格式中的代码和markdown部分都提取出来另存为.txt格式

待处理文件.ipynb文件的路径为input_path

input_path = r'C:\Users\xy\Desktop\input.ipynb'

目标输出文件.txt文件的路径为output_path

output_path = r'C:\Users\xy\Desktop\output.txt'

直接运行以下代码即可:

import nbformat

def extract_notebook_to_text(filename, output_filename):
    # 读取notebook文件
    with open(filename, 'r', encoding='utf-8') as file:
        nb = nbformat.read(file, as_version=4)

    # 准备收集所有文本
    all_text = []

    # 遍历每一个单元格
    for cell in nb.cells:
        if cell.cell_type == 'code':
            # 收集代码单元格的内容
            all_text.append("# Code Cell\n" + cell.source + "\n")
        elif cell.cell_type == 'markdown':
            # 收集Markdown单元格的内容
            all_text.append("# Markdown Cell\n" + cell.source + "\n")

    # 将所有文本保存到一个文件中
    with open(output_filename, 'w', encoding='utf-8') as output_file:
        output_file.write("\n".join(all_text))

# 替换以下路径为您的具体文件路径
input_path = r'C:\Users\xy\Desktop\input.ipynb'

output_path = r'C:\Users\xy\Desktop\output.txt'
extract_notebook_to_text(input_path, output_path)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值