聊天也能写程序?10 分钟让 AI 帮你编写出文本格式转换的程序
今天,我要和大家分享:只需跟 AI 聊聊天,10 分钟就能搞定文本格式转换的程序!
在 家长必看!1 小时搞定 RAZ 英文绘本英文提取! 文章里提到,我通过 AI 实现语音转文字,但得到的文本格式只有一大段文字。我想要将这些文本整理成整洁、规范的 markdown 格式,以便更好地阅读和分享。
一、聊天编程:10 分钟搞定文本格式转换
打开 通义 官网,开始进行聊天编程
💡
https://tongyi.aliyun.com/
先把我的需求描述一下,实际上有时我也还没清楚需求,但没有关系,先把大概的需求给大模型。
通义 AI 竟然能够轻松地理解并应对这种模糊的需求。它不仅迅速地为我定义好了 markdown 格式,还巧妙地设置了 title、Author、Body 等字段,这完全超出了我的预期。
当通义 AI 给出代码后,还贴心地提供了详细的函数说明和使用方法。这让我感到非常惊喜,仿佛有一位专业的编程导师在耐心地指导我。
像聊天一样,突然想起了一个需求,直接给他发一段文字。比如我说“还有转换后到一个新的目录”,它能够根据上下文准确地理解我的真实意图。
它告诉我,为了实现这个功能,我们需要先确保新目录存在,如果不存在,就需要先创建它。然后,它给出了修改后的代码,完美地实现了将生成的 Markdown 文件保存到新目录的功能。
有时我描述得不够清晰,但只要我给出一个例子,通义 AI 就能立刻理解并继续修复代码中的问题。这种互动式的编程体验,让我感到既轻松又高效。
二、高效成果:10 分钟完成任务
经过几次简短的聊天,我就成功地实现了完整的功能。
三、AI 自我总结
我还让通义 AI 为我做一个总结,回顾整个编程过程中的关键点和使用说明。
脚本实现原理
该脚本旨在将特定格式的 .txt 文件转换为结构化的 Markdown 文件。它通过正则表达式解析文本内容,提取标题 (Title)、作者 (Author)、焦点问题 (Focus question) 和正文 (Body) 部分,并根据这些信息生成符合 Markdown 格式的输出文件。
- 读取和清理文本:
- 从源目录中读取每个 .txt 文件的内容。
- 去除文本首尾的空白字符以确保干净的数据处理。
- 解析文本内容:
- 使用正则表达式查找 focus question 关键字来分割文本。
- 如果存在 focus question,则进一步查找 written by 来区分标题和作者。
- 提取作者信息直到遇到第一个逗号或文本结束。
- 将剩余部分视为正文。
- 构建 Markdown 格式:
- 根据解析结果创建 Markdown 格式的字符串,保持固定的结构。
- 对于缺失的部分提供默认值,如 "No title" 或 "No author information"。
- 写入 Markdown 文件:
- 将生成的 Markdown 内容写入到目标目录中的对应 .md 文件。
- 命令行参数处理:
- 使用 argparse 模块解析命令行参数,允许用户指定源和目标目录。
- 异常处理:
- 在处理文件时捕获并打印可能发生的错误,以便用户了解问题所在。
程序功能
- 文本解析:能够识别并提取文本中的标题、作者、焦点问题和正文。
- Markdown 生成:根据提取的信息生成结构化的 Markdown 文档。
- 批量转换:支持一次性将多个 .txt 文件转换为对应的 .md 文件。
- 路径灵活性:用户可以通过命令行参数指定源和目标目录。
- 异常处理:在转换过程中发生错误时提供有用的反馈信息。
使用说明
运行脚本
- 保存脚本:将上述代码保存为一个 Python 文件,例如 txt_to_markdown_converter.py。
- 准备数据:确保你有一个包含需要转换的 .txt 文件的源目录。
- 执行命令:打开终端或命令提示符,切换到脚本所在的目录,然后运行以下命令:
python txt_to_markdown_converter.py <source_directory> <destination_directory>
其中 是包含 .txt 文件的源目录路径,而 是希望存放转换后 .md 文件的目标目录路径。如果目标目录不存在,脚本会自动创建它。
示例
假设你有如下目录结构:
project/
├── transcribed/ # 包含 .txt 文件的源目录
└── transcribed_md/ # 目标目录,将存放转换后的 .md 文件
你可以通过下面的命令来运行脚本:
python txt_to_markdown_converter.py ./transcribed ./transcribed_md
这将把 ./transcribed 目录下的所有 .txt 文件转换为 Markdown 格式,并保存到 ./transcribed_md 目录中。
四、总结
如果你也面临着类似的文本格式转换问题,或者对编程感兴趣,但又苦于没有时间和精力去学习复杂的编程语言,不妨试试 AI 的编程功能。
相关阅读