今天给大家推荐一款文本处理工具,可以Extract、Redact、Summarize、Refine、Translate、Interrogate,这个工具就是文档转换框架doctran。
欢迎关注公众号
doctran基于OpenAI的GPT模型和开源的NLP库来剖析文本数据。该工具也可以在LangChain框架document_transformers
模块内使用。(本质上是对LLM和NLP库的封装)
Github: https://github.com/psychic-api/doctran
Example: https://github.com/psychic-api/doctran/blob/main/examples.ipynb
1. 安装
pip install doctran
2. 使用
-
<