- 博客(2)
- 资源 (19)
- 收藏
- 关注
原创 拯救重复劳动:无代码实现 Markdown文本抽取与切分
RAG(检索增强生成)是当前利用LLM技术激活文件数据价值的最佳方案。文章重点介绍了如何通过HuggingFists系统无代码实现Markdown文档的智能切分,建议将其他格式文件转为Markdown后再处理。系统提供两种切分模式:按自然章节拆分和按设定块大小拆分,支持重叠值设置以保持语义连贯性。流程包含文件输入、流复制和章节拆分等算子,输出结果包含文件名、文本块和章节路径信息,有效解决了文档语义切分的关键问题。
2025-08-16 13:09:18
292
原创 可视化抽取指南:用图形语言解码视频抽取
本文介绍了利用视频大模型技术从教学视频中提取关键信息的方法。通过HuggingFists工具,演示了从7分钟教学视频中提取3张关键PPT页面的过程,包括关键帧抽取、图像去黑边处理等步骤。同时展示了音频提取和语音转文本的技术实现,使用OpenAI的Whisper模型将教学语音转换为文字。这些技术为视频内容快速转化学习笔记提供了可行方案,虽然未涉及视频理解等更复杂技术,但为视频信息处理提供了实用参考路径。
2025-08-16 12:19:23
598
爱因斯坦3--计划解读与分析
2017-09-11
论大数据时代的威胁情报*
2017-09-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅