- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 MinerU PDF 文档提取 Demo (PDF解析)
Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。主要功能包含支持多种前端模型输入删除页眉、页脚、脚注、页码等元素符合人类阅读顺序的排版格式保留原文档的结构和格式,包括标题、段落、列表等提取图像和表格并在markdown中展示将公式转换成latex乱码PDF自动识别并转换支持cpu和gpu环境支持windows/linux/mac平台。
2024-07-17 19:06:24 413
原创 阅读翻译Fluent Python之An Arithmetic Progression Generator(第17章的一个小节)
我选择实现一个不同的签名,因为在算术级数中,步长是必需的,而终点是可选的。但当项目是即时生成生成时, 基于一个方法(method)去读取系列(series)中下一个项目的标准接口也是非常有用的。示例17-14的要点是:在实现生成器时,要了解标准库中已有的内容,否则你很有可能会重新发明轮子。函数:它返回一个生成器,消耗另一个生成器,并在给定的判定(predicate)评估为。类的控制台测试,我们稍后会看到该类的实现。注意,根据 Python 算术的数值强制转换规则,生成的算术级数中数字的类型与。
2024-07-16 20:08:45 613
原创 论文阅读翻译之Reflexion - Language Agents with Verbal Reinforcement Learning
大型语言模型(LLMs)越来越多地被用作目标驱动的代理(agent)与外部环境(如游戏、编译器、API)进行交互。然而,这些语言代理(language agents)要通过试错(trial-and-error)快速高效地学习仍然具有挑战性,因为传统的强化学习方法需要大量的训练样本和昂贵的模型微调。我们提出了Reflexion,这是一种通过语言反馈(linguistic feeback)来强化语言代理(language agetns)的新框架,而不是通过更新权重来强化。
2024-07-16 02:05:41 724 1
原创 使用自定义大模型来部署Wren AI(开源的文本生成SQL方案)
Wren AI目前是支持自定义LLM和Embedding模型的,其官方文档 https://docs.getwren.ai/installation/custom_llm 中有提及,需要创建自己的provider类。其中Wren AI本身已经支持和OPEN AI兼容的大模型了;但是自定义的Embedding模型方面,可能会报错,具体来说是中的以下代码else:其中这个条件分支是会报错的(默认会运行这个分支),所以我的临时解决方案是注释掉它。具体而言是在文件夹中创建一个。
2024-07-15 21:24:32 240
原创 使用自定义大模型运行一个简单的Graph RAG Demo
个人感觉Graph RAG对大模型能力的要求比较高,建议使用和OPEN AI对标的模型。
2024-07-15 01:34:59 292
原创 论文阅读翻译之The Curious Case of Neural Text Degeneration
尽管在神经语言建模方面取得了相当大的进步,但从语言模型中生成文本(例如生成一个故事)的最佳解码策略仍然是一个悬而未决的问题。一个违反直觉的实证观察是,尽管使用似然作为训练目标可以为广泛的语言理解任务带来高质量的模型,但基于最大化的解码方法,如束搜索(bean search),会导致退化——输出的文本平淡无奇、不连贯,或者陷入重复循环。为了解决这个问题,我们提出了,这是一种简单但有效的方法,可以从神经语言模型中提取出比以往解码策略更高质量的文本。
2024-07-14 22:44:23 1125 1
Pro T-SQL Programmer's Guide
2018-10-12
Software for Data Analysis - Programming with R
2014-09-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人