自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (2)
  • 收藏
  • 关注

原创 阅读翻译Mathematics for Machine Learning之2.5 Linear Independence

线性无关

2024-07-18 02:39:09 703

原创 在Python中使用SWCNN去除水印

使用Python去除图片水印

2024-07-17 23:19:34 266

原创 MinerU PDF 文档提取 Demo (PDF解析)

Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。主要功能包含支持多种前端模型输入删除页眉、页脚、脚注、页码等元素符合人类阅读顺序的排版格式保留原文档的结构和格式,包括标题、段落、列表等提取图像和表格并在markdown中展示将公式转换成latex乱码PDF自动识别并转换支持cpu和gpu环境支持windows/linux/mac平台。

2024-07-17 19:06:24 413

原创 阅读翻译Fluent Python之An Arithmetic Progression Generator(第17章的一个小节)

我选择实现一个不同的签名,因为在算术级数中,步长是必需的,而终点是可选的。但当项目是即时生成生成时, 基于一个方法(method)去读取系列(series)中下一个项目的标准接口也是非常有用的。示例17-14的要点是:在实现生成器时,要了解标准库中已有的内容,否则你很有可能会重新发明轮子。函数:它返回一个生成器,消耗另一个生成器,并在给定的判定(predicate)评估为。类的控制台测试,我们稍后会看到该类的实现。注意,根据 Python 算术的数值强制转换规则,生成的算术级数中数字的类型与。

2024-07-16 20:08:45 613

原创 论文阅读翻译之Reflexion - Language Agents with Verbal Reinforcement Learning

大型语言模型(LLMs)越来越多地被用作目标驱动的代理(agent)与外部环境(如游戏、编译器、API)进行交互。然而,这些语言代理(language agents)要通过试错(trial-and-error)快速高效地学习仍然具有挑战性,因为传统的强化学习方法需要大量的训练样本和昂贵的模型微调。我们提出了Reflexion,这是一种通过语言反馈(linguistic feeback)来强化语言代理(language agetns)的新框架,而不是通过更新权重来强化。

2024-07-16 02:05:41 724 1

原创 使用自定义大模型来部署Wren AI(开源的文本生成SQL方案)

Wren AI目前是支持自定义LLM和Embedding模型的,其官方文档 https://docs.getwren.ai/installation/custom_llm 中有提及,需要创建自己的provider类。其中Wren AI本身已经支持和OPEN AI兼容的大模型了;但是自定义的Embedding模型方面,可能会报错,具体来说是中的以下代码else:其中这个条件分支是会报错的(默认会运行这个分支),所以我的临时解决方案是注释掉它。具体而言是在文件夹中创建一个。

2024-07-15 21:24:32 240

原创 使用自定义大模型运行一个简单的Graph RAG Demo

个人感觉Graph RAG对大模型能力的要求比较高,建议使用和OPEN AI对标的模型。

2024-07-15 01:34:59 292

原创 论文阅读翻译之The Curious Case of Neural Text Degeneration

尽管在神经语言建模方面取得了相当大的进步,但从语言模型中生成文本(例如生成一个故事)的最佳解码策略仍然是一个悬而未决的问题。一个违反直觉的实证观察是,尽管使用似然作为训练目标可以为广泛的语言理解任务带来高质量的模型,但基于最大化的解码方法,如束搜索(bean search),会导致退化——输出的文本平淡无奇、不连贯,或者陷入重复循环。为了解决这个问题,我们提出了,这是一种简单但有效的方法,可以从神经语言模型中提取出比以往解码策略更高质量的文本。

2024-07-14 22:44:23 1125 1

Pro T-SQL Programmer's Guide

This book is intended for SQL Server developers who need to port code from prior versions of SQL Server, and those who want to get the most out of database development on the 2014 release. You should have a working knowledge of SQL, preferably T-SQL on SQL Server 2005 or later, because most of the examples in this book are written in T-SQL.

2018-10-12

Software for Data Analysis - Programming with R

Software for Data Analysis - Programming with R

2014-09-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除