- 博客(13)
- 收藏
- 关注
翻译 【翻译】解决检索增强生成(RAG)核心挑战的主要方案
我们探讨了 12 个痛点(7 个来自论文,5 个额外的痛点)在开发 RAG 管道中,并提供了相应的解决方案。请参阅下图,改编自论文《设计检索增强生成系统时的七个失败点》的原始图表。
2024-06-30 18:43:45
33
原创 可能的GPT-4.5甚至GPT-5的测试版本?
OpenAI CEO Sam Altman在这些机器人上线前一天发布了一条关于"im-a-good-gpt2-chatbot"的推文,这激发了人们对OpenAI可能在进行新模型A/B测试的猜测。"im-a-good-gpt2-chatbot" 和 "im-also-a-good-gpt2-chatbot" 的出现引起了AI社区的广泛好奇和猜测。用户对"im-a-good-gpt2-chatbot" 和 "im-also-a-good-gpt2-chatbot" 的能力给予了高度评价。
2024-06-07 10:47:15
347
原创 Cloudflare 免费 AI接口服务 AI Worker
本指南将指导您设置并部署您的第一个 Workers AI 项目。您将使用 Workers AI REST API 来试验一个大型语言模型(LLM)。如果您选择创建一个 API 令牌而不使用模板,该令牌将需要 Workers AI - 读取 和 Workers AI - 编辑 的权限。创建您的 API 令牌后,使用您的 API 令牌在请求中进行身份验证并向 API 发出请求。您需要您的 API 令牌和账户 ID 来使用 REST API。如果您还没有,那么请注册一个 Cloudflare 账户。
2024-05-19 14:52:27
1406
原创 GPT4o 是一个完整的产品形态,人工智能助手的成熟状态
与现有模型相比,GPT-4o 在视觉和音频理解方面表现特别出色。与 GPT-4 Turbo 相比,GPT-4o 速度提高了 2 倍,价格减半,限制速率提高了 5 倍。在英文和代码文本方面,它与 GPT-4 Turbo 的性能相当,对非英语文本的文本有显著改进。它可以接受任意组合的文本、音频和图像作为输入,并生成任意组合的文本、音频和图像输出。将在免费版中提供 GPT-4o,并为 Plus 用户提供高达 5 倍的消息限制。GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出。
2024-05-14 07:17:54
305
原创 Python Sqlite3 部署FTS5 中文拼音全文检索 simple分词器
可以选择用 simple_query 或者 jieba_query,jieba_query() 实现jieba分词的效果,在索引不变的情况下,可以实现更精准的匹配。创建虚拟表以及三个触发器后,我的项目数据库可以自动在有数据变动的时候同步至虚拟表中,确保全文检索所依据的虚拟表数据与源数据保持同步。搜索的核心是建倒排索引,建索引的核心是分词器。目前有Linux(Arm)、Ubuntu(x86)、MacOS、Win几个版本的版本。
2024-05-08 15:30:08
710
原创 LLM 提示词大赛冠军 Co-STAR 模型
基本上,使用 CO-STAR 的指南,你需要提供的所有信息 ChatGPT 等大语言模型能够更有效地处理,以便精确地回答你的问题。
2024-05-07 09:09:44
1297
原创 Mac 外接 M.2 SSD 突然识别不了. Win/MacOS都不识别.函数错误/无法加载/diskutil也找不到.
用了MacOS 里的 diskutil (磁盘工具),还有Win11 的磁盘管理都找不到这块硬盘,Win111上报错是“函数错误”。工具提供了直接与NVMe设备交互的底层访问,这可能允许它识别和操作一些在其他操作系统上无法识别的设备。4、用 nvmecontrol devlist 找到SSD对应的编号,例如 nvme0;然后SSD恢复正常使用了...感叹nvmecontrol功能的强大,FreeBSD的。1、用U盘烧录一个FreeBSD,我用的是14的版本;有一段时间了会频繁自动弹出,今天突然不识别了。
2024-04-26 17:37:58
648
原创 树莓派4B Python虚拟环境管理 Virtualenvwrapper *miniconda适配失败*
改用回原生的virtualenvwrapper。virtualenvwrapper默认将所有的虚拟环境放在~/.virtualenvs目录下管理,可以修改环境变量WORKON_HOME更改该文件夹位置。以上终端的配置文件根据自己的实际情况配置,记得最后一行source加进去,这样终端启动的时候会启动virtualwrapper。虚拟环境目录不会放到当前目录下了,它默认装在了~/virtualenvs,所有的虚拟环境都会放到这个目录下。workon 也能停止您当前所在的环境,所以您可以在环境之间快速的切换。
2024-04-25 10:01:35
427
原创 Hugging Face 推出 8B 视觉大模型 Idefics2
Idefics2 是一个开放的多模态模型,可接受任意序列的图像和文本输入,并生成文本输出。该模型可以回答有关图像的问题、描述视觉内容、创建基于多幅图像的故事,或者仅仅作为一个纯粹的语言模型而无需视觉输入。它在 Idefics1 的基础上进行了改进,大大提高了 OCR、文档理解和视觉推理的能力。可用于对多模态(图像+文本)任务进行推理,其中输入由文本查询和一个(或多个)图像组成。文本和图像可以任意交错。这些模型不支持图像生成。让我们首先定义一些常见的导入和输入。模型的中文能力比较一般,期待后续的词库增加。
2024-04-19 10:50:43
557
原创 Llama 及 中文Alpaca模型部署测试
转换模型格式: 使用🤗transformers提供的脚本convert_llama_weights_to_hf.py,将原版LLaMA模型转换为HuggingFace格式。将原版LLaMA的tokenizer.model放在--input_dir指定的目录,其余文件放在${input_dir}/${model_size}下。--lora_model:中文LLaMA/Alpaca LoRA解压后文件所在目录,合并多个lora文件需要用逗号隔开;--output_dir:指定保存全量模型权重的目录,默认为./
2023-05-10 17:31:42
1191
原创 Python Yield From 实现递归汉诺塔
import timeclass Hanoi(object): def __init__(self,layers): #self.layers 表示层数。 self.layers=layers #以队列表示汉诺塔的三个柱子。 self.pillars = [[],[],[]] self.move_counts=0 for i in range(self.layers): se.
2021-07-16 12:13:10
173
aria2自动更新bt下载的bt-trackers的脚本,亲测可用
2024-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人