- 博客(21)
- 资源 (3)
- 收藏
- 关注
原创 无需代理的 LLM 网络搜索引擎开源了!
一款无需代理、支持多搜索引擎的 LLM 网络检索工具正式开源。——该工具集成了多搜索引擎支持、网页解析+爬取能力,结合 LangGraph 构建模块化智能体链路,让大模型拥有“读网页”、“找资料”的能力。项目地址👉作者:AI前沿搬运工公众号:【AI前沿搬运工】
2025-05-05 19:28:08
470
原创 基于MinerU二次开发的多模态文档解析API服务实践
MinerU-OpenAPI是基于litserve二次开发的多格式文档解析API服务,使用litserve实现,支持PDF、PPT、PPTX、DOC、DOCX、PNG、JPG等格式的高效解析与结构化输出。通过模型预加载、分批加载和线程池加速等技术,显著提升了文档解析的性能和稳定性。
2025-03-12 09:45:35
784
原创 揭开AI“谎言”的面纱:当人工智能开始“狡猾
嘿,AI真的在骗我吗?”这个看似科幻的疑问,如今却可能是真实的担忧。随着AI技术快速发展,它们的能力让人惊叹,但也引发了新的问题:它们会不会学会欺骗人类?本文带你轻松读懂AI欺骗的真相,让我们一起揭开这场“科技大戏”的面纱。
2024-12-20 16:29:16
149
原创 复旦大学团队登上EMNLP 2024!——检索增强生成(RAG)的最佳实践指南
近几年,生成式人工智能火遍全球,但大家也逐渐发现这些LLM有一个“缺陷”——有时候它们会瞎编内容,给出一些看似很靠谱但实际上是错的回答。尤其是在一些专业领域,比如医学问答或法律咨询时,错的信息可能会带来严重后果。这篇文章就带你快速了解,这项技术到底解决了什么问题,复旦团队又是如何让它更强大的。为了解决这些问题,复旦大学计算机学院和上海智能信息处理重点实验室的研究团队针对。复旦大学团队登上EMNLP 2024!——检索增强生成(RAG)的最佳实践指南。做了一项系统性研究。相关成果被国际自然语言处理会议顶会。
2024-12-20 09:28:05
209
原创 AI Agent架构:探索新兴的代理式AI体系
然而,随着函数调用技术的发展,AI代理现在可以生成结构化的、可操作的输出。当前,有大量研究探讨了AI代理的未来,但这些代理的设计和开发实际上基于一些切实可行的架构和技术,这些架构成为了这些AI代理得以自主适应、动态行动的基础。比如,一个用于客户服务的AI代理可能包含一个擅长自然语言理解的小型模型,另一个专注于检索数据库的模型,还有一个模型可以用来处理用户的个性化需求。从大型动作模型到视觉语言的整合,再到函数调用的普及,AI代理已经不再只是静态的工具,它们是可以主动探索、学习并与环境互动的系统。
2024-10-07 22:30:08
1046
原创 人工智能开发者的困境:专有人工智能与开源生态系统
在当前技术飞速发展的背景下,企业对AI的投资和应用也在迅速增加。在这种大潮之中,AI开发者和企业面临一个核心问题:应选择使用大型专有AI系统,还是倾向于采用开源的AI生态系统?《Towards Data Science》上最近的一篇文章《》对这一问题进行了深刻分析,并为企业提供了有价值的战略参考。文章中,作者详细阐述了专有AI和开源AI之间的关键差异,以及它们各自在商业应用中的优势与挑战,帮助企业更好地理解如何最大化AI投资回报。这一抉择不仅影响企业的技术路线,更深刻地影响企业的未来创新和市场竞争力。
2024-10-05 14:26:49
872
原创 LLM三角原则:解锁大型语言模型的生产应用
为了制定有效的SOP,文章提出了认知建模的概念。就像一份详尽的食谱,SOP能够确保初学者也能做出美味的佳肴——在LLM开发中,详细的SOP能够为模型提供清晰的指导,让其在缺乏丰富训练的情况下,仍然能够输出高质量的结果。这一类比非常有效地突出了SOP在LLM应用开发中的重要性——如果没有这些标准化的指引,哪怕是最先进的LLM也可能会在复杂的任务中失去方向,难以持续地提供高质量的输出。总的来说,这篇文章通过详细的分析和生动的类比,为我们展示了如何将LLM的开发从一个复杂的难题分解为各个可管理的部分。
2024-09-30 09:49:39
1145
原创 大模型必读系列01-2:BERT模型复现-tensorflow版
在篇文章中,笔者对BERT的文献进行了总结,而在这一章节中,笔者将对BERT模型进行复现。Google团队发布的BERT源代码是基于TensorFlow 1.x版本,而笔者跟随前沿的技术架构,因此选择使用TensorFlow 2.10.0进行复现。由于TensorFlow 2.x版本的API发生了很大的变动,想要成功运行官方源码需要进行大量的修改,这确实是一个相当痛苦的过程。在安装TensorFlow-GPU之前,有必要先了解它与Python、CUDA和cuDNN的版本对应关系。
2024-09-20 10:49:15
1347
原创 大模型必读系列01:BERT精读笔记
文章介绍了一种新型的语言表示模型**BERT**(Bidirectional Encoder Representations from Transformers,基于Transformer的双向编码器表示)。BERT旨在通过在所有层中同时考虑左右两侧的上下文信息,对未标记的文本进行深度双向预训练表示。因此,预训练的BERT模型可以通过一个额外的输出层对特定的任务进行微调,无需对架构进行大量修改就能提高模型性能。结果显示,BERT在11个NLP任务上都获得了最先进的结果。
2024-09-07 22:49:21
1044
原创 一文带你了解大语言模型LLM的过去、现在及未来
在人工智能领域,大型语言模型(LLM)不仅推动了自然语言处理(NLP)的技术进步,还在多个科学和商业领域中展示了其巨大的潜力。从基本的对话模拟到复杂的问题解决,LLM的发展是AI领域中一场真正的革命。
2024-08-30 10:42:30
1034
原创 Linux的conda环境安装mpi4py报错解决
将pip修改成conda就能解决报错了,使用什么环境就用什么环境安装。在linux使用pip安装mpi4py会出现报错问题。
2024-07-12 11:39:05
592
原创 GLM4-4V-9B多模态模型INT4量化版部署问题
由于多模态模型GLM4-4V-9B多卡部署会遇到很多bug,本人的单张显卡只有16GB,只能部署量化版INT4精度的。现在就分享一下INT4量化版部署遇到的问题以及解决方法。
2024-07-05 17:19:42
2027
2
原创 公司项目需求,对一些embedding模型做了测试,结果发现。。。。。。
最近对embedding_model得输入长度和显存占用做了一些测试,结果发现只要bge-m3才能满足超大文本块得embedding需求。第一列为模型部署运行需要得显存,以下测试的字符都为中文字符,如3000,即为3000个汉字。
2024-07-04 14:10:45
1193
原创 GLM4-Functioncall
tools是一个list,可以放置多个函数的tool,这里只放置了天气查询作为示例。需要注意的是,properties这个字段中的city,即是对应天气查询函数get_current_weather的输入参数,也与required字段中的city相对应。
2024-07-02 22:56:59
615
1
原创 2023American Mathematical Modeling Spring CompetitionY题中文独家翻译+思路+数据+最新O奖参考论文
共享文档内包含思路、数据和参考论文的网盘链接,无套路,网盘直接下载即可。传送门:https://mbd.pub/o/bread/ZJeUmZxw。所有内容以共享文档形式提供,能保证持续更新!
2023-03-31 22:12:41
165
原创 python都被我用来爬美女图片了
废话不多说直接看主题目录--多进程爬取美女图片爬取网页地址爬取链接爬取链接爬取代码爬取网页地址https://so.toutiao.com/search?keyword=%E8%A1%97%E6%8B%8D%E7%BE%8E%E5%A5%B3&pd=atlas&dvpf=pc&aid=4916&page_num=0&search_json={%22from_search_id%22:%22202108220858130102121920511F8DC562%22
2021-08-22 09:32:49
1795
原创 Ajax数据爬取--用python玩微博
目录目标网页代码目标网页新浪微博-我的主页-爬取我的微博右键打开检查,点击network,打开Ajax的XHR过滤器,刷新然后下图就是我要爬取的东西JSON格式的内容(attitudes_count是赞数目,comments_cout是评论数目,reposts_count是转发数目,created_at是发布时间,text是发布正文)。下拉微博页面以加载到新的内容,可以看出会有不断的Ajax请求发出在Headers可以看到请求链接为https://weibo.com/ajax/statuse
2021-08-21 10:54:52
747
2
原创 python搭建代理,获取,保存,读取cookies
下面是添加代理与获取cookies的方法,以https://www.baidu.com为例在爬虫是免不了要使用代理,下面是添加代理的方法from urllib.error import URLErrorfrom urllib.request import ProxyHandler, build_openerproxy_handler = ProxyHandler({ 'http':'http://127.0.0.1:9743', 'https':'https://127.0.0.1
2021-07-31 16:55:34
295
原创 简单的C语言任意进制转换器
简单的C语言任意进制转换器该进制转换器可进行任意进制转换,请看效果图:代码/********函数声明******进制函数,输入与输出void BaCo();******返回将n进制num转换成的十进制数int NToD(char *num,int n);******将十进制数d转换成m进制数mnumvoid DToM(int d,int m,char *mnum);*/#include<stdio.h>#include<stdlib.h>#in
2021-07-31 16:09:13
1410
原创 阳光高考院校库
阳光高考大学库爬取爬取网址:https://gaokao.chsi.com.cn/sch/search–ss-on,searchType-1,option-qg,start-0.dhtml爬取内容如图所示:代码`根据观察可以看出网站第一页和第二页的网址是不同的,每一页的start都相差20,然后就是解析网页,用select获取需要爬取的内容head = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/
2021-07-29 17:45:24
1780
1
原创 基于Python的百度地图慧眼迁徙数据爬取
目录一、简介二、爬取效果展示三、爬取网页及内容四、代码展示五、感想一、简介首先呢,本人大一刚结束。这个爬虫是学校科研实验室的考核题,并且本人也完成,成功通过了考核进入实验室。现在分享一下学习成果。此爬虫爬取的是该平台最新30天的全部迁出迁入数据。二、爬取效果展示爬取的数据太多,每一个csv文件都保存到了相应的目录中了实验室考核要求是保存到csv文件,因此就这样子的了建立有多级目录三、爬取网页及内容爬取网页:https://qianxi.baidu.com/爬取的数据是各个省市
2021-07-09 10:38:10
2270
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人