人工智能LLM
文章平均质量分 95
Johntill
本人投身于软件行业近十载,专注于WEB工程落地、大数据领域、图谱领域以及AI领域(大模型-GPT-应用落地),平时会在CSDN、微信公众号不定期发布-些技术类和实践类的文章,欢迎关注,-起进步-起成长~
展开
-
LLM RAG|攻克切片难题
今日AI资讯今天主要针对Langchain的文档切分中4个难点进行展开。原创 2024-03-26 22:18:20 · 1318 阅读 · 0 评论 -
开源大模型训练及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略
随着各厂商相继发布大型模型,排行榜变化频繁,新旧交替,呈现出一片繁荣景象。有些技术爱好者也开始心痒难耐,萌生了构建一个庞大模型并进行训练的想法。每天都能看到各个厂家推出内测版本,这让人不禁思考:为何不在本地环境尝试一番呢?然而,当前手头仅有一块性能有限的老破小GPU显卡,这就引发了一个问题:如何在这样的条件下成功运行模型?原创 2023-09-01 18:23:06 · 17696 阅读 · 3 评论 -
GrammarGPT:基于监督微调的中文语法纠错开源LLMs探索
语法错误纠正(grammar Error Correction, GEC)旨在不改变句子的意思,自动纠正不符合语法的句子。在此之前研究汉语语法纠错(CGEC)主要是来自国外汉语学习者的错误,很明显这是不对的。因此,本次研究转向了母语人士的语法错误,这更加微妙和具有挑战性。以往对GEC的研究主要采用Seq2edit和Seq2seq两种方法,并在各种GEC上取得了令人印象深刻的性能基准。随着LLMs的出现,有人对闭源LLMs(如ChatGPT)的性能进行了评估,并透露了其出色的错误检测和纠正能力。原创 2023-08-21 21:21:19 · 767 阅读 · 1 评论