代码讲故事
这个作者很懒,什么都没留下…
展开
-
清华和哈工大把大模型量化做到了1比特,把世界顶尖多模态大模型开源大模型量化个人电脑运行!机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能,视 Mamba速度提升2.8倍,内存能省87%
清华和哈工大把大模型量化做到了1比特,把世界顶尖多模态大模型开源大模型量化个人电脑运行!机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能,视 Mamba速度提升2.8倍,内存能省87%。原创 2024-04-27 20:14:36 · 393 阅读 · 0 评论 -
参数100亿、主打联网搜索,性能超OpenAI WebGPT,利用docker一键部署,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署详细教程
参数100亿、主打联网搜索,性能超OpenAI WebGPT,利用docker一键部署,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署详细教程。WebGLM 旨在使用 10 亿参数的通用语言模型(GLM)提供一种高效且低成本的网络增强问答系统。它旨在通过将网络搜索和召回功能集成到预训练的语言模型中以进行实际应用的部署。结合传统的搜索引擎的“知识”来对大模型进行一次检索增强。基于 GLM-10B 的联网增强版问答系统,WebGLM 可以更加精确高效的完成问答与检索的任务。原创 2024-03-08 15:18:04 · 257 阅读 · 0 评论 -
本地个人电脑离线用AI 模型全自动化制作属于你的动漫视频,CPU、GPU都可以使用两种方法两种模型分别不同的实现,使用并行计算和流式处理来加速图片处理
本地个人电脑离线用AI 模型全自动化制作属于你的动漫视频,CPU、GPU都可以使用两种方法两种模型分别不同的实现,使用并行计算和流式处理来加速图片处理。介绍如何使用 GAN 模型来生成属于你自己的动漫风格的视频,为自己、喜欢的菇凉或者调皮可爱孩子生成一个别具一格的动漫风格的视频。操作难度较低,适合想要试玩了解 GAN 模型的同学。可以同时使用 CPU / GPU (包括 ARM M1)来完成。类似大名鼎鼎的《你的名字》、《秒速五厘米》、《天气之子》等经典作品。原创 2024-02-28 09:59:35 · 177 阅读 · 0 评论 -
更先进的功能,无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍,另一个工具包使得大模型推理性能加速达40倍(附详细代码使用举例)
更先进的功能,无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍,另一个工具包使得大模型推理性能加速达40倍(附详细代码使用举例)。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型,其在每个基准测试中,都优于 Llama 2 13B,并且在代码、数学和推理方面也优于 LLaMA 1 34B。原创 2024-02-27 11:50:24 · 78 阅读 · 0 评论 -
利用docker一键部署LLaMa到自己的Linux服务器,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署包含模型权重合并
利用docker一键部署LLaMa到自己的Linux服务器,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署包含模型权重合并。两种方式实现支持界面对话和API调用,一是通过搭建text-generation-webui。二是通过llamma.cpp转换模型为转换为 GGUF 格式,使用 quantize 量化模型,使用 llama.cpp 运行 GGUF 模型。原创 2024-02-22 16:21:36 · 584 阅读 · 0 评论 -
揭示端侧大语言模型的无限潜力:多种量化模型,可以在个人电脑或者手机上安装部署使用,几行代码进行调研可以离线使用
揭示端侧大语言模型的无限潜力:多种量化模型,可以在个人电脑或者手机上安装部署使用,几行代码进行调研可以离线使用。原创 2024-02-20 11:12:57 · 163 阅读 · 0 评论 -
使用PaddleNLP识别垃圾邮件:用RoBERTa做中文邮件标题分类,模型在测试集上准确率达到98.3%以上(附公开数据集)
使用PaddleNLP识别垃圾邮件:用RoBERTa做中文邮件标题分类,模型在测试集上准确率达到98.3%以上(附公开数据集)。根据具体的任务需求和数据集特点,可能需要对模型进行调参和优化,如调整学习率、批大小、网络结构等。此外,可以利用交叉验证、模型集成等技巧来提高模型的性能。最后,评估模型性能时要注意模型在垃圾邮件分类任务中的准确率、精确率、召回率等指标,并对模型进行适当的调整和改进,以达到较好的分类效果。原创 2024-02-06 11:29:43 · 806 阅读 · 0 评论 -
使用PaddleNLP识别垃圾邮件:用ELECTRA做英文邮件标题分类,英文邮件短标题的分类效果能达到92%以上以及如何使用PaddleNLP加载和微调ELECTRA模型?(附公开数据集)
使用PaddleNLP识别垃圾邮件:用ELECTRA做英文邮件标题分类,英文邮件短标题的分类效果能达到92%以上以及如何使用PaddleNLP加载和微调ELECTRA模型?(附公开数据集)原创 2024-02-06 10:35:59 · 201 阅读 · 0 评论 -
使用PaddleNLP识别垃圾邮件:用BERT做中文邮件内容分类,验证集准确率高达99.6%以上(附公开数据集)
使用PaddleNLP识别垃圾邮件:用BERT做中文邮件内容分类,验证集准确率高达99.6%以上(附公开数据集)。原创 2024-02-06 10:05:07 · 505 阅读 · 0 评论 -
[自然语言处理|NLP] 文本分类与情感分析,数据预处理流程,包括了同义词替换和拼写纠正,以及使用NLTK库和TextBlob库进行标记化和情感分析(附代码)
[自然语言处理|NLP] 文本分类与情感分析,数据预处理流程,包括了同义词替换和拼写纠正,以及使用NLTK库和TextBlob库进行标记化和情感分析(附代码)。当涉及到自然语言处理(NLP)中的文本分类与情感分析时,我们进入了一个广泛应用的领域。这种技术不仅有助于组织和分类大量文本数据,还能够自动判断文本中所表达的情感和情感极性。原创 2024-02-05 15:59:57 · 574 阅读 · 0 评论 -
多模态对比语言图像预训练CLIP:打破语言与视觉的界限,具备零样本能力
多模态对比语言图像预训练CLIP:打破语言与视觉的界限,具备零样本能力。一种基于多模态(图像、文本)对比训练的神经网络。它可以在给定图像的情况下,使用自然语言来预测最相关的文本片段,而无需为特定任务进行优化。CLIP的设计类似于GPT-2和GPT-3,具备出色的零射击能力,可以应用于多种多模态任务。原创 2024-02-05 15:49:30 · 376 阅读 · 0 评论 -
基于jieba、TfidfVectorizer、LogisticRegression的垃圾邮件分类,模型平均得分为0.98左右(附代码和数据集)
基于jieba、TfidfVectorizer、LogisticRegression的垃圾邮件分类,模型平均得分为0.98左右(附代码和数据集)。原创 2024-02-05 15:41:47 · 158 阅读 · 0 评论 -
一行命令实现docker一键部署最新模型无限制模型接近GPT4能力的微调ChatGLM3第三代大语言模型单机部署、量化部署、Mac 部署、单GPU部署及多GPU部署指南,附详细代码和步骤
一行命令实现docker一键部署最新模型无限制模型接近GPT4能力的微调ChatGLM3第三代大语言模型单机部署、量化部署、Mac 部署、单GPU部署及多GPU部署指南,包含代码调用对话、API调用、网页对话、命令行对话、工具调用、代码解释器等模式,附详细代码和步骤。docker高度封装环境都配置好了,在不同的硬件环境中,只需要修改参数即可,例如多个GPU环境中,只需要修改GPU数量即可。也解决了大模型下载慢和无法下载的问题,提供了多种解决方案。如果想用其他的模型,只需要简单修改一下模型名称即可自动进行下载原创 2024-02-02 16:41:03 · 418 阅读 · 0 评论 -
熬夜整理模型下载、量化、代码调用可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等
熬夜整理模型下载、量化、代码调用,可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。* Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。原创 2024-01-31 22:46:27 · 958 阅读 · 0 评论 -
零基础入门一文彻底掌握自然语言处理NLP中文分词、词性标注、关键词提取和文本摘要,包括;ChatGLM实战文本信息抽取、T5 模型完成新闻摘要任务、LLM大模型在文本摘要与提取中实现信息处理与压缩
零基础入门一文彻底掌握自然语言处理NLP中文分词、词性标注、关键词提取和文本摘要,包括;ChatGLM实战文本信息抽取、T5 模型完成新闻摘要任务、LLM大模型在文本摘要与提取中实现信息处理与压缩,详细的实现步骤和原理文章有点长,需要慢慢看,包含完整的图文和代码。原创 2024-01-30 17:49:00 · 658 阅读 · 0 评论 -
最新整理盘点全球最先进的几十种人工智能大模型,OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?附开源代码地址
最新整理盘点全球最先进的几十种人工智能大模型,OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?附开源代码地址。随着人工智能技术的不断发展,开源大模型逐渐成为学术界和产业界关注的焦点。开源大模型是指由多个团队共同开发、维护和优化的模型,其特点是开放性、共享性和可扩展性。在过去的几年中,开源大模型在 自然语言处理 、计算机视觉、 语音识别 等领域取得了显著的成果。原创 2024-01-27 12:23:05 · 395 阅读 · 0 评论 -
全能相似度计算与语义匹配搜索工具包,多维度实现多种算法,涵盖文本、图像等领域。支持文图搜索,满足您在不同场景下的搜索需求
全能相似度计算与语义匹配搜索工具包,多维度实现多种算法,涵盖文本、图像等领域。支持文图搜索,满足您在不同场景下的搜索需求。Similarities:精准相似度计算与语义匹配搜索工具包,多维度实现多种算法,覆盖文本、图像等领域,支持文搜、图搜文、图搜图匹配搜索Similarities 相似度计算、语义匹配搜索工具包,实现了多种相似度计算、匹配搜索算法,支持文本、图像等。原创 2024-01-27 11:46:28 · 439 阅读 · 0 评论 -
ArXiv| Graph-Toolformer: 基于ChatGPT增强提示以赋予大语言模型图数据推理能力
ArXiv| Graph-Toolformer: 基于ChatGPT增强提示以赋予大语言模型图数据推理能力.受最新的ChatGPT和Toolformer模型的启发,作者提出了Graph-ToolFormer(面向图推理的Toolformer)框架,通过ChatGPT增强提示(Prompt)来教导LLMs使用外部图推理API工具。原创 2024-01-27 11:31:52 · 370 阅读 · 0 评论 -
自然语言处理中的查准率与查全率的关键技术,以及自然语言处理中的查准率与查全率具体实例与策略
自然语言处理中的查准率与查全率的关键技术,以及自然语言处理中的查准率与查全率具体实例与策略。自然语言处理(NLP,Natural Language Processing)是人工智能领域的一个重要分支,其主要目标是让计算机能够理解、生成和处理人类语言。自然语言处理涉及到许多子领域,如语音识别、机器翻译、情感分析、文本摘要、文本分类等。在这些任务中,查准率(Precision)和查全率(Recall)是两个非常重要的评估指标,它们可以帮助我们衡量模型的性能。原创 2024-01-19 16:42:23 · 162 阅读 · 0 评论 -
查准率与查全率的核心概念和实践应用以及如何提高查准率与查全率的实用技巧与策略
查准率与查全率的核心概念和实践应用以及如何提高查准率与查全率的实用技巧与策略。原创 2024-01-19 09:31:48 · 94 阅读 · 0 评论 -
使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)
使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)。原创 2024-01-16 19:39:06 · 204 阅读 · 0 评论 -
超详细讲解Transformers自然语言处理NLP文本分类、情感分析、垃圾邮件过滤等(附数据集下载)
超详细讲解Transformers自然语言处理NLP文本分类、情感分析、垃圾邮件过滤等(附数据集下载)原创 2024-01-12 19:45:45 · 233 阅读 · 0 评论 -
查准率与查全率在自然语言处理中的核心概念与联系、核心概念和实践应用,如何使用朴素贝叶斯、SVM 和深度学习实现查准率和查全率的计算?
查准率与查全率在自然语言处理中的核心概念与联系、核心概念和实践应用,如何使用朴素贝叶斯、SVM 和深度学习实现查准率和查全率的计算?人工智能核心技术有:1. 深度学习;2.计算机视觉;3.自然语言处理;4.数据挖掘。其中,深度学习就是使用算法分析数据,从中学习并自动归纳总结成模型,最后使用模型做出推断或预测。原创 2024-01-11 09:51:05 · 513 阅读 · 0 评论 -
简单几个步骤几行代码一步一步掌握NLP自然语言处理通过Transformers模型实现包括情感分析,垃圾邮件检测,语法纠错,文本推理等
简单几个步骤几行代码一步一步掌握NLP自然语言处理通过Transformers模型实现包括情感分析,垃圾邮件检测,语法纠错,文本推理等。垃圾邮件是广告、欺诈或其他不相关信息的电子邮件,给我们的日常工作和生活带来了困扰。为了有效过滤和阻止垃圾邮件的到达,我们需要使用各种判断方法和技术。原创 2024-01-10 10:13:42 · 386 阅读 · 0 评论 -
精华整理几十个Python数据科学、机器学习、深度学习、神经网络、人工智能方面的核心库以及详细使用实战案例,轻松几行代码训练自己的专有人工智能模型
精华整理几十个Python数据科学、机器学习、深度学习、神经网络、人工智能方面的核心库以及详细使用实战案例,轻松几行代码训练自己的专有人工智能模型。机器学习 人工智能的核心,是使计算机具有智能的根本途径。机器学习专注于算法,允许机器学习而不需要编程,并在暴露于新数据时进行更改,让计算机不依赖确定的编码指令,模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。基于处理数据种类的不同,可分为有监督学习、无监督学习、半监督学习和强化学习等几种类型。原创 2024-01-10 09:49:29 · 2212 阅读 · 0 评论 -
多种垃圾邮件识别方案总结以及判定垃圾邮件的标准,8种机器学习方式进行实战对比:朴素贝叶斯、逻辑回归、支持向量机、KNN、决策树、随机森林、GDBT、神经网络(附数据集和源码)
多种垃圾邮件识别方案总结以及判定垃圾邮件的标准,8种机器学习方式进行实战对比:朴素贝叶斯、逻辑回归、支持向量机、KNN、决策树、随机森林、GDBT、神经网络(附数据集和源码)。更严重的垃圾邮件问题甚至不仅只是影响企业工作效率,甚至会祸及整个服务器。由于企业邮箱平台往往通信质量更好,更容易为国际反垃圾邮件平台白名单所接纳,因此成为垃圾邮件投送者甚至网络黑客的重点攻击目标。通过劫持这些企业邮箱,垃圾邮件投送者就可以大大提高垃圾邮件投送率。原创 2024-01-09 18:51:24 · 768 阅读 · 0 评论 -
完全开源的带有数据集源码的机器学习项目,例如:用逻辑回归预测信用风险、数据的情感分析、卷积神经网络进行图像分类、使用机器学习进行音乐流派分类、分析 Netflix 电影和电视节目深度学习医学诊断等等
完全开源的带有数据集源码的机器学习项目,例如:用逻辑回归预测信用风险、数据的情感分析、卷积神经网络进行图像分类、使用机器学习进行音乐流派分类、分析 Netflix 电影和电视节目深度学习医学诊断等等。机器学习 (ML) 是人工智能 (AI) 的一部分,属于计算科学领域,专门分析和解释数据的模式及结构,以实现无需人工交互即可完成学习、推理和决策等行为的目的。简单来说,机器学习即支持用户向计算机算法馈送大量数据,然后让计算机分析这些数据,并仅根据输入数据给出数据驱动型建议和决策。原创 2024-01-09 16:08:32 · 1095 阅读 · 1 评论 -
一键部署离线使用基于内容的邮件打分系统,用于识别垃圾邮件/钓鱼邮件,能处理各种类型的附件, 包括: 30多种压缩包, 40多种文档, 20多种图片(OCR, 二维码)支持中文简体,繁体,日文,韩文等等
一键部署离线使用基于内容的邮件打分系统,用于识别垃圾邮件/钓鱼邮件,能处理各种类型的附件, 包括: 30多种压缩包, 40多种文档, 20多种图片(OCR, 二维码)支持中文简体,繁体,日文,韩文等等。docker封装一键部署支持离线使用的一款基于内容的邮件打分系统,用于识别垃圾邮件/钓鱼邮件。能处理各种类型的附件, 包括: 30多种压缩包, 40多种文档, 20多种图片(OCR, 二维码),支持中文简体,繁体,日文,韩文,越南文,泰文,希伯来文,波斯文,拉丁等文字。原创 2024-01-09 11:34:31 · 624 阅读 · 0 评论 -
Hugging Face 带标注大型数据集大整理:电影评论数据集、亚马逊数据集、情感数据集、音频和文本数据集、自然语言理解数据集、问答数据集、机器人数据集、网络攻击数据集、银行数据集、垃圾内容数据集等
Hugging Face 带标注大型数据集大整理:电影评论数据集、亚马逊数据集、情感数据集、音频和文本数据集、自然语言理解数据集、问答数据集、机器人数据集、网络攻击数据集、银行数据集、垃圾内容数据集、英语语法纠错(GEC)数据集、银行77数据集、SMS垃圾邮件数据集、仇恨言论数据集、语音识别数据集、检测假新闻的数据集、语料库数据集等等。原创 2024-01-09 10:58:55 · 344 阅读 · 0 评论 -
Hugging Face Datasets文本质量分析,识别低质量内容、垃圾数据、偏见内容、识别毒性内容、检测重复文档、识别测试集污染数据、识别过短的内容
Hugging Face Datasets文本质量分析,识别低质量内容、垃圾数据、偏见内容、识别毒性内容、检测重复文档、识别测试集污染数据、识别过短的内容。原创 2024-01-09 10:41:17 · 1151 阅读 · 0 评论 -
基于 TensorFlow.js 构建垃圾评论检测系统
基于 TensorFlow.js 构建垃圾评论检测系统。原创 2024-01-09 09:56:40 · 1084 阅读 · 0 评论 -
反垃圾邮件技术,NLP实战使用Transformers加载BERT模型进行垃圾(短信)邮件分类,识别垃圾短信(邮件)的NLP机器学习模型,并将其部署在Flask的Web平台上(全套代码)
反垃圾邮件技术,NLP实战使用Transformers加载BERT模型进行垃圾(短信)邮件分类,识别垃圾短信(邮件)的NLP机器学习模型,并将其部署在Flask的Web平台上(全套代码)。使用 Hugging Face Transformers 库中的 BertForSequenceClassification 类来加载BERT模型进行垃圾邮件分类。二是朴素贝叶斯分类器不但使用起来非常方便而且预测精度非常高。一步一步从下载公开数据集、数据清洗、模型训练、模型评估、将模型部署成一个web服务、线上实现预测原创 2024-01-09 09:10:30 · 793 阅读 · 0 评论