自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 收藏
  • 关注

原创 一键部署Ollama和粘土模型?快来看看吧!

上新Ollama与粘土模型。

2024-06-03 11:31:46 103

原创 Ollama 如何排除故障

有时,Ollama 可能无法如你所愿运行。解决问题的一个好方法是查看日志。(使用 docker ps 可以找到容器的名字)如果你是在终端里手动运行 ollama serve,那么日志会显示在该终端上。在 Windows 上运行 Ollama 时,日志的存放位置有一些不同。Ollama 内置了多个为不同 GPU 和 CPU 向量特性编译的大语言模型(LLM)库。Ollama 会尝试根据你的系统能力选择最合适的库。

2024-06-03 11:29:27 452

原创 使用Ollama搭建一个免费的聊天机器人

Ollama是一个能在本机运行大语言模型的软件,它提供命令行和API的交互方式,对于需要考虑数据隐私的情景,可以方便的使用Ollama部署大语言模型,并在此基础上开发RAG等应用,而无需调用OpenAI等开放API。Ollama基本上已经建立了比较完善的生态,除了在系统中使用命令行、API等方式交互,Langchain、Dify等开发框架也都支持Ollama,另外,也有非常多GUI客户端可以使用,像在iPhone、iPad等移动端设备上,也可以通过仅仅修改一个地址就能拥有属于自己的“ChatGPT”。

2024-06-03 11:27:56 466

原创 使用 Ollama 本地运行各种 LLM

今天看看另外一个产品Ollama。Ollama 的安装非常简单,只需从官网(https://ollama.com/download)下载后解压缩,并在 Terminal 中运行脚本即可完成环境设置。我尝试运行 Llama3,虽然在运行时占用了大量电脑资源,使得其他应用运行变慢,但整体体验尚可。Ollama 支持多种大型语言模型(https://ollama.com/library)。

2024-05-31 16:30:23 370

原创 探索 Ollama: 你的本地 AI 助手

本期推荐的开源项目是 Ollama,它是一款本地大模型运行工具,可以帮助用户轻松下载和运行各种大型语言模型(LLM),而无需将数据上传到云端。Ollama是一款开源工具,旨在将强大的大型语言模型(LLM)功能带到用户的本地机器。通过Ollama,用户可以下载和运行各种LLM模型,无需将数据上传到云端。Ollama 有哪些优势?\1.:LLM模型部署在本地机器上,数据安全有保障。\2.:相比云端部署,使用Ollama可以降低使用成本。\3.:支持离线使用,即使没有网络连接也能使用LLM。\4.

2024-05-31 16:29:01 300

原创 Ollama 本地大模型框架

部署和使用其实还是很方便的,没有遇到什么问题,小白也可以轻松上手。本地部署大模型的好处就是不需要联网,数据相当比较安全。虽然运行模型对设备要求不算太高,但想要有一个比较好的体验还是需要性能好一点。上面测试用的是QNCT(6C12T,而且当时还运行其他占用资源比较多的应用),下面这段话回复大概用了57秒左右需要内存还是比较大的,会随着使用增多没有加载模型前加载模型以后回复问题时​。

2024-05-31 16:27:13 1136

原创 AI大模型简史:萌芽、沉淀、爆发!

近一年来,随着ChatGPT爆火,大模型热潮席卷全球并持续升温,国内越来越多的知名高校、科研院所和创新型企业加大研究力度,大模型技术不断迭代升级,模型能力不断加强,逐渐形成从底层算力、模型开发到行业应用的新兴产业,大模型也从语言文本,到音视图文,再到动作行为,最终将走向人类社会往人机共生的社会。人工智能大模型是“人工智能预训练大模型”的简称,是“大数据+大算力+强算法”结合的产物,是凝聚了大数据内在精华的“隐式知识库”,

2024-05-30 15:15:00 647

原创 Ollama部署中文版llama3模型

从Llama3发布到现在,Github 以及 HuggingFace 平台上,可以看到已经陆陆续续地看到很多将其进行微调了一些这样的项目。目前效果最好的中文微调版是 HuggingFace 社区的 zhouzr/Llama3-8B-Chinese-Chat-GGUF 模型,该模型采用 firefly-train-1.1M、moss-003-sft-data、school_math_0.25M、弱智吧数据集。更多关于Llama中文项目的信息,可以看下这个Llama中文社区。

2024-05-30 14:45:00 672

原创 从头预训练一个 LLaMA 3 超级mini杯

虽然是练习,但既然打着复现工作的名头,还是来简要回顾一下原工作究竟做了什么吧。原工作探索的问题是语言模型(LM)在文本连贯性上的表现。像早期的一些语言模型如 GPT-2,即使在一些 Common Craw 这样的语料库上大量预训练后,也很难生成长的、连贯的文本。比如前几年有一种 AI 玩具类型是做文本续写,例如彩云小梦,可以写写作文、小说什么的,如果大家玩过就知道效果其实一言难尽,和今天的大模型完全没法比,其实这就是 GPT-2 level 的续写能力。

2024-05-30 10:25:09 571

原创 大模型到底能干啥,不能干啥?

举例:

2024-05-29 15:15:00 705

原创 本地离线部署Ai大模型的三种方案,含安装教程!

在GPU下运行:docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。把我们的模型放到对应的文件夹中。

2024-05-29 14:30:00 1286 1

原创 手机“本地”也能玩转AI大模型 - 万物皆可AI

随着AI技术的不断进步,MiniCPM-V的推出无疑为我们打开了一个全新的世界,一个我们可以在手机上直接与高级AI模型互动的世界。这不仅仅是技术的革命,更是移动设备使用体验的一次巨大进步。如果你对AI技术充满热情,千万不要错过MiniCPM-V,它将为你带来前所未有的体验。​。

2024-05-29 10:18:41 602

原创 使用大模型LLM实现销售AI

通过整合LLM、智能代理和聊天界面,销售AI能够有效地处理客户咨询,优化销售流程,并提高客户满意度。这种系统不仅提高了销售效率,还能通过数据驱动的洞察帮助企业更好地理解和服务于其客户。通过不断迭代和优化,销售AI将成为企业获得竞争优势的关键工具。​。

2024-05-28 15:30:00 752

原创 NoteLLM: 大语言模型在小红书推荐系统的落地应用

笔记压缩prompt构建生成式对比学习(Generative-Contrastive Learning)协同监督微调(Collaborative Supervised Fine-Tuning)笔记压缩prompt构建用来定义模型在训练时的输入,生成式对比学习和协同监督微调分别对应两个预训练任务,前者引入了推荐中的协同过滤信号作为标签进行对比学习来训练更好的文本表征,后者其实就是根据笔记内容来生成对应的标签和类别。

2024-05-28 10:45:46 1225

原创 AI大模型是如何测试效果的?

AI大模型的测试和评估是一个复杂的过程,通常包括多个方面的考量,因此对大模型的测试也称为多度测试。模型参数计算(以ALexNet为例):参数量在6000万,假设每个参数都是一个float,即4个字节,总字节就是24000万字节,则24000万字节/1024/1024 = 228MB一个针对大型语言模型(LLMs),采用众包方法进行匿名、随机化的对战的评分系统。根据清华发布2024年3月版《SuperBench大模型综合能力评测报告》。

2024-05-27 15:45:00 346

原创 【AI大模型】这可能是最简单的本地大模型工具,无须部署,一键使用

下载即exe,安装后即可使用,本体不到500m(提供mac和linux版本)

2024-05-27 15:30:00 843

原创 招聘视角,看数据产品经理求职面试技巧

面试过程多维度评估人岗匹配度,希望更大概率的招到合适的人员,但依然难以避免入职后发现不合适的情况。虽然面试过程是分以上几个环节,但最重要的是行为动机,自驱力强有意愿和兴趣最重要,然后是可以迁移的通用能力,最后才是专业知识和项目经验。每一个面试官都希望选拔出高潜力、值得长期发展和培养的优秀人才,知识和技能可以快速培养,能力可以持续磨练,行为动机无法轻易改变。​。

2024-05-27 11:11:06 931

原创 未来已来:AI大模型带你进入智能新时代!

你有没有突然发现,现在的智能助手、翻译软件和推荐系统突然就变得很聪明了?这些进步背后,离不开一种叫做“AI大模型”的帮忙。今天,我就带你一起看看AI大模型,看看它们是如何工作的,以及它们在我们的生活中扮演了哪些重要角色。通过这篇文章,你将轻松了解什么是AI大模型,并认识几个非常有名的大模型。准备好了吗?我们开始吧!简单来说,AI大模型就是规模非常大、训练数据非常复杂的机器学习模型。这些模型通过大量的数据进行训练,学会自己理解和处理各种各样的信息。

2024-05-25 15:45:00 858

原创 第一批用AI工作的产品经理,已经碾压同事了!

前几天,我们部门被一个新来的同事震惊了!是这样的,上周领导接近下班时下了个紧急任务,要求每人都出一份自己负责的项目报告,第二天一早就要汇报。这么紧急的需求,大家马上加班加点开干。凌晨下班时,我竟然还刷到了新同事说准时下班的朋友圈:好家伙!你怕是忘了明天还有个项目汇报!没想到第二天开会时,大家都被新同事的项目汇报震惊了!不仅汇报有理有据,还把数据处理成了非常酷炫的PPT!这么短的时间,不仅需要收集数据、还需要分析、排版,她到底是怎么做到的?我的内心充满了疑惑。

2024-05-25 11:28:14 934

原创 非技术岗的 AI 产品经理年薪近百万美元,美国公司开启“抢人大战”!

5 年前,一份“2018 届互联网校招高薪清单”在网络流传,将人工智能热度刷新到新高度。当时,对于深度学习、机器学习、人工智能领域的学生群体而言,年薪 25 万似乎只是“白菜价”。时至今日,在生成式 AI 开启开发新范式时,「未来不是属于 AI,而是属于掌握了 AI 的新程序员」,在星火认知大模型 V2.0 升级发布会上,科大讯飞董事长刘庆峰一语点名 AI 时代核心竞争力。

2024-05-25 11:04:44 287

原创 AI 如何颠覆产品经理的工作模式

🤖🤖产品经理岗位不会消失,且我认为它会变得更加重要。软技能——如影响力、沟通能力、产品思维、创造力和同理心——对于产品经理岗位会愈发重要。积极培养这些技能吧。一些高价值技能——例如战略、愿景、需求挖掘、数据理解(甚至工程能力)——会受到 AI的显著影响。因此,你需要学会与 AI 工具合作(例如,学会提出有价值的问题),来提升你在这些领域的优势。总的来说,产品经理将继续扮演 “粘合剂” 或 “指挥家” 的角色,将所有要素整合起来,帮助公司最重要的资产(人和 AI) 在最短的时间内发挥最大的影响力。

2024-05-24 15:45:00 1441

原创 时代,产品经理该如何进化

还是那句话,必须更加细分,产品经理才能在 AI 时代生存。当 AI 和大模型带来的自然语言交互 LUI 成为主流,产品经理还有存在的价值吗?这大概是当下所有产品经理,心中最大的疑问和恐惧。是不是 Prompt 做得好,就能做产品经理了?到底该怎么驯服 AI 这个「黑箱」,得到自己想要的结果?面对这些问题,来自完美世界技术中心产品总监罗一聪,根据自己的经验,总结了在 AI 时代中,产品经理可能需要的品质和特性。传统的互联网业务或者游戏业务,产品或者业务输出需求,技术人员只需要指哪打哪就好了。

2024-05-24 14:45:00 759

原创 干货收藏 | 掌握ChatGPT提示词的精髓:从小白到高手!!

提示决定了 ChatGPT 的输出。也就是说:GPT 生成的答案质量,完全取决于你“问它”,以及“引导它”的方式,如果你能问得好,引导的好,那么它就会帮你生成让你惊喜的答案,反之则无价值,假大空。所以,想要获得 AI 高质量回答,就要学会写高质量的提示词。

2024-05-24 10:25:32 397

原创 浅谈AI大模型的数据特点和应用问题

综上所述,目前大模型规模化应用存在的成本、性能、安全和商业变现等问题,制约着其中数据要素价值的进一步发挥。如何将大模型中的价值数据转化为可量化、可交易、可持续增值的资产,并推动大模型产业和数据要素市场的高质量健康发展,是当前大模型平台方、数据持有方、数据使用方和数据监管方等多元主体共同关心的话题。​。

2024-05-23 16:45:00 980

原创 AI图片生成的“技巧”及“大模型推荐”

通过综合运用这些维度,我们可以为AI提供一个丰富而详细的创作意图。记住,一个好的提示词就像是为AI绘制的一张地图,它指引AI沿着我们设定的路径,探索我们心中的艺术世界。在一个提示词中也许不需要体现所有的限制要素,但请记住:你限制的条件越具体,输出的图片质量越高。为了让大家可以进一步理解以上各个限制条件该如何使用,我帮助大家整理成了一张表格。

2024-05-23 15:45:00 565

原创 LangChain v0.2:向稳定性迈进的一大步

LangChain v0.2:向稳定性迈进的一大步❝本文经翻译并二次整理自LangChain v0.2: A Leap Towards Stability一文。LangChain官方正式对外宣布了LangChain v0.2的预发布版本,这个版本在提升LangChain的稳定性和安全性方面迈出了重要一步。。还记得四个月前我们发布的LangChain首个稳定版吗?今天,我们继续这一进步,带来了langchainv0.2的预发布版。这个新版本不仅在v0.1的基础上进行了改进,还吸纳了社区的反馈。

2024-05-23 11:29:32 915

原创 AI大模型开启价格战,字节、阿里、百度杀疯了

目前,AI不再是科幻小说中的概念,而是现实世界中一股不可忽视的力量。然而,AI大模型的市场并非总是如此平易近人。在过去,这些高级的智能工具价格昂贵,只有大型企业和研究机构才能负担得起。但随着技术的飞速发展和市场的需求增长,一场前所未有的降价风暴正在酝酿。5月份,我们正目睹AI大模型行业的一次重大转变,科技巨头们纷纷宣布大幅降价。它也标志着市场竞争的新格局,这预示着科技巨头们为了争夺市场份额,不惜一切代价。

2024-05-22 15:45:00 1778

原创 揭秘Google Med-Gemini:如何打造下一代医疗大模型?

开发垂直领域模型的方法有好几种,其中医疗、法律等专业是比较能体现模型垂直行业能力的,因此也深受各大厂商的重视。五一小长假的第一天,Google在Arxiv上发布了《Capabilities of Gemini Models in Medicine 》 ( https://arxiv.org/abs/2404.18416 ) 的论文。说明了微调Gemini模型在医学领域获得多项任务SoTA的成果和方法。论文全文长达58页,作者有30多号人,引用的文献列了10页。让人觉得是个大手笔之作,难免想一探究竟。

2024-05-22 15:00:00 862

原创 医疗大模型,云端新篇章:挑战与前景

2023年是中国医疗大模型发展的元年,各种医疗大模型已广泛应用于临床辅助决策、医学研究、健康管理等多个场景。未来,医疗大模型有望实现多模态AI与医疗实践全流程的深入链接,应用于医疗教育和临床培训,提高药物研发和药物反应监测等方面的能力。但在实际应用中,医疗大模型仍面临一些挑战,如准确度、透明度和可解释性等问题,以及对数据隐私和安全问题的担忧。本文主要探讨医疗大模型在医疗领域的应用及其面临的挑战。

2024-05-22 10:33:11 870

原创 ChatGPT插件新功能:视频转脑图,高数作业也能轻松搞定!

Sam Altman诚不我欺:ChatGPT终于在这两天向全面开放了。像之前预告的一样,联网可以直接获取2021年9月之后的消息,插件也安排了70多个,购物订餐订机票等日常功能应有尽有,更专业的数学、编程、检索文件等能力更上层楼。像用iPhone一样使用ChatGPT,就是现在!(像我们编辑部,最心水的莫过于用webpilot插件让它去reddit等网站上找出“关于ChatGPT最热门的5个讨论”了。选题从此不慌~)不过,在网友火速开启的一大波测试后,却出现了一些。

2024-05-21 16:30:00 579

原创 数据标注新突破!国内领先厂商如何助力垂直行业转型?

现在,通用大模型浪潮已经趋于冷静,各领域企业都在思考如何应用大模型来降本增效。云测数据率先给出垂直大模型的数据解决方案,并明确表示**“大模型应走向行业”**。为什么会是云测数据?而这解决方案背后又是基于什么考量?在与云测数据交谈之中,谈及最多的定位是数据生产者和处理商——基于AI数据处理的经验以及行业经验,持续输出相应的方案和标准。巧合的是,每年服贸会都成为了云测数据阶段性的成果展示平台。项目最高交付精准度达到99.99%;

2024-05-21 16:00:00 569

原创 揭秘!大模型时代来袭:普通人如何抓住AI技术驱动下的产业红利?

随着人工智能技术的飞速发展,大模型时代已经悄然来临。这些拥有海量参数和强大学习能力的大模型,正在引领着一场深刻的产业变革。那么,作为普通人,我们该如何抓住这一波AI技术驱动下的产业红利呢?接下来,就让我为你揭秘!大模型,顾名思义,就是拥有大量参数的机器学习模型。这些模型通过训练海量数据,能够学习到丰富的知识和模式,从而在各个领域展现出惊人的性能。比如,GPT-4等自然语言处理模型已经能够生成流畅自然的文本,甚至达到了以假乱真的程度。在产业应用方面,大模型也展现出了巨大的潜力。无论是,还是。

2024-05-21 11:26:47 399

原创 “AI”科普丨揭秘ChatGPT是如何“思考”的

计算机系统正变得越来越复杂,以至于人类很难搞清楚其运作方式,David Bau 对此非常熟悉。“作为一名软件工程师,我已经工作了 20 年,研究的都是非常复杂的系统。这样的问题一直存在,” Bau 说,他是位于马萨诸塞州波士顿东北大学的一名计算机科学家。但与传统软件不同,通常拥有内部知识的人可以推断出发生了什么,Bau 说。例如,如果一个网站的谷歌搜索排名下降了,那么在谷歌工作的人会很清楚发生了什么。。

2024-05-20 15:15:00 923

原创 大模型 | 实战:从一张订单照片入手,大模型带你快速成为高手

对每个审计人员而言,大模型既不是骗子,也不是无所不能。需要做的是在迎头赶上,拿到AI时代的入场券。因为,那些我们过去引以为傲的,在时代的列车呼啸而过的时候,已经开始土崩瓦解!​。

2024-05-20 15:00:00 783

原创 大模型也像人?看这届网友如何花式PUA各类大模型

近期一位叫Rob Lynch的网友发现,这位网友使用除了月份其他都相同的提示词,要求GPT4完成一个机器学习任务,并统计模型输出的字符分布,并且每个重复477次结果表明:在五月GPT4平均输出4298个字符,而在十二月GPT4平均才输出4086个字符,足足比5月少了200多个!出于统计学的严谨性,这位网友甚至还做了t检验:t-test p < 2.28e-07(

2024-05-20 10:50:36 555

原创 硅谷人工智能研究院院长:AI会取代一些工作,但也会带来这些新的岗位……

传统机器人主要是重复做一些简单的事情,比如工厂里的机器人。但是如今的机器人已经能够更加了解这个物理世界,并且适应不同环境的变化。加州大学伯克利分校的一个项目,

2024-05-18 16:45:00 591

原创 如何利用大模型GPTS自助赚钱一:流量变现模式

目前的GPTS形态个人认为还是对原有的各种商业模式的增强,GPTS可以说创造了新的流量生态,对于原有搜索引擎是个很大的冲击,但是整体商业模式并没有大的改变。变现的方式主要有以下几种:1、流量广告变现:借助GPTS新的流量场,构建爆款应用,利用大流量与CPC广告平台对接,通过点击赚钱,也是这篇文章重点介绍的2、内容生产提效变现:借助大模型加速内容GC,互联网的下半场是内容场,通过更高效率的内容供给站得先机,在Twitter上有蛮多教程的,博主也玩了下,Txt2Video还是非常有机会的。

2024-05-18 16:15:00 1248

原创 在 ICLR 2024,看见中国大模型的力量

今天,Sam Altman 预告 OpenAI 将在 5 月 13 日发布新产品,既不是万众期待的 GPT-5,也不是前段时间广为流传的 ChatGPT 搜索引擎产品。在海内外大模型仍在追赶 GPT-4 之际,OpenAI 又要开拓新的版图。“追赶 OpenAI,成为 OpenAI,超越 OpenAI。”这似乎已成为国产大模型的魔咒。但在过去一年,智谱 GLM-4、阿里 Qwen-Max 与百度文心一言4.0等国产大模型在各类评测榜单表现亮眼,跻身于国际舞台。

2024-05-18 11:33:48 766

原创 直观易用的大模型开发框架LangChain,你会了没?

在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!

2024-05-17 11:47:03 786

原创 大模型行业问答知识对比总结

在大模型的工程实践中,我们会发现它有一些局限性,这对我们的落地产生了很大的挑战。今天我们来探讨一下这些局限性。

2024-05-17 11:40:05 559

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除