爆火的Deepseek初体验
DeepSeek出现并爆火的意义是,它让一个普通人使用AI的门槛快速降低
概述
2022年11月30日,OpenAI正式发布了ChatGPT,它一经推出就迅速引起了全球范围内的广泛关注,因为它展示了强大的语言生成能力,能够进行流畅的对话、回答问题、撰写文本等多种任务。ChatGPT 的发布标志着自然语言处理技术的一个重要里程碑,开启了人工智能在语言交互领域的新篇章。
继ChatGPT成为全世界的焦点后,OpenAI再一次引爆了科技圈。
北京时间2月16日凌晨2点左右,美国OpenAI公司正式发布其首个文本-视频生成模型Sora。据报道,Sora能够根据文本提示创建详细的视频、扩展现有视频中的叙述以及从静态图像生成场景。
近期被Deepseek爆火刷屏,主要原因如下:
-
高性能与低成本:DeepSeek的R1模型在性能上足以与OpenAI的O1模型相媲美,在数学、代码、自然语言推理等任务上表现出色。例如,在AIME 2024数学基准测试中,DeepSeek R1的成功率达到79.8%,超越了OpenAI的o1推理模型。同时,其训练成本极低,仅用不到600万美元和2048块低性能的H800芯片,训练时间仅用两个月。
-
开源模式:DeepSeek的模型完全开源,全球开发者都可以免费使用和测试。这种开源模式不仅降低了使用门槛,还吸引了大量开发者参与创新,促进了技术的共享与发展
于是很小伙伴都想亲身体验一番,DeepSeek的出现使得大模型“平民化”了,这里我整理了一份个人的实操手册供大家参考,首先我们需要到下载安装包https://ollama.com/
安装Ollama
部署AI大模型
安装完成之后需要部署模型才能运行,我们需要选择一个合适的模型。
这里可以看到有很多流行的模型推荐:
根据自己的电脑配置选择模型进行部署,这里我选择的是
版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b
完成之后如下所示:
然后开始使用起来!
每次通过如下方式可以进入使用:
ollama list
运行如下命令可以进入对话模式:
ollama run 模型名称(NAME)