
大模型
文章平均质量分 63
青花瓷
程序员,喜欢计算机图形学和人工智能,C++,编译器技术等。热爱棋类、游泳、绘画。
展开
-
未指明版本的千问Qwen大模型对应的内部版本
这个问题其实是个小问题,发生在我调试LLaMa-Factory微调Qwen大模型,选择具体模型型号的时候产生的疑问。安装qwen:0.5b的时候,无从判断具体是qwen1.5还是qwen2.5,怎么办?如何判断当前的qwen:0.5b具体的qwen是什么版本呢?可见,qwen:0.5b对应的是qwen1.5:0.5b,肯定不是qwen2.5:0.5b。恰好也反证了qwen:0.5b对应的就是qwen1.5:0.5b。所以特意安装了qwen2.5:0.5b。原创 2025-05-08 09:44:11 · 291 阅读 · 0 评论 -
阿里魔搭社区大模型文件的格式区别和转换(cache_bin_safetensors三种格式)以及Python调用实例
我以前把魔搭社区看成了魔塔社区。哈哈!感觉还是魔塔社区这个名字更加霸气一些!魔搭社区的大模型文件是有多种格式的,有时候感觉脑子有点乱。主要的格式有在线下载后的cache格式、safetensors格式、bin格式。本文试图梳理一下,主要内容是各个格式之间的转换,离线调用,也供大家参考。。原创 2025-05-08 09:12:31 · 1042 阅读 · 0 评论 -
使用硅基流动的API_Key密钥及CherryStudio实现多种大模型的文生图
硅基流动也是一个常用大模型第三方平台,和魔搭社区有类似的地方。而且经过实测的其在线的DeepSeek的访问速度几乎是官网的DeepSeek的3倍。而且硅基流动中也架设了不少第三方的大模型。本文就尝试采用CherryStudio绑定了硅基流动实现了文生图的功能。原创 2025-05-06 15:58:06 · 336 阅读 · 0 评论 -
Chatbox上使用本地和在线DeepSeek以及硅基流动DeepSeekI的对比感受
主要是为了比对几种DeepSeek的访问速度。本博客采用了三种方式,分别是本地的DeepSeek、在线的DeepSeek和硅基流动的DeepSeek。原创 2025-04-16 15:45:59 · 342 阅读 · 0 评论 -
Windows下Dify的安装
首先确保,Windows下的docker已经安装完毕,并且可以使用。关于Windows下docker的安装,可以参考我的另外一篇博客:https://quickrubber.blog.csdn.net/article/details/146170500原创 2025-04-16 15:13:44 · 646 阅读 · 0 评论 -
VSCode中结合DeepSeek使用Cline插件的感受
听网上有传言说AI智能插件Cline非常的好用,而且相对Cursor而言还是免费的,捆绑的大模型选择也比较的广泛。所以,特意安装试用了一下。 我的采用IDE是VSCode,捆绑的大模型是最近比较火的DeepSeek。总体使用下来感觉非常的棒。原创 2025-04-05 20:24:44 · 607 阅读 · 0 评论 -
新版本Xmind结合DeepSeek快速生成美丽的思维导图
我的上一篇博客(https://quickrubber.blog.csdn.net/article/details/146518898)中讲到采用Python编程可以实现和Xmind的互动,并让DeepSeek来生成相应的代码从而实现对内容的任意修改。但是,那篇博客中提到的Xmind有版本的限制,一般是在8.0以前含8.0。但是,最新版本的Xmind的界面更加华丽,生成的思维导图也更加好看,如何利用上呢?本文尝试着给出了一个办法。原创 2025-04-03 17:23:46 · 524 阅读 · 0 评论 -
论百度SDK的三种鉴权认证机制(三种API Key)的区别
百度SDK的认证体系有点复杂,有时候让人有点摸不着头脑。直到我看到了这个网页,我才有点豁然开朗。特此,我尝试使用了这三种鉴权方式,里面碰到了不少坑,于是将其整理成文档,倾情推出。对应的源码测试工程也放在csdn下,文末有链接,有需要的小伙伴可以去下载。原创 2025-04-03 09:49:43 · 1646 阅读 · 0 评论 -
使用Kimi一句话就实现PPT的自动生成
听说Kimi可以一站式的生成PPT文件,所以就特地尝试了一下。感觉还是非常的好用的。目前大家都在关注DeepSeek,其实国内的其余几家大模型公司的产品也非常的好用,也各有特点的。比如抖音豆包、Kimi、阿里千问、百度文心一言等等。原创 2025-04-01 10:08:49 · 614 阅读 · 0 评论 -
智谱大模型(ChatGLM3)PyCharm的调试指南
最近在看一本《ChatGLM3大模型本地化部署、应用开发和微调》,本文就是讨论ChatGLM3在本地的初步布设。(模型文件来自魔塔社区)原创 2025-04-01 09:50:50 · 544 阅读 · 0 评论 -
魔塔社区的免费GPU服务器的使用感受(Nice!)
有时候,感觉自己的电脑有点力不从心(本机只配了一张2080的显卡),尤其是在跑cuda 程序的时候,比如大模型的落地推理。 查看了一些云上的GPU服务器,普遍都是需要收费的。但是,发现魔塔社区提供了一个GPU云服务器试用的机会,我的账号还可以用36小时呢。 我试了试,还挺好用的,下面是我的体验。原创 2025-03-31 09:47:15 · 576 阅读 · 0 评论 -
office_word中使用宏以及DeepSeek
Word中可以利用DeepSeek来生成各种宏,从而生成我们需要各种数据和图表,这样可以大大减少我们手工的操作。原创 2025-03-27 10:04:27 · 630 阅读 · 0 评论 -
本地DeepSeek_R1_32B和7B的运行的比较
我的电脑是i9-9900K,主屏3.60GHz,显卡是NVIDIA Gerforc RTX2080,操作系统是的Windows10,采用Ollama+DeepSeek的方式在本地布局了DeepSeek。 本文,是对本地的DeepSeek-R1:7b和DeepSeek-R1:32b对同一问题的询问比较,供大家参考。原创 2025-03-27 09:39:55 · 274 阅读 · 0 评论 -
Xmind和DeepSeek的整合测试
相比Mermaid而言,用Xmind制作思维导图和鱼刺图似乎更加的专业。但是,感觉没有脚本做配合,功能还是有所限制。试图用Python来进行访问,以下是我的一些尝试。原创 2025-03-26 09:04:30 · 506 阅读 · 0 评论 -
两款AI图片生成工具(元宝和即梦)使用感受
两款AI图片生成工具(元宝和即梦)使用感受,对比而言,感觉即梦是明显的比元宝要强。原创 2025-03-19 09:36:19 · 656 阅读 · 0 评论 -
星火大模型中的鉴权信息的使用测试
在星火大模型中获取了APPID、APISecret以及APIKey之后,如何使用Key信息(鉴权信息)也是一个值得探寻的问题。原创 2025-03-18 10:21:48 · 193 阅读 · 0 评论 -
通义千问(阿里百炼)SDK的使用方法
打开阿里云的大模型服务平台百炼,直观的感受就比百度的智能云好很多。明显的更加的清晰和准确。另外百炼就是阿里的通义千问的SDK版本,两者是一回事情。原创 2025-03-18 09:28:54 · 1229 阅读 · 0 评论 -
月之暗面MoonShot(Kimi)的API的注册和使用
Kimi对长文本的处理特别的好,PPT自动生成的功能也很棒。本文尝试对Kimi的API进行使用。原创 2025-03-06 10:10:19 · 757 阅读 · 0 评论 -
魔塔社区的Modelscope中无法import_AutoModel的问题
按道理来讲:AutoModel是关键性的类,为何无法import进来呢?可以重新输入from modelscope import A。可知道类路径在:modelscope\utils\下。这样,程序的AutoModel找不到的错误就排除了。这个提示的类,和步骤2看到的类的路径是一致的。原创 2024-08-10 17:44:51 · 2339 阅读 · 0 评论