多模态大模型GLM-4V-Flash,免费了!

最近和智谱的哥们聊天,讨论到最近的一些大模型进展,包括o3等。跟哥们感叹说,现在搞大模型真是一个好时代,以前要做很多链路环节的技术架构,全部简化,直接利用大模型本身能力就好,多快好省的去做一些场景的落地。

我说,确实是这样的,现在各家文本大模型基本都有免费版本了,要是多模态理解大模型也能有免部署的免费版本就好了。

哥们说,你这找对人了,我们的GLM-4V-Flash前几天免费了,你去bigmodel里申请一个就好。

有了可以免费用的多模态理解大模型,做一个拍照识别热量的健康管理工具,那简直不要太简单,简单到只需要写几行提示词就可以。

之前我做了一个给自己用的卡路里计算器,拍照就能识别计算热量,给出健康建议,要是有免费的多模态理解大模型,就可以开源出来给更多人用了。

比如用这个提示词: 你是一个健康管理助手,可以根据用户上传的图片,给出可能的配料和估算对应的热量值,并结合用户的身高和体重情况,计算出BMI值,给出对应的饮食和健康建议。

要知道,在过去做一个这样的助手,成本特别高,我估算一下: 1.搜集实物图片和热量值标注; 2.找一个图片理解的backbone进行微调;3.设计对话的流程,做意图识别,抽槽;4.开发一个对话管理模块。5.找云平台部署自己搞了一个月的代码。

以前一个三头六臂全栈工程师一个月的工作量,在大模型时代,只需要一个不会写代码的产品经理,花1分钟搞定提示词。

下面用4v可以这样使用,先安装api调用需要依赖的库。

!pip install zhipuai   

如果看到如下信息就安装成功了。

Successfully installed annotated-types-0.7.0 cachetools-5.5.0 pydantic-2.10.4 pydantic-core-2.27.2 typing-extensions-4.12.2 zhipuai-2.1.5.20241204   

接下来是API获取接下来需要获取模型的开放API,前往https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys注册后,点击个人中心-项目管理 API keys-新建API-复制您的新API。

对话流程如下,核心是编写好的提示词;

import base64   from zhipuai import ZhipuAI   client = ZhipuAI(api_key="XXXX") # 填写您自己的APIKey   response = client.chat.completions.create(       model="glm-4v-flash",       messages=[           {               "role": "user",               "content": [                   {                       "type": "text",                       "text": "你是一个健康管理助手,可以根据用户上传的图片,给出可能的配料和估算对应的热量值,并结合用户的身高和体重情况,计算出BMI值,给出对应的饮食和健康建议。"                   },                   {                       "type": "image_url",                       "image_url": {                           "url": "https://files.mdnice.com/user/47494/44d32f14-ab83-4a0b-ae4a-31ab9e1fdbf4.png"                       }                   }               ]           }       ]   )      

我们准备好上传的图片在链接所示:

静待几秒中,得到回复内容如下:

一个典型的芝士汉堡(如图片所示)可能包含以下成分及其大致热量:   - 面包:约150-200千卡   - 肉饼:约300-500千卡   - 奶酪:约100-200千卡   - 洋葱圈:约50-100千卡   - 番茄片:约20-30千卡   - 生菜叶:几乎不含热量   - 烤肉酱或其他调料:约10-50千卡      总计大约在700-900千卡左右。请注意,这些数字仅供参考,实际的热量可能会因食材的品牌、制作方法等因素而有所不同。   

看这效果还不错,当然,整个过程是多轮的,可以继续进一步沟通。比如给他身高和体重,进一步追问建议。他甚至可以把BMI给算对!

import base64   from zhipuai import ZhipuAI   client = ZhipuAI(api_key="XXXX") # 填写您自己的APIKey   response = client.chat.completions.create(       model="glm-4v-flash",  # 填写需要调用的模型名称       messages=[          {           "role": "user",           "content": [             {               "type": "text",               "text": "你是一个健康管理助手,可以根据用户上传的图片,给出可能的配料和估算对应的热量值,并结合用户的身高和体重情况,计算出BMI值,给出对应的饮食和健康建议。"             },             {               "type": "image_url",               "image_url": {                   "url" : "https://files.mdnice.com/user/47494/44d32f14-ab83-4a0b-ae4a-31ab9e1fdbf4.png"               }             }           ]         },         {             "content": [                 {                     "text": '一个典型的芝士汉堡(如图片所示)可能包含以下成分及其大致热量:\n\n- 面包:约150-200千卡\n- 肉饼:约300-500千卡\n- 奶酪:约100-200千卡\n- 洋葱圈:约50-100千卡\n- 番茄片:约20-30千卡\n- 生菜叶:几乎不含热量\n- 烤肉酱或其他调料:约10-50千卡\n\n总计大约在700-900千卡左右。请注意,这些数字仅供参考,实际的热量可能会因食材的品牌、制作方法等因素而有所不同。',                     "type": "text"                 }             ],             "role": "assistant"         },         {             "content": [                 {                     "text": "我现在身高175cm,体重85kg,请计算我的BMI指数,并告诉我减脂期间适合吃图中的食物吗?",                     "type": "text"                 }             ],             "role": "user"         },       ]      )   print(response.choices[0].message.content)   

模型的回答如下所示:

你的 BMI 约为 27.78,属于超重范围。      在减脂期,适当控制热量摄入是非常重要的,而汉堡通常热量较高且可能含有较多的脂肪和糖分。因此,在减脂期间,建议限制汉堡的摄入。       **好的替换食物:**   1. **鸡胸肉沙拉**:低脂肪、高蛋白,且富含纤维。   2. **全麦三明治**:可以用全麦面包、瘦肉和蔬菜制成。   3. **瘦牛肉或火鸡肉**:制作成低脂的汉堡,搭配大量蔬菜。   4. **豆腐或素食汉堡**:低热量、高蛋白,适合减脂期间。   5. **蔬菜汤**:低热量的同时能增加饱腹感。      选择这些替代食物可以帮助你在减脂期间更好地控制卡路里摄入,同时保持营养均衡。      

这是一个特别简单的应用场景,更多的过往特别高成本的场景,只要你有想象力,都可以用非常低的成本搞出来。

往大了说,比如撑起一个公司的核心产品,拍照解题。往小了说,出国旅游直接拍下菜单,让他翻译好,并给出点菜建议。还有各种花草识别软件,珍惜动物识别软件等等,以前的任何一个场景,都能做成一个小程序,撑起一个小创业公司的核心业务。大模型时代,产品研发的能力都被延伸了,而这些过往产品经理只需要一个程序员的场景,变成了产品经理动手写几行提示词。

比如出国旅游碰到上面这样一个菜单,可以问问GLM-4V-Flash都是些啥菜,并且给你推荐一道。

import base64   from zhipuai import ZhipuAI   client = ZhipuAI(api_key="XXXX") # 填写您自己的APIKey   response = client.chat.completions.create(       model="glm-4v-flash",       messages=[           {               "role": "user",               "content": [                   {                       "type": "text",                       "text": "你是一个针对中国人的出国旅游助手,可以帮助用户翻译菜单,给出菜品推荐,下面是一张用户上传的菜单:"                   },                   {                       "type": "image_url",                       "image_url": {                           "url": "https://files.mdnice.com/user/47494/c7ea255d-139f-49a9-b6f0-331da972152b.jpeg"                       }                   }               ]           }       ]   )      

这时候我们得到的结果为:

您提供的菜单翻译如下:      **品味菜单**   1. 新西兰龙虾刺身      - 配鱼子酱、柑橘酱和海胆   2. 法国鲁伽鸭胸肉      - 微烤,配苹果和迷迭香酱以及西西里皮革蜂蜜   3. 意大利饺子      - 鲜煮、五花肉、水牛奶油和黄油干酪   4. 牛肋排和牛里脊      - 配红酒和李子酱,以及土豆泥      **推荐菜品**:     可以尝试“法国鲁伽鸭胸肉”,因其搭配了独特的酱汁和蜂蜜,风味丰富。   

这样的例子还有很多很多,最终形成了AI辅助轻量化应用落地的浪潮,在这里面,国产多模态大模型GLM-4V-Flash,做出了不小的贡献。背后是智谱开放平台(bigmodel.cn)新上线的视觉理解模型,可以理解图片中的语义并做出对应合理的文字输出。模型的能力范围包含图像描述生成、图像分类、视觉推理、视觉问答、图像情感分析等。

用一句话总结就是免费、好用的图片多模态理解模型,这波GLM-4V-Flash免费了,造福无数小团队和个人创业者,绝对要点个赞!

如何学习AI大模型 ?

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

在这里插入图片描述
👉学会后的收获:👈
基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值