自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能领域博客

坚持不懈,用心写好每一篇人工智能领域干货博文,期待关注,共同学习。

  • 博客(11)
  • 收藏
  • 关注

原创 AI智能体研发之路导航——快速索引,内容直达

AI智能体研发之路导航——快速索引,内容直达

2024-05-24 19:58:49 182 9

原创 AI智能体研发之路-模型篇(五):pytorch vs tensorflow框架DNN网络结构源码级对比

两种框架在定义模型结构时思路基本相同,pytorch基于动态图,更加灵活。tensorflow基于静态图,更加稳定。

2024-05-27 22:07:45 667 3

原创 AI智能体研发之路-模型篇(四):一文入门pytorch开发

本文先对pytorch深度学习框架历史、特点及安装方法进行介绍,接下来基于pytorch带读者一步步开发一个简单的三层神经网络程序,最后附可执行的代码供读者进行测试学习。

2024-05-27 20:24:37 1446 38

原创 AI智能体研发之路-模型篇(三):中文大模型开、闭源之争

本文首先对国内中文大模型开闭源情况进行概述,其次区分开源、闭源分析优缺点,最后谈了谈工作中对于开闭源大模型使用的感想。

2024-05-26 23:03:40 898 5

原创 AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战

本文首先针对deepseek-v2-chat这个大模型价格屠夫的模型特点和技术架构进行介绍,之后以LLaMA-factory为训练和推理框架,进行SFT微调训练和Infer推理测试。deepseek-v2-chat巧妙的将attention注意力机制和MoE网络架构与大模型相结合,通过模型算法与架构的升级,提升了推理和训练效率,最终呈现的就是成本的优化和商业市场价值的转化。是一个典型的通过技术创新直接创造商业价值的案例。值得互联网从业人员学习!

2024-05-23 18:53:59 1808 9

原创 AI智能体研发之路-模型篇(一):大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

本文先对LLaMA-Factory项目进行介绍,之后逐行详细介绍了该项目在国内网络环境下如何安装、部署,最后以Baichuan2-7B为例,通过讲解训练参数的方式详细介绍了基于LLaMA-Factory WebUI的大模型微调训练。篇幅有限,专栏内会持续更新,详细介绍大模型微调训练方法。如果觉得对你有帮助,期待您的关注,点赞、收藏或评论,您的支持是我持续码字的动力。

2024-05-14 08:30:00 1189

原创 AI智能体研发之路-工程篇(五):大模型推理服务框架LocalAI一键部署

本文列出了排坑后的Local-AI安装教程,及Local-AI前端,个人感觉,比如很友好,特别是对境内服务器开发者,建议还是看前两篇文章,选择Xinference和Ollama吧。

2024-05-10 18:16:31 666 3

原创 AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效

docker及docker compose命令梳理,收藏保存以备不时之需。

2024-05-09 21:07:32 600

原创 AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署

本文首先结合自己的工作写了一些对Agent AI智能体的见解,接着介绍了Dify框架快捷部署的过程,最后阐述了Dify框架的特点。个人认为Dify的发展会让Agent AI智能体开发提效,涌现更多有趣有价值的AI应用。

2024-05-07 22:39:42 1036

原创 AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一键部署

本文简要讲述了一行代码完成Xinference本地部署以及两行代码完成Xinference分布式部署以及webui和接口调用,其中快捷部署、极为友好的webui、可配modelscope以及提供兼容OpenAI的API等诸多优点,实属良心之作。真诚的希望通过写博客的方式将自己涉猎过的大模型开源项目分享给大家,由于个人经历有限,不能保证每篇文章都写的特别深入,但尽量保证内容自己实际操作过,避免大家重复踩坑。

2024-05-07 18:20:24 1543 1

原创 AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署

一行代码完成Ollama本地部署,提升大语言模型推理服务部署与效果评测效率。

2024-05-06 21:07:02 823

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除