大家好,我是程序锅。
github上的代码封装程度高,不利于小白学习入门。
常规的大模型RAG框架有langchain等,但是langchain等框架源码理解困难,debug源码上手难度大。
因此,我写了一个人人都能看懂、人人都能修改的大模型RAG框架小项目。
整体项目结构如下图所示:
人工智能小白做项目、跑项目报错,99%的原因都是依赖包的版本不对。安装好pycharm后,强烈建议大家使用Anaconda来管理依赖包,学透彻Anaconda后,几乎所有python相关的项目都能跑起来。
本篇文章将介绍3.项目依赖安装中的Anaconda安装与原理,围绕Anaconda原理与用途、Anaconda安装和验证Anaconda安装是否成功三部分展开论述。
采用安装系统为windows10。
Anaconda用途
Anaconda是Python依赖管理工具,支持Linux,Mac,Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。
Anaconda解决了官方Python的两大痛点。
一是提供了包管理功能,不再需要人为管理众多的python依赖;
二是提供环境管理的功能,解决了多版本Python并存、切换的问题。比如我现在有两个项目,分别用到了python2.7和python3.10,用官方python程序,由于环境变量混乱,很容易造成不知名的BUG。
Anaconda原理介绍
Anaconda 的运作原理是通过创建一个包含Python可执行文件及其众多依赖库的独立环境,让用户可以方便地在不同的项目和任务之间切换。
原理听起来很高级,其实本质很简单,我们首先来了解Anaconda安装后的目录结构,如图1所示。
环境创建
其中图1中的envs文件夹
用于保存利用conda命令的创建的环境。
比如创建一个python版本为3.10,环境名称为RAG的python环境。
conda create --name RAG python=3.10
执行命令后,会自动在envs文件夹
中创建一个名称为RAG的文件夹,RAG文件夹管理RAG这个环境所有python依赖(包括python3.10解释器)。
这里可以发现,Anaconda用不同文件夹实现了python环境隔离。
存放conda额外库
其中图1中的Library文件夹
用于存放一些conda额外库。比如curl等。
因此,需将Library/bin
路径加入用户环境变量中(下面会讲如何添加路径至用户环境变量)。
Anaconda安装包
其中图1中的pkgs文件夹
用于存储的是Anaconda自身的安装包。
存放Anaconda相关执行命令
其中图1中的Scripts文件夹
用于存放一些Anaconda执行命令,比如conda、activate等。
这里插一嘴。
很多人发现自己命令行执行conda --version
提示不是内部或外部命令。这是因为没有将Scripts
和Library\bin
文件夹加入用户变量中的Path变量。
原理:我们在命令行敲指令的时候,会去Path变量
涉及到的地址寻找可执行文件.exe
Anaconda原理介绍完毕,下面介绍Anaconda具体安装。
Anaconda安装
安装
0.下载安装包
https://www.anaconda.com/download
1.双击安装包
2.点击NEXT
3.点击I Agree
4.选择Just Me
,点击NEXT
5.选择合适的安装目录,点击NEXT
6.勾选如下图所示,点击Install
有人问为什么不勾选第2个,我们后续会手动将Anaconda3的一些环境变量添加到PATH环境变量中。
由于PATH环境变量中可能会涉及其他python解释器,因此自动添加环境变量,可能会与其他应用冲突。
7.等待安装完成,大约2-3分钟,点击Next
这里就安装完成了,下面将进入配置环境变量环节。
手动配置环境变量(重点)
由于前面我们没有自动配置环境变量,这里介绍手动配置环境变量。
1.打开此电脑
,右键点击属性
,选择高级系统设置
,点击环境变量
,再双击用户变量的Path
。
2.点击新建
3.根据自身Anacodna安装路径新增路径(下图是我自己的安装路径)
分三次输入以下信息(按自己实际安装路径输入):
-
Anaconda安装路径
-
Anaconda安装路径\Scripts
-
Anaconda安装路径\Library\bin
验证安装是否成功
1.Win+R
打开运行窗,输入cmd
2.验证conda --version
,是否输出正确信息。
介绍几个常用命令
例子:创建一个python版本为3.10,环境名称为RAG的python环境。
conda create --name RAG python=3.10
1.创建环境
conda create -n RAG python=3.10
2.查看环境
conda env list
3.激活环境
conda activate RAG
4.查看依赖(建议使用pip来管理依赖包)
pip list
5.退出环境
conda deactivate RAG
常见问题
1.conda不是内部或外部命令也不是可运行的程序或批处理文件。
A:见上面手动配置环境变量(重点)
2.CommandNotFoundError: Your shell has not been properly configured to use ‘conda activate’.
If using ‘conda activate’ from a batch script, change your invocation to ‘CALL conda.bat activate’。
A:命令行输入activate即可