自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

MoyiTech

壁立千仞 无欲则刚

  • 博客(26)
  • 收藏
  • 关注

原创 【学习笔记】第三章深度学习基础——Datawhale X李宏毅苹果书 AI夏令营

梯度为0的点我们统称为临界点,包括局部极小值、鞍点等局部极小值和鞍点的梯度都为0,那如何判断呢?先请出我们损失函数:L(θ),θ是模型中的参数的取值,是一个向量。由于网络的复杂性,我们无法直接写出损失函数,不过我们可以写出损失函数的近似取值。根据宋浩老师所讲的大学一年级高等数学的知识,我们可以通过三阶泰勒展开对损失函数在θ附近的取值进行近似:其中,θ是模型中的参数的取值,θ’是在θ附近的取值。H是海森矩阵,Hij​是L对θi​和θj​的二阶偏导数。

2024-08-27 23:50:44 593

原创 使用XINFERENCE快速本地运行LLM

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

2024-07-29 10:02:14 492

原创 Streamlit Chat Demo

【代码】Streamlit Chat Demo。

2024-07-18 14:25:41 244

原创 基于Milvus向量数据库实现检索增强生成(RAG)

RAG利用了向量数据库和大型语言模型(LLM)的能力来提升回答质量。在数据的准备过程中,通过特定的加载器将各种模态的信息进行导入,由于各种信息的大小参差不齐,故需要对其进行切片处理,在将每个部分进行切片后,embedding到特定维度的向量,将源数据喝向量一起存储到向量数据库中。常见的向量数据库引擎有:FAISS、Chromadb、ES、Milvus,本文采用Milvus进行实践在调用的过程中,先将用户的提问Question进行embedding(1.直接进行embedding;

2024-05-12 22:08:02 1904 1

原创 向量数据库Milvus简单上手

在Milvus,和pkrandomembeddingspkrandomembeddings总结来说,在Milvus中,是存储数据的容器,是collection中的数据项,而指的是多个Milvus实例组成的集群环境。

2024-03-05 16:34:12 1339

原创 为什么RNN的Out不需要激活函数?

所以,RNN的“out”(输出层)并非不需要激活函数,而是根据不同的应用需求选择合适的激活函数或无需激活函数。对于某些应用场景下,如果输出层不引入非线性激活函数,则模型可能无法有效表达某些复杂的输出关系,而对于其他情况,保持线性输出可能是最优的选择。对于连续值的预测,比如时间序列回归分析,输出层可能不需要激活函数或使用线性激活函数(也就是没有激活函数的效果),这样模型可以直接输出任意实数值。根据具体情况,不同类型的输出任务可能各自需要相应的激活函数。

2024-02-25 15:11:02 234

原创 目标检测算法

最早也是最有名的一类居于锚框和CNN的目标检测算法使用算法来使用预训练模型来对抽取特征(如VGG)训练SVM进行训练一个模型预测。

2024-02-06 13:23:06 272

原创 WSL2 配置深度学习环境 大模型微调

WSL是在Windows上跑的Linux子系统,但是在Windows环境下,安装deepspeed和flash-attention有很大的坑(deepspeed确实能安装成功,但是flash-attention安了好久确实也没有成功)

2024-01-25 22:42:02 1303 2

原创 如何优雅地使用Docker

CentOSUbuntu配置自启动允许docker自启动启动docker查看docker运行状态如果是显示绿色的图标,证明docker运行正常非root用户配置在非root用户使用docker时还需要sudo,非常麻烦Docker基础命令查看镜像删除镜像运行容器启动已经停止的容器退出终端: + + 连接容器:

2024-01-23 23:26:57 405

原创 前端三件套速成

HTML 定义了网页的内容CSS 描述了网页的布局JavaScript 控制了网页的行为。

2024-01-05 23:28:06 448

原创 书生·浦语大模型——全链条开源开放体系

这次的LLM组队学习使用了书生·浦语大模型全链路开源开放体系最令我开心的就是这种,甚至提供了从书生·万卷数据集、预训练框架到微调框架 到部署框架,就连评测框架也有提供**(OpenCompass)

2024-01-05 20:05:03 419

原创 Modelscope Agent 框架体验

如图所示,在开发Agent的过程中,我们可以自己开发Tools,这使得可以使用LLM + Agent实现更丰富的功能:不仅仅是单纯的访问或APi调用等,还可以实现比如网页特定内容的获取和处理(比如b站评论等,不能通过openapi来实现,但可以通过自定义的Tools来实现)。对于多模态的数据(如用户偏好、时空轨迹、一些景区图片等),在分类整理入库后,可以实现实时更新的效果。由于训练成本很高,往往需要很大规模的算力去做,而就算是finetune也是需要很大的算力。但开源发布的Agent具有一定的。

2023-12-15 22:36:41 548

原创 【CSP】CPP STL速成

为了突击CSP考试,总结的CPP STL速成

2023-11-24 19:41:49 926

原创 背包问题算法

因为在完全背包中,由于物品可以重复装填,那么就需要相同物品在不同背包容量时重复利用前面的数据。

2023-11-24 19:40:05 361

原创 F1 score

最近在做时需要到F1 score,故在这里总结一下。

2023-10-12 17:26:12 67

原创 AI线上部署之ChatGLM

使用streamlit可以很方便地实现web界面,无需html、css、js的知识都可以用。然后在命令行使用streamlit运行web_demo2.py。使用趋动云的在线Jupyter Notebook部署模型。环境配置很简单,直接使用预置的镜像即可。需要安装streamlit。

2023-10-12 17:25:17 98

原创 循环神经网路RNN学习笔记 通俗易懂!

小数据集 低算力S=f(winXt+b)S=f(w_{in}X_t+b)S=f(win​Xt​+b)St=f(WinXt+WSSt−1+b)S_t=f(W_{in}X_t+W_{S}S_{t-1}+b)St​=f(Win​Xt​+WS​St−1​+b)输入序列,单输出单输入,输出序列输入不随序列变化原始的N to N的RNN要求序列等长,然而我们遇到的大部分问题序列都是不等长的,如机器翻译中,源语言和目标语言的句子往往并没有相同的长度。下面介绍RNN最重要的一个变种:N to M。这种结构又叫Encode

2023-10-11 09:46:16 173

原创 全民K歌下载链接解析

欢迎star,本文仅限于编程学习交流,切勿用于非法用途!!!

2023-10-11 09:43:56 943

原创 阿里云服务器免费领取4-7个月:飞天加速3.0-高校计划

阿里云高校计划免费领取ECS”、“飞天加速计划——高校学生在家实践活动”是阿里云从疫情以来对在校大学生的免费提供服务器的活动,目前为止一共开展了三轮。

2023-10-10 19:52:31 728

原创 Mind2Web: Towards a Generalist Agent for the Web 论文解读

We introduce MIND2WEB, the first dataset for developing and evaluating generalistagents for the web that can follow language instructions to complete complex taskson any website. Existing datasets for web agents either use simulated websites oronly cove

2023-10-10 19:33:03 653

原创 【Datawhale夏令营第三期】用户新增预测挑战赛

又又又参加了Datawhale的AI夏令营第二期的机器学习赛道~,没错这次还是机器学习(外加运营助教)

2023-09-13 14:25:32 99

原创 Jupyter Notebook添加删除查看kernel

【代码】Jupyter Notebook添加删除查看kernel。

2023-09-13 14:23:39 142

原创 Centos 运维之防火墙篇——②firewalld

每个zone里都有不同的service,一个service就是针对一个服务(端口)做的iptables规则。,每个zone里面有不同的iptables规则,默认一共有9个zone,而默认的zone为。这些service都是由一个个配置文件定义的,配置文件的模板在。一般来说,iptables和firewalld启用一个即可。zone下service的配置文件模板在。firewalld有两个基础概念。这是CentOS8的默认防火墙。下面是关于zone的命令。目录下,真正生效的配置在。

2023-01-21 01:24:51 141

原创 Centos 运维之防火墙篇——①iptables

iptables属于数据链路层的服务,所以可以根据流量的源地址、目的地址、传输协议、服务类型等信息进行匹配;一旦匹配成功,iptables就会根据策略规则所预设的动作来处理这些流量。另外,防火墙策略规则的匹配顺序是从上到下的,因此要把较为严格、优先级较高的策略规则放到前面,以免发生错误。但是仅有规则链,还不足以保护用户安全,还应该和一些动作联合起来。一般来说,从内网向外网发送的流量一般都是可控且良性的,因此使用最多的就是INPUT规则链,该规则链可以增大黑客人员从外网入侵内网的难度。来保存配置的策略命令。

2023-01-21 01:23:58 223

原创 2019.7.22暑假C++学习第一天

二分法查找规律数据#include<cstdio>using namespace std;int main() { int n,max,min,middle; bool flag = 0; float a[100000],x; scanf("%d",&n); for(int i=0;i<n;i++) scanf("%f",&a[i]); scan...

2019-07-22 20:05:12 1794

原创 1.6编程基础之一维数组

#include<cstdio>using namespace std;bool pk(int j, int k) { if (j == 0 && k == 5) { return false; } if(j == 0 && k == 2){ return true; } if(j == 2 && k == 5){...

2019-07-22 09:47:50 673

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除