自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(667)
  • 资源 (16)
  • 收藏
  • 关注

原创 16现代循环神经网络—深度循环与双向循环

深度循环神经网络使用多个隐藏层来获得更多的非线性性GRU、RNN、LSTM 在结构上都是相同的,只是隐状态 H 的计算方式有区别,所以它们加深神经网络的原理都是相同的在深度循环神经网络中,隐状态的信息被传递到当前层的下一时间步和下一层的当前时间步存在许多不同风格的深度循环神经网络,如长短期记忆网络、门控循环单元或经典循环神经网络深度循环神经网络需要大量的调参(如学习率和修剪)来确保合适的收敛,模型的初始化也需要谨慎双向循环神经网络通过反向更新的隐藏层来利用方向时间信息。

2024-07-22 16:21:02 342

原创 15现代循环神经网络—GRU与LSTM

GRU 中引入了两个额外的门,每个门可以学习的参数和 RNN 一样多,整个可学习的权重数量是 RNN 的三倍Rt 和 Zt 都是控制单元,用来输出取值为 0~1 的数值Rt 用来衡量在更新新的隐藏状态的时候,要用到多少过去隐藏状态的信息Zt 用来衡量在更新新的隐藏状态的时候,需要用到多少当前Xt相关的信息当 Zt 全为 0 , Rt 全为 1 时,等价于 RNN当 Zt 全为 1 时,直接忽略掉当前 XtGRU 通过引入 Rt 和 Zt ,从而能够在各种极端情况之间进行调整。

2024-07-22 16:13:21 17

原创 14循环神经网络—RNN

对隐藏状态使用循环计算的神经网络称为循环神经网络(RNN),循环神经网络的输出取决于当下输入和前一时间的隐变量循环神经网络的隐藏状态可以捕获当前时间步序列的历史信息隐变量是用来存储历史信息和下一个历史信息的转换规则,所以在拿到过去的输入和当前的隐藏状态就能够预测当前的输出Whh 拥有一定的时序预测目的应用到语言模型中时,循环神经网络根据当前词预测下一次时刻词根据当前的输入更新当前时刻的隐藏状态就能够预测下一个时刻的输出RNN 是一个隐变量模型,隐变量是一个向量。

2024-07-16 10:37:45 185

原创 13 循环神经网络—序列模型,语言模型

时序模型中,当前数据跟之前观察到的数据相关自回归模型使用自身过去数据来预测未来马尔科夫模型假设当前只跟当前少数数据相关,每次都使用固定长度的过去信息来预测现在,从而简化模型潜变量模型使用潜变量来概括历史信息,使得模型拆分成两块:一块是根据现在观测到的数据来更新潜变量;另一块是根据更新后的潜变量和过去的数据来更新将来要观测到的数据内插法(在现有观测值之间进行估计)和外推法(对超出已知观测范围进行预测)在实践的难度上差别很大。

2024-07-16 10:12:59 1425

原创 12计算机视觉—全连接卷积与迁移学习(风格迁移)

全卷积网络首先使用卷积神经网络抽取图像特征,然后通过 1 * 1 卷积层将通道数变换为类别个数,最后通过转置卷积层将特征图的高和宽变换为输入图像的尺寸在全卷积网络中,可以将转置卷积层初始化为双线性插值的上采样样式迁移常用的损失函数由 3 部分组成:内容损失、样式损失和全变分损失内容损失使合成图片与内容图片在内容特征上接近样式损失使合成图片与样式图片在样式特征上接近全变分损失有助于减少合成图片中的噪点。

2024-07-10 10:56:56 190

原创 11计算机视觉—语义分割与转置卷积

与目标检测不同,语义分割可以识别并理解图像中每一个像素的内容:其语义区域的标注和预测是像素级的。与目标检测相比,语义分割标注的像素级的边框显然更加精细。然而如果输入和输出图像的空间维度相同,在以像素级分类的语义分割中将会很方便。​ 为了实现这一点,尤其是在空间维度被卷积神经网络层缩小后,我们可以使用另一种类型的卷积神经网络层,它可以增加上采样中间层特征图的空间维度。在标签图像中,白色和黑色分别表示边框和背景,而其他颜色则对应不同的类别。​ 通过上面定义的两个常量,我们可以方便地查找标签中每个像素的类索引。

2024-07-10 10:42:00 101

原创 10计算机视觉—物体检测算法

R-CNN是最早,也是最有名的一类基于锚框和CNN的目标检测算法Fast/Faster R-CNN持续提升性能Faster R-CNN和Mask R-CNN是在最高精度场景下的常用算法SSD通过单神经网络来检测以每个像素为中心的产生多个锚框在多段的输出上进行多尺度的检测。

2024-07-03 09:57:32 185

原创 9.计算机视觉—目标检测

物体检测识别图片里的多个物体的类别和位置位置通常用边缘框表示一类目标检测算法基于锚框来检测首先生成大量锚框,并赋予标号,每个锚框作为一个样本进行训练在预测时,使用NMS来去除冗余的预测。

2024-07-03 09:42:46 259

原创 8.计算机视觉—增广和迁移

微调通过使用在大数据上得到的预训练好的模型来初始化模型权重来完成提升精度预训练模型质量很重要微调通常速度更快,经度更高。

2024-06-27 09:58:31 234

原创 7.计算机视觉—硬件和训练

一台机器可以安装多个GPU在训练和预测时,我们将一个小批量计算切分到多个GPU上来达到加速目的常用切分方案有数据并行模型并行通道并行(数据+模型并行)当一个模型能用单卡计算时,通常使用数据并行拓展到多卡上模型并行则用在超大模型上。

2024-06-27 09:32:01 106

原创 6.深度卷积神经网络

AlexNet是更大更深的LeNet,10倍参数个数,260倍计算复杂度新进入了Dropout,ReLu,最大池化层和数据增强AlexNet赢下2012ImageNet竞赛后,标志这新的一轮神经网络热潮的开始VGG使用可重复使用的卷积块来构建深度卷积神经网络不同的卷积块个数和超参数可以得到不同复杂的变种NiN块在卷积层后 加两个1 * 1卷积层后者对每个像素增加了非线性NiN使用全集平均池化层来代替VGG和AlexNet中的全连接层不容易过拟合,更少的参数个数。

2024-06-18 09:42:13 184

原创 5.卷积神经网络

对全连接层使用平移不变性和局部性得到卷积层卷积层将输入和核矩阵进行交叉相关计算,加上偏移后得到输出核矩阵和偏移是可学习的参数核矩阵的大小是超参数填充和步幅是卷积层的超参数填充在周围添加额外的行/列,来控制输出形状的减少量步幅是每次滑动核窗口时的行/列的步长,可以成倍的减少输出形状核大小最为关键,填充一般是默认核减1,步幅看需求输出通道数是卷积层的超参数每个输入通道有独立的二维卷积核,所有通道结果相加得到一个输出通道结果每个输出通道有独立的三维卷积核。

2024-06-18 09:10:11 372

原创 4.深度学习计算

构造一个没有任何参数的自定义层#向该层提供一些数据#将层作为组件合并到构建更复杂的模型中#定义带参数的图层def __init__(self, in_units, units):#in_units输入参数 units输出参数linear = torch.matmul(X, self.weight.data) + self.bias.data#matmul函数执行矩阵乘法#使用带参数的图层构建模型。

2024-06-15 09:44:05 43

原创 3.多层感知机

感知机是一个二分类模型,是最早的AI模型之一它的求解算法等价于使用批量大小为1的梯度下降 批量大小为1:指在训练神经网络时,每次更新参数时只使用单个样本的数据它不能拟合XOR函数,导致第一次AI寒冬多层感知机使用隐藏层和激活函数来得到非线性模型常用激活函数是Sigmoid,Tanh,ReLu使用Softmax来处理多类分类超参数为隐藏层数和各个隐藏层大小训练数据集:训练模型参数验证数据集:选择模型超参数非大数据集上通常使用K-则交叉验证。

2024-06-15 09:29:01 197

原创 2.线性神经网络

线性回归是对N维输入的加权,外加偏差使用平方损失来衡量预测值和真实值的差异线性回归有显示解,一般都网络都是非线性的没有显示解线性回归可以看做是单层神经网络梯度下降通过不断沿着反梯度方向更新参数求解小批量随机梯度下降是深度学习默认的求解算法两个重要的超参数是批量大小和学习率#初始化模型参数# PyTorch不会隐式(自动)地调整输入的形状。因此,#创建了一个简单的神经网络模型 net。

2024-06-13 11:28:52 293

原创 1.动手学习深度学习课程安排及深度学习数学基础

​ 首先,我们导入torch,注意,虽然它被称为pytorch,但我们应该导入torch而不是pytorch。矩阵相当于一个扭曲空间,把下图中的蓝线和绿线,扭曲到不同方向和长度。

2024-06-13 10:51:15 102

原创 我的创作纪念日——我就想获得一个纪念勋章,,嘿嘿嘿

提示:你过去写得最好的一段代码是什么?提示:当前创作和你的工作、学习是什么样的关系。提示:可以和大家分享最初成为创作者的初心。提示:在创作的过程中都有哪些收获。提示:职业规划、创作规划等​​。

2024-05-19 11:46:18 164

原创 150个 HTML5 成体系的网站模版 量大慢选 持续更新中

HTML5 网站模版 No.1 HTML5 网站模版 No.2

2024-04-13 14:50:03 432 1

原创 7个精选的矢量数据库和搜索引擎项目

向量数据库是一种用于存储、检索和分析向量的数据库。在图片搜索、语音搜索等应用中,不是直接存储和对比原始数据,而是使用向量表示,通常为256/512个浮点数数组。它提供标准的SQL访问接口,同时支持高效的数据组织、检索和分析能力,包括传统数据库管理结构化数据的能力。向量数据库解决两个主要问题:高效的检索和高效的分析。检索方面主要用于图片搜索,例如人脸、人体、车辆、商品图片等检索,甚至人脸支付。分析方面广泛应用于安全领域,如人脸撞库,通过对比相似案发现场周边的人像等。

2023-12-16 20:12:20 1007 1

原创 Redis-Stack项目

推荐理由:RedisGraph是一个基于Redis的图数据库扩展,它使用图结构来存储和查询数据,提供了快速的图遍历和图分析功能。推荐理由:RedisBloom是一个在Redis上实现的布隆过滤器和其他数据结构的扩展,可以提供高效的元素查找和去重功能,适用于大规模数据集的快速筛选和过滤,具有较低的误判率和高效的存储利用率。项目标签:[搜索模型] [内存数据库] [NoSQL] [搜索引擎]项目标签:[搜索模型] [内存数据库] [NoSQL]项目标签:[图模型] [内存数据库] [NoSQL]

2023-12-16 08:00:00 180

原创 7个计算机视觉领域的项目精选

它提供了方便的方式帮助用户在视频中追踪和分割感兴趣的对象,为视频分析和处理提供了实用的工具。推荐理由:这个项目可以自动分割和识别图像、视频和音频中的任何对象,无需深度学习专业知识,是一个非常实用的图像处理工具。推荐理由:这个创意动画工具使用对象检测模型、姿态估计模型和基于图像处理的分割方法,可以快速创建数字版的图画,并通过传统的计算机图形技术进行变形和制作成动画。推荐理由:SEEM允许用户使用不同类型的提示轻松分割图像,包括视觉提示(点,标记,框,涂鸦和图像段)和语言提示(文本和音频)等。

2023-12-14 16:10:55 1022

原创 ChatGPT热门项目

推荐理由:这是由开发者Significant Gravitas推出的项目,可根据你设置的目标,使用GPT-4自动帮你完成所有的任务。推荐理由:开源双语对话语言模型,一个基于大型预训练语言模型 GPT 的对话生成模型,用 GPT-2 进行微调,支持中文和英文,让机器变得更有智能。推荐理由:一个增强视觉语言理解的工具,基于先进的大型语言模型。推荐理由:一个开源的聊天机器人生态系统,它在大量辅助数据上进行了训练,具有强大的对话生成能力。推荐理由:用于学术研究的GPT模型,可生成论文、摘要和对话等。

2023-12-14 15:25:49 497 1

原创 回味童年经典游戏的项目

推荐理由:吃豆人(Pac-Man)是一个比较经典的游戏,最早由同名街机游戏移植至Atari 2600平台的游戏,最早由南梦宫公司于1980年在街机上推出,后由雅达利公司于1982年3月中旬发售Atari 2600版。在线试玩:http://martindrapeau.github.io/backbone-game-engine/super-mario-bros/index.html。在线试玩网址:https://battle-city.js.org/#/stage/1。主要语言:JavaScript。

2023-12-10 22:18:07 101

原创 为什么Git的教程都那么繁杂?

作为产品设计,为了让“单一的操作出现单一的结果“,就必须对上述情况进行简化,例如 ”要删除云端的文件,必须先满足所有设备对 A.jpeg 的共识是一致的“,从而确认 “删除云端“ 的操作,不会因为其他设备的后续同步带来歧义。即使只有1个设备,也按多设备的方案去处理。只不过,绝大部分人没有深度思考 + 拆分的能力,而觉得 “实时同步“ 很简单,即 “你按我脑海中的想法去做,我想留就留,我想删就删,如果我想错了,你还得救回来“。对用户而言,一个单一的 “删除云端文件操作”,根据不同的情形,它的结果是不单一的。

2023-11-22 09:39:46 75

原创 为何电脑要设置网络掩码?

成功获得了网关的MAC地址,就可以将访问IP = 8.8.8.8的IP报文打包了,目的MAC = 网关的MAC。成功获得之后,TCP/IP协议栈完成了以太网头的封装,就可以将封装好的报文朝着网卡接口的方向向下流动,顺着网线/无线流动出去,最后被对方接收。电脑访问 IP = 6.6.6.8,使用网络掩码255.255.255.0的“255.255.255”,从左到右对齐掩盖6.6.6.8,被遮住的数字为“6.6.6”,至于网关如何处理,也不需要关心,因为电脑已经成功完成自己的判断逻辑,完成了自己的任务。

2023-11-13 11:32:50 372

原创 仓库管理系统源代码集合,带图片展示和网站演示

1、主要功能:计费配置、仓库配置、基础配置、计费管理、基础资料、仓库管理、月台管理、进货管理、出货管理、退货管理、库内管理、盘点管理、库存查询、PDA功能、分析报表、分析图表、域验证。• 入库:创建入库单后包括如下几个状态:未发货、在途(已发货未入库)、部分入库、作废、入库完成,入库类型包括:采购入库、外协入库、退货入库,入库单支持lodop和网页打印。2、资产:资产管理、资产模板、资产入库、资产出库、资产挑拨、资产盘点3、耗材:耗材管理、耗材入库、耗材出库、耗材挑拨、耗材盘点。

2023-10-28 21:19:41 3808 2

原创 ICML2021 | RSD: 一种基于几何距离的可迁移回归表征学习方法

dSprites中有4个回归任务和1个分类任务,如下表所示,但由于方向(Orientation)任务无法完全解耦(不同形状的物体,旋转角度的周期性不同),所以我们在此数据集中的回归任务为物体大小(Scale)和位置的横纵坐标(Position X, Position Y)。相关的图像示例如下图所示,由于共有3个领域,所以共可构建6个迁移任务。

2023-10-16 10:27:17 839

原创 机器学习的原理是什么?

模型(Model):模型就像是电脑的“大脑”的决策用来处理和学习数据。你可以想象它为一个迷工厂,输入数据进去,输出结果。数据集(Dataset):数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。标签(Label):标签是对数据集中每一项数据的解释或标记。比如,在一个由猫和狗照片组成的数据集中,每张照片会被标签为“猫”或“狗”。训练(Train)和测试(Test):训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。

2023-10-14 10:45:54 906 1

原创 盘点15个前端项目,yyds!

其支持书架管理、搜索、书海、看书、换源、翻页方式、手势支持、自定义主题、自定义样式、WebDAV同步、文字替换过滤、听书、用户配置备份恢复、漫画、音频、书源失效检测、导入本地TXT、EPUB、UMD格式的书籍、书籍分组、RSS订阅、定时更新书架、并发搜书、本地书仓等功能。该游戏凭借诙谐幽默的文案,和出乎意料的结局,风靡一时。一个开源的收录 Node.js 生态系统各种资源的项目,其中包括了 Node.js 框架、库、工具、文档和文章等各个方面,是一个非常受欢迎和权威的 Node.js 资源收集项目。

2023-10-13 14:42:08 563

原创 带你吃透Reactor并发模型

最近有很多小伙伴私信问春哥是否有适合的C++项目,可用于学习Linux下的后端研发,并涵盖核心技术点。春哥的答复有,马上安排上,于是我连续几天爆肝,为大家编写了一个名为EchoServer的项目,供大家学习使用。「回显服务是一个非常经典的网络服务,它的基准性能常用于评估一个RPC框架的性能」。在EchoServer项目中,我们将使用多种Reactor并发模型来实现回显服务,并使用基准性能压测工具对不同并发模型进行压测,以得到不同并发模型的基准性能指标,以便对比不同并发模型的优劣。

2023-08-31 13:09:30 179

原创 第三讲,实践编程 Eigen

​ Eigen是一个 C++ 开源线性代数库。它提供了快速的有关矩阵的线性代数运算,还包括解方程等功能。许多上层的软件库也使用 Eigen 进行矩阵运算,包括 g2o、Sophus 等。​ 相比于其他库,Eigen 特殊之处在于,它是一个纯用头文件搭建起来的库。这意味着你只能找到它的头文件,而没有.so 或.a 那样的二进制文件。我们在使用时,只需引入 Eigen 的头文件即可,不需要链接它的库文件(因为它没有库文件)。

2023-08-29 15:08:42 99

原创 第三讲,旋转向量和欧拉角

​ 三维旋转是一个三维流形,想要无奇异性地表达它,用三个量是不够的。我们用复数集 C 表示复平面上的向量,而复数的乘法则 能表示复平面上的旋转:例如,乘上复数 i 相当于逆时针把一个复向量旋转 90 度。类似 的,在表达三维空间旋转时,也有一种类似于复数的代数:四元数(Quaternion)。​ 欧拉角的一个重大缺点是会碰到著名的万向锁问题:在俯仰角为 ±90◦ 时,第一次旋转与第三次旋转将使用同一个轴,使得系统丢失了一个自由度(由三次 旋转变成了两次旋转)。反之,若它的实部为 0,称之为虚四元数。

2023-08-28 16:06:05 1364

原创 第三讲,三维空间刚体运动

这个矩阵由两组基之间的内积组成,刻 画了旋转前后同一个向量的坐标变换关系。只要旋转是一样的,那么这个矩阵也是一样的。可以说,矩阵 R 描述了旋转本身。因此它又称为。

2023-08-27 17:05:12 217

原创 cmake的基础概念,语法特性,Cmake重要指令,编译过程

基本语法格式:指令(参数1 参数2 …)​ 参数使用括弧括起来​ 参数之间使用空格或分号分开指令是大小写无关,参数和变量是大小写相关的变量使用方式取值,但是在IF控制语句中是直接使用变量名,如if{}方式取值,但是在IF控制语句中是直接使用变量名,如if(方式取值,但是在IF控制语句中是直接使用变量名,如if{hello}) 错误的 应该是 if(hello)

2023-08-03 09:30:03 199

原创 理解Cookie、Session与Token三者的区别及使用

过期时间可设置的,如不设,则浏览器关掉就消失了,存储在内存当中,否则就按设置的时间来存储在硬盘上的,过期后自动清除,比方说开关机关闭再打开浏览器后他都会还存在,前者称之为Session cookie 又叫 transient cookie,后者称之为Persistent cookie 又叫 permenent cookie。如果永远只是自己的网站,自己的 App,用什么就无所谓了。Token ,如果指的是OAuth Token 或类似的机制的话,提供的是 认证和授权 ,认证是针对用户,授权是针对App。

2023-07-16 15:45:37 183

原创 Slam十四讲之第一讲和第二讲,实践编程基础

顺便说明一下,这里标的是AMD64,但是也支持EM64T架构,所以无论你的电脑是AMD处理器还是Intel处理器,都可以使用。两种,静态库以 .a 作为后缀名,共享库以 .so 结尾。cmake . 的时候生成许多中间文件,这样把CMakeLIsts.txt和main.cpp和中间文件放在一起,非常影响,最常规的做法是,cmake生成这些的中间文件单独放到一个build文件夹中。最重要的CD的配置,选择新CD/DVD(SATA),在左侧选择“使用ISO镜像文件”,并填入刚才下好的镜像文件路径,

2023-07-13 16:23:42 176

原创 既然有指针了,为什么 C++ 还搞个引用出来?

对象是指一块能存储数据并具有某种类型的内存空间;一个对象a,它有值和地址&a,运行程序时,计算机会为该对象分配存储空间,来存储该对象的值,我们通过该对象的地址,来访问存储空间中的值;指针:它保存一个值(或 null)的地址,可以检索指向该地址处的值。指针定义时,可以不用初始化;指针可以初始化为NULL,指针的在初始化后, 其地址值仍可以改变, 用于存储另外一个地址;指针p也是对象,它同样有地址&p和存储的值p,只不过,p存储的数据类型是数据的地址。

2023-07-06 17:24:49 189

原创 在C++中线程join了之后,主线程会阻塞等待这个线程执行完毕,这个线程那不就和普通函数差不多了吗?

在C++中,。但是,线程和普通函数之间仍然存在一些重要的区别。因此,尽管线程通过join操作会导致主线程阻塞等待,看起来与普通函数的执行类似,但线程仍然具有并发执行、独立的执行环境、共享数据和同步、平行计算能力以及生命周期管理等特性,使其在处理复杂的并发任务时非常有用。

2023-07-01 14:16:13 1215 1

原创 C 语言和 C++ 中的 const 有什么不一样?

在C++中,const成员函数的声明后面会有一个const修饰符,用于表示该成员函数不会修改该类的成员变量。在代码中,printData()函数被声明为只读成员函数,可以在常量对象上调用。而在C++中,const关键字不仅可以用于声明只读变量,还可以用于声明只读成员函数、只读参数、只读引用等。在上面代码中,变量x被声明为只读(不可修改)的常量,因此尝试对其进行赋值操作会导致编译错误。在C++中,可以使用const引用来引用常量对象,这样可以保证无法通过该引用修改对象的状态。

2023-06-24 15:30:18 70

原创 Java使用泛型好还是使用基类好?

对于给定的示例场景,如果只是传入Parent的子类,并且方法的返回值是void,那么使用泛型和基类的差别不是很明显。但是如果方法需要处理多种类型的数据,或者需要返回不同类型的结果,那么使用泛型方法会更加便捷和灵活,也更符合Java的语言特性。如果方法只需要处理Parent类及其子类的数据,并且方法的返回值是void,那么使用基类作为参数传入也是合理的。

2023-06-22 16:10:24 279

基于python的网页自动化工具 既能控制浏览器,也能收发数据包

基于python的网页自动化工具。既能控制浏览器,也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大,内置无数人性化设计和便捷功能。语法简洁而优雅,代码量少。

2024-07-22

基于Megatron和DeepSpeed库的GPU上模型并行自回归变换器的实现

基于Megatron和DeepSpeed库的GPU上模型并行自回归变换器的实现

2024-07-22

OpenMMLab多模式高级生成智能创建工具箱

OpenMMLab多模式高级生成智能创建工具箱。解锁魔法: 生成式人工智能(AIGC)、易于使用的API、awsome模型动物园、扩散模型、用于文本到图像生成、图像/视频恢复/增强等。

2024-07-22

SuperGlue原版论文

SuperGlue原版论文

2024-07-22

Matplotlib styles for scientific plotting

Matplotlib styles for scientific plotting

2024-07-22

中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型

中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models) 本项目基于Meta发布的可商用大模型Llama-2开发,是中文LLaMA&Alpaca大模型的第二期项目,中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语义和指令理解能力,相比一代相关模型获得了显著性能提升。相关模型支持FlashAttention-2训练。标准版模型支持4K上下文长度,长上下文版模型支持16K、64k上下文长度。RLHF系列模型为标准版模型基础上进行人类偏好对齐精调,相比标准版模型在正确价值观体现方面获得了显著性能提升。

2024-07-22

一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频

一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频

2024-07-22

机器翻译API,自托管、可离线且易于设置

机器翻译API,自托管、可离线且易于设置。

2024-07-11

TinyLlama项目旨在在3万亿tokens上进行预训练,构建一个拥有11亿参数的Llama模型

The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.

2024-07-11

GPT2训练代码的中文版,使用BERT标记器

GPT2训练代码的中文版,使用BERT标记器。

2024-07-11

a pytorch implementation for MoCo V3

a pytorch implementation for MoCo V3

2024-07-10

vits2 backbone with multilingual-bert

vits2 backbone with multilingual-bert

2024-07-10

基于深度学习的中文语音识别系统

A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统

2024-07-10

Python client for Baidu Yun (Personal Cloud Storage) 百度云/百度网盘Pyt

Python client for Baidu Yun (Personal Cloud Storage) 百度云/百度网盘Python客户端

2024-07-10

PaddlePaddle:包括许多有趣的应用程序,如一阶运动传递、Wav2Lip、图片修复、图像编辑等

PaddlePaddle:包括许多有趣的应用程序,如一阶运动传递、Wav2Lip、图片修复、图像编辑、photo2cartoon、图像风格传递、GPEN等。

2024-07-10

提供同花顺客户端/国金/华泰客户端/雪球的基金、股票自动程序化交易以及自动打新

提供同花顺客户端/国金/华泰客户端/雪球的基金、股票自动程序化交易以及自动打新,支持跟踪 joinquant /ricequant 模拟交易 和 实盘雪球组合, 量化交易组件

2024-07-10

dockerfile:docker18+ubuntu18.04+cuda11.7

dockerfile:docker18+ubuntu18.04+cuda11.7

2024-07-10

关于大型基础模型的微调和推理的可扩展工具包 适用于所有人的大型模型

关于大型基础模型的微调和推理的可扩展工具包。适用于所有人的大型模型。

2024-07-03

易于使用的图像分割库,具有出色的预训练模型

易于使用的图像分割库,具有出色的预训练模型,支持语义分割、交互式分割、泛光分割、图像Matting、3D分割等广泛的实际任务。

2024-07-03

python库旨在使开发人员能够构建具有独立计算机视觉功能的应用程序和系统

python库旨在使开发人员能够构建具有独立计算机视觉功能的应用程序和系统 A python library built to empower developers to build applications and systems with self-contained Computer Vision capabilities

2024-07-01

因此vitssvc fork具有实时支持、改进的接口和更多功能

因此vitssvc fork具有实时支持、改进的接口和更多功能。

2024-07-01

AKShare是一个优雅而简单的Python金融数据接口库,专为人类构建!

AKShare是一个优雅而简单的Python金融数据接口库,专为人类构建!

2024-07-01

Prowler是AWS、Azure、GCP和Kubernetes的安全工具,用于进行安全评估、审计、事件响应、合规性、持续监控

Prowler是AWS、Azure、GCP和Kubernetes的安全工具,用于进行安全评估、审计、事件响应、合规性、持续监控、强化和取证准备。包括CIS、NIST 800、NIST CSF、CISA、FedRAMP、PCI-DSS、GDPR、HIPAA、FFIEC、SOC2、GXP、体系结构良好的安全性、ENS等

2024-07-01

YOLOv3 in PyTorch > ONNX > CoreML > TFLite

YOLOv3 in PyTorch > ONNX > CoreML > TFLite

2024-07-01

易于使用的语音工具包,包括自监督学习模型、带标点符号的SOTA/流式ASR、带文本前端的流式TTS、说话人验证系统、端到端语音

易于使用的语音工具包,包括自监督学习模型、带标点符号的SOTA/流式ASR、带文本前端的流式TTS、说话人验证系统、端到端语音翻译和关键词识别。荣获NAACL2022最佳演示奖。

2024-06-30

PyGWalker:将您的Panda数据帧转换为用于可视化分析的交互式UI

PyGWalker:将您的Panda数据帧转换为用于可视化分析的交互式UI

2024-06-30

一个可扩展的生成人工智能框架,为研究大型语言模型、多模式和语音人工智能(自动语音识别和文本到语音)的研究人员和开发人员构建

一个可扩展的生成人工智能框架,为研究大型语言模型、多模式和语音人工智能(自动语音识别和文本到语音)的研究人员和开发人员构建

2024-06-30

与您的数据库(SQL、CSV、pandas、polars、mongodb、noSQL等)聊天

与您的数据库(SQL、CSV、pandas、polars、mongodb、noSQL等)聊天。PandasAI使用LLM(GPT 3.5/4、Anthropic、VertexAI)和RAG进行数据分析对话。

2024-06-28

关于使用且功能强大的NLP和LLM库令人惊叹的模型应用

关于使用且功能强大的NLP和LLM库令人惊叹的模型应用,支持从研究到工业应用的广泛NLP任务,包括文本分类,神经搜索,问答,信息提取,文档智能, 情绪分析等。

2024-06-28

RWKV是一种具有变压器级LLM性能的RNN

RWKV是一种具有变压器级LLM性能的RNN。它可以像GPT(可并行化)一样直接进行训练。因此,它结合了RNN和transformer的优点——高性能、快速推理、节省VRAM、快速训练、“无限”ctx_len和自由句子嵌入。

2024-06-28

基于AWEL和Agent的人工智能原生数据应用程序开发框架

基于AWEL(Agentic Workflow Expression Language)和Agent的人工智能原生数据应用程序开发框架

2024-06-28

使用CLIP对图像和句子进行可扩展的嵌入、推理和排名

使用CLIP对图像和句子进行可扩展的嵌入、推理和排名

2024-06-28

基于 PaddlePaddle的目标检测工具包

基于 PaddlePaddle的目标检测工具包。它支持对象检测、实例分割、多对象跟踪和实时多人关键点检测。

2024-06-28

Python包是在现有DL框架的基础上构建的,旨在简化图形上的深度学习

Python包是在现有DL框架的基础上构建的,旨在简化图形上的深度学习。

2024-06-28

一个用于自动化机器学习生命周期的开源AutoML工具包

一个用于自动化机器学习生命周期的开源AutoML工具包,包括特征工程、神经架构搜索、模型压缩和超参数调整。

2024-06-28

利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI

利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.

2024-06-28

人人影视 机器人和网站,包含人人影视全部资源以及众多网友的网盘分享

人人影视 机器人和网站,包含人人影视全部资源以及众多网友的网盘分享

2024-06-27

12306 购票助手,支持集群,多账号,多任务购票以及 Web 页面管理

12306 购票助手,支持集群,多账号,多任务购票以及 Web 页面管理

2024-06-27

Langchain聊天等语言模型的本地知识库问答

Langchain聊天等语言模型的本地知识库问答 | Langchain Chatchat(前身为Langchain ChatGLM),基于本地知识的LLM(与ChatGLM类似)与Langchain的QA应用程序

2024-06-24

未来十年的自然语言处理 标记化、词性标记、命名实体识别、句法和语义依赖分析、文档分类

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

2024-06-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除