- 博客(32)
- 收藏
- 关注
原创 Build a Large Language Model (From Scratch)第六章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 01:27:10
281
原创 Build a Large Language Model (From Scratch)第二章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 01:16:07
239
原创 Build a Large Language Model (From Scratch)第五章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 01:11:47
291
原创 Build a Large Language Model (From Scratch)第四章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 01:06:54
246
原创 Build a Large Language Model (From Scratch)第三章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 01:01:12
405
原创 Build a Large Language Model (From Scratch)第一章(gpt-4o翻译版)
来源:https://github.com/rasbt/LLMs-from-scratch?
2024-06-28 00:37:48
349
原创 Build a Large Language Model (From Scratch) 从头开始构建大型语言模型(第三章)学习笔记
图 3.2 该图描绘了我们将在本章中编码的不同注意机制,从自注意的简化版本开始,然后添加可训练权重。在下一章中,我们将围绕自注意力机制对 LLM 的其余部分进行编码,以查看它的实际效果并创建一个模型来生成文本。然后,解码器采用最终的隐藏状态开始生成翻译的句子,一次一个单词。为了解决我们无法逐字翻译文本的问题,通常使用具有两个子模块的深度神经网络,即所谓的。在本章中,我们将实现注意力机制的四种不同变体,如图 3.2 所示。图3.2中所示的这些不同的注意力变体是相互依赖的,我们的。
2024-04-30 01:32:00
1264
2
原创 Build a Large Language Model (From Scratch) 从头开始构建大型语言模型(第二章)学习笔记
LLM需要将文本数据转换为数值向量,称为嵌入,因为它们无法处理原始文本。嵌入将离散数据(如单词或图像)转换为连续向量空间,使它们与神经网络操作兼容。第一步,将原始文本分解为tokens,这些tokens可以是单词或字符。然后,tokens被转换为整数表示形式,称为token IDs。可以添加特殊tokens(例如和)来增强模型的理解并处理各种上下文,例如未知单词或标记(marking)不相关文本之间的边界。
2024-04-29 21:29:22
1840
原创 Mac 安装Ollama和llama3,本地部署LobeChat和刘皇叔聊三国
按下 Ctrl + D 可以退出终端交互,但此时模型并不会退出,仍旧可以正常通过 Api 接口交互。可以看到LobeChat运行在本地3210端口,浏览器打开。默认的LobeChat没有Czi模型,我们需要添加一下~运行之后,项目默认监听 11434 端口,终端查看。配置好了,可以跟刘皇叔在LobeChat中聊天啦!接下里是本地部署LobeChat,实现网页的交互。简单api交互例子,新打开一个终端,输入。创建刘备的个人聊天助手,新的模型我命名为。运行成功,可以在终端聊天了.如果是70B模型,可以参考。
2024-04-20 18:59:04
2927
原创 Build a Large Language Model (From Scratch) 从头开始构建大型语言模型(第一章)学习笔记
LLM 是一种大型语言模型,是一种旨在理解、生成和响应类人文本的神经网络。这些模型是在大量文本数据上训练的深度神经网络,有时涵盖互联网上整个公开文本的大部分。大语言模型中的“大”指的是模型的参数大小和训练它的巨大数据集。像这样的模型通常有数百甚至数千亿个参数,这些参数是网络中的可调整权重,在训练期间进行优化以预测序列中的下一个单词。下一个单词预测是明智的,因为它利用语言固有的顺序性质来训练模型来理解文本中的上下文、结构和关系。
2024-04-16 21:51:16
2969
8
原创 免费diy gpt账号
一分钟完成1. 注册outlook的邮箱2. 用outlook邮箱注册gpt1. 注册outlook的邮箱2. 用outlook邮箱注册gpt
2024-03-22 21:33:42
1395
2
原创 Gradio测试-->Gradio映射-->可视化GPT4V API-->Gemini Pro、Claude和Qwen的API
L:指定远程机器端口是1234,本地机器的端口号的8888。ip地址:远程机器的IP地址。用户名:远程机器的用户名。
2024-03-13 22:29:10
551
原创 最简单开通GPT-4方法 只需支付宝付款
(2)打开软件设置,开通ChatGPT Plus订阅。(1)进入App Store下载软件ChatGPT。(2)能使用ChatGPT环境。
2023-11-02 15:09:59
9475
3
原创 pip导出安装的库到 requirements.txt
pip 导入 requirements.txt 中列出的库安装到新环境。pip导出安装的库到 requirements.txt。
2022-10-19 16:45:49
356
原创 Ubuntu20.04安装CUDA和cuDNN
由于Tensoflow-gpu对cuda版本严格的要求,TensoFlow-gpu==2.5.0需要CUDA11.2版本才能使用GPU(conda安装的TensorFlow可以不用安装cuDNN,pip方式安装需要)。
2022-10-19 16:18:41
1142
1
原创 指定国内镜像源来安装某个库(使用pip安装 )
指定国内镜像源来安装某个库(使用pip安装 )http://pypi.douban.com/simple/
2022-09-13 21:30:36
2838
原创 全国行政边界矢量数据下载
下载数据采用1:100万标准图幅分发,内容包括水系、居民地及设施、交通、管线、境界与政区、地貌与土质、植被、地名及注记9个数据集,且保存要素间空间关系和相关属性信息。
2022-07-20 10:53:37
4495
原创 解决Got permission denied while trying to connect to the Docker daemon socket at.......问题
Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get "http://%2Fvar%2Frun%2Fdocker.sock/v1.24/containers/json": dial unix /var/run/docker.sock: connect: permission denied
2022-07-19 20:25:26
798
原创 Detectron2入门:Ubuntu 20.04上安装Detectron2
Detectron2支持目标检测、实例分割、姿态估计等任务,还支持语义分割和全景分割和CascadeR-CNN,PanopticFPN和TensorMask新模型。Detectron2基本的依赖是python大于等于3.6版本,pyTorch需要在1.8以及以上。
2022-07-18 21:37:07
618
原创 GEE上对长时间序列的NDVI的数据进行HANTS滤波
时间序列谐波分析法(HarmonicAnalysisofTimeSeries,HANTS)是平滑和滤波两种方法的综合,它能够充分利用遥感图像存在时间性和空间性的特点,将其空间上的分布规律和时间上的变化规律联系起来。时间序列谐波分解法进行影像重构时充分考虑了植被生长周期性和数据本身的双重特点,能够用代表不同生长周期的植被频率曲线重新构建时序NDVI影像,真实反映植被的周期性变化规律。............
2022-07-16 15:44:00
5127
11
原创 根据数值范围对数组重新赋值
使用 arange 创建一个行向量 temperature。这个行向量包含以0开始的前30个整数把张量temperature从形状为(30,)的行向量转换为形状为(5,6)的矩阵结束输出
2022-07-14 16:10:37
709
原创 gdal读取TIFF数据计算风速
使用10米的u和v分量数据。u为正,表示西风,从西边吹来的风。v为正,表示南风,从南边吹来的风。方法二:2. 计算风速3. gdal对风速重分类4. gdal输出影像导出tiff在arcgis或envi查看即可
2022-07-14 15:56:11
886
原创 GEE下载气象数据(降雨、气温、风向等)
ERA5 Monthly Aggregates - Latest Climate Reanalysis Produced by ECMWF / Copernicus Climate Change ServiceERA5 is the fifth generation ECMWF atmospheric reanalysis of the global climate. Reanalysis combines model data with observations from across the world
2022-07-13 23:14:02
8570
2
原创 在GEE平台提取Sentinel-1 SAR GRD的VV+VH波段
The Sentinel-1 mission provides data from a dual-polarization C-band Synthetic Aperture Radar (SAR) instrument at 5.405GHz (C band). This collection includes the S1 Ground Range Detected (GRD) scenes, processed using the Sentinel-1 Toolbox to generate a ca
2022-07-12 09:56:41
4000
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人