自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 收藏
  • 关注

原创 【实战教程】结合自定义损失函数采用LoRA微调Llama3-8B

结合自定义损失函数微调llama3

2024-04-28 15:37:22 309

原创 【实战教程】linux系统下载huggingface大模型教程

下载大模型

2024-04-24 11:03:57 418 1

原创 【NLP笔记】大模型微调方法概述

大模型微调理论概述

2024-04-11 19:09:33 796

原创 【NLP笔记】LLM应用之AI Agent & LangChain实战

AI Agent & LangChain

2024-04-03 16:08:24 1215

原创 【NLP笔记】大模型prompt推理(提问)技巧

LLM推理技巧

2024-03-28 16:24:02 1432

原创 【NLP笔记】预训练+Prompt Tuning新范式之LLM时代(GPT3...)

LLM时代

2024-03-25 12:45:28 930

原创 【NLP笔记】预训练+微调范式之OpenAI Transformer、ELMo、ULM-FiT、Bert..

NLP大爆炸

2024-03-20 18:29:36 745

原创 【NLP笔记】Transformer

Transformer深入理解

2024-03-19 19:45:16 847

原创 【NLP笔记】RNN总结

RNN理论总结

2024-03-19 10:15:57 1060

原创 【NLP笔记】文本向量化

在自然语言处理中,文本向量化(Text Embedding)是很重要的一环,是将文本数据转换成向量表示,包括词、句子、文档级别的文本,深度学习向量表征就是通过算法将数据转换成计算机可处理的数字化形式。

2024-03-15 10:12:54 1648

原创 【NLP笔记】文本分词、清洗和标准化

文本分词实用笔记

2024-03-13 19:32:59 487

原创 [MAC] Host key for github.com has changed and you have requested strict checking

2. 如果上述步骤报不存在该ip地址的key,可通过删除known_hosts文件。

2023-12-14 23:05:53 601

原创 git报错invalid object xxx和unable to read tree xxxxxx

电脑出问题了,导致git仓库像是被损坏了一样,执行git status就会报错unable to read ree,无法正常提交代码至仓库,原因是本地代码仓库.git文件损坏了,无法找到正确的提交历史和路径。利用线上仓库.git文件修复本地损坏的文件,再进行git status或者commit就正常了。

2023-11-30 11:10:50 1031

原创 Linux删除包含特殊字符、文件名过长且数量很多的文件

想删除包含特定文件名称的文件,当文件名过长时也能实现删除的作用。发现爆炸了,满屏幕的文件。

2023-11-29 13:24:20 622

原创 mac安装lrzsz出错Command failed with exit 128: git

若报错,则需要下载。若存在冲突需要卸载brew重新安装对应的brew;终端检查电脑是否安装了rz和sz。

2023-08-16 13:06:02 741

原创 【论文阅读】基于深度学习的时序预测——LTSF-Linear

而且随着选取的历史窗口长度的增加,误差可能会更大。个人理解:对于简单的平稳的时序数据而言,采用transformer肯定是杀鸡用牛刀,容易过拟合且耗时肯定比线性的要多,但是对于复杂的趋势、季节性、非平稳性数据而言,简单的线性模型应该是学习不到更深入的关系的;对于时序order的问题,相邻时间范围内的数据波动范围相似,所以不一定非要完全学习时序关系,而且transfomer会对关联性较大的部分计算出更大的权重,能够更好地自动提取关注区间,简单的线性肯定不能实现这种复杂依赖关系的提取;

2023-08-11 15:07:12 1142

原创 【论文阅读】基于深度学习的时序预测——Crossformer

多层级Encoder-Decoder:由于上一步会进行two-stage的注意力运算,因此在Decoder中会分别对不同阶段的结果进行解码,模型的输入最开始是细粒度patch,随着层数增加逐渐聚合成更粗粒度的patch。Dimension-Segment-Wise Embedding:对于多维时间序列,应该对每个维度的数据进行单独的数据表征,而不是在每个点位基于所有维度的数据进行数据表征,因此本文针对每个维度的指标进行独立向量化表征(线性转换+位置编码),更好地捕捉单变量的数据信息;

2023-08-11 14:27:47 1695

原创 【论文阅读】基于深度学习的时序预测——Pyraformer

本文是上海交通大学的团队发表的,背景仍然是如何降低计算复杂度&更好地进行长期依赖性关系的表征。

2023-08-11 14:06:51 1005 2

原创 【论文阅读】基于深度学习的时序预测——Non-stationary Transformers

本文还是清华大学THUML实验室的论文,背景是在历史的研究中,大多数时序预测方法都是针对平稳型数据,但是在实际生产过程中,大部分数据其实没有那么强的平稳性,因此本文想针对这种非平稳型的数据进行模型优化;

2023-08-11 13:10:14 1357

原创 【论文阅读】基于深度学习的时序预测——FEDformer

论文地址:github地址:参考解读:快速傅立叶变换:本文是阿里达摩院的一篇文章,也是针对长序列预测的,文章背景有以下几点:整体架构感觉和Autoformer有点类似,但是细节层面上的创新点主要体现在以下几个方面:Xx1​...xd​]Aa1​...am​∈Rm∗ddssdxqx∗wQQ​RY^UdL)UsL)XL1。

2023-08-11 11:01:55 2544

原创 【论文阅读】基于深度学习的时序预测——Autoformer

在本文的Encoder中,更注重关注时序数据的季节性特性,因此保留的数据都是经分解后的季节性数据;在Decoder中,会将分解后的季节性、趋势性时序都作为输入,并且将原始序列的部分数据拼接在初始位置,用于指导后续序列的预测,网络具体运算细节可以参考原文;

2023-08-10 20:25:02 775

原创 【论文阅读】基于深度学习的时序预测——Informer

这篇文章是北航提出的一篇预测论文,在实际预测过程中,大多数需要基于长期的数据,否则根据短期数据预测出来的结果是不置信的,近年来的研究表明,transformer在时序序列预测上的潜力。

2023-08-10 18:59:51 1145 2

原创 【论文阅读】基于深度学习的时序异常检测——TimesNet

基于深度学习的异常检测-TimesNet

2023-08-09 20:32:57 1474 2

原创 【论文阅读】基于深度学习的时序异常检测——TransAD

基于深度学习的时序异常检测之-TransAD

2023-08-08 10:22:18 1488

原创 【论文阅读】基于深度学习的时序异常检测——Anomaly Transformer

基于深度学习的异常检测:Anomaly Transformer

2023-08-07 14:27:09 1551 2

原创 MAC M1芯片安装python3.6环境

苹果M1芯片下的python3.6下载,纯干货

2022-10-16 19:25:21 5248 1

原创 机器学习可解释性之shap模块的使用——基础用法(一)

模型可解释性模块Shap的使用

2022-09-13 10:30:17 4692 6

原创 MAC系统Anaconda3虚拟环境出错pip is configured with locations that require TLS/SSL

Mac anaconda报错

2022-09-10 01:31:46 326

原创 dataframe根据条件对某一列数值进行更新

datafrme计算小技巧

2022-09-05 14:39:19 2538

原创 python日志记录:输出至控制台同时存储至文件

python日志记录

2022-08-14 19:31:19 2261 1

原创 决策树、GBDT、XGBOOST树的可视化、模型特征重要性

已训练好的模型树结构可视化

2022-08-03 09:55:16 954

原创 Python格式互转之dataframe、字典(dict)、其他对象

不定期更新

2022-04-25 10:20:49 3398

原创 Python时间序列缺失值填充

mark来源:时间序列缺失值填充import pandas as pd def fill_source(source, start_time, end_time): """ 采用窗口长度为5的移动均值对缺失值进行填充 @param source_df: @param start_time: 开始时间戳,str格式 @param end_time: 结束时间,str格式 @return:

2022-04-24 21:03:50 3104

原创 【并发编程】Python并发编程多线程、多进程、多协程进阶篇

线程、进程进阶篇

2022-04-17 21:27:45 718

原创 【并发编程】Python多线程、多进程、多协程入门篇

python多线程、多进程、异步IO基础概念与基本使用,偏了解向

2022-04-14 21:53:06 1988 2

原创 python一维时间序列平滑:移动平均、指数平滑、开尔曼滤波等

文章目录1. 移动平均2. 指数平滑3. 开尔曼滤波记录处理时间序列时需要用到的数据平滑方式参考博客:移动平均、指数平滑三阶指数平滑一阶指数平滑1. 移动平均import numpy as npimport pandas as pddf = pd.DataFrame()df["data"] = np.random.rand(20)# 数据也可以是series格式# 简单移动平均simp_moving_avg = df["data"].rolling(window=windo

2022-03-15 19:18:02 8664 4

原创 python时间格式转换

# str转struct_timeimport timecur_time = "2022-03-12 00:00:00"time_format = "%Y-%m-%d %H:%M:%S"cur_time = time.strptime(cur_time, time_format)print(cur_time)# time.struct_time(tm_year=2022, tm_mon=3, tm_mday=12, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=5

2022-03-08 09:58:03 580

原创 Tensorflow2学习笔记

文章目录1. 基础知识1.1 张量生成1.2 常用函数1.3 实例: 鸢尾花分类2. 神经网络的优化过程(手工实现)2.1 预备知识2.2 神经网络复杂度2.3 激活函数2.4 损失函数2.5 缓解过拟合2.6 优化器3. 搭建网络(内置八股方式)3.1 基础八股3.2 搭建网络结构类4. 搭建网络(进阶)4.1 自制数据集4.2 数据增强4.3 断点续训4.4 参数提取4.5 acc曲线与loss曲线4.6 应用程序:给图识物5. 卷积神经网络5.1 卷积层细节(CBAPD)5.2 LeNet5.3 In

2022-02-28 21:58:58 749

原创 MySQL学习笔记进阶— Linux安装等基础知识、索引及其优化等

文章目录1. Linux安装及配置等2. 连接join3. 索引4. 性能分析1. Linux安装及配置等下载地址:MySQL下载地址(选择不登陆下载)终端命令如下:# 检查当前系统是否安装过MySQLrpm -qa|grep -i mysql# 查看当前目录下的文件ls -l# 安装mysql的server端,显示进度条等信息rpm -ivh mysql的server文件.rpm# 安装mysql的client端,显示进度条等信息rpm -ivh mysql的client文件.rp

2021-12-21 15:25:48 884

原创 MySQL学习笔记(五)— 事务控制(TCL语言)、视图、变量、存储过程及函数等

文章目录1. 事务控制(ACID特性)2. 视图3. 变量4. 存储过程5. 函数6. 流程控制1. 事务控制(ACID特性)/*事务:一个或一组sql语句组成一个执行单元,这个执行单元要么全部执行,要么全部不执行事务的ACID(acid)属性: 1. 原子性(Atomicity):事务时不可分割的工作单位,事务中的操作要么都发生,要么都不发生; 2. 一致性(Consistency):事务必须使数据库从一个一致性状态变换到另一个一致性状态; 3. 隔离性(Isolation):一个事物的执

2021-11-15 17:44:05 584

链接milvus数据库实例

链接milvus数据库实例

2024-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除