自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 [学习笔记]pytorch tutorial

使用预训练的ResNet 18 CNN,有18层深(CNN的层数一般就是指具有权重/参数的层数总和),可以进行1000分类。会创建一个简单的flask应用,带有rest api,并且以json数据作为返回。实现激活函数:nn.xxx, torch.xxx, F.xxx。成更高维度的tensor,其拓展的维度由。3.如何保存和加载Checkpoint。4.在GPU/CPU上保存/加载。pytorch会进行数字数字分类。是将相同大小的tensor。2.只需要保存参数(推荐)衡量分类模型的表现。

2024-04-03 15:58:56 698 2

原创 [学习笔记]CNN代码实战

1.2.

2024-03-23 18:00:00 354

原创 [学习笔记]刘知远团队大模型技术与交叉应用L6-基于大模型文本理解和生成介绍

IR系统分为两个阶段:Retrieval阶段:对整个文档库排序后,抽回一部分相关文档的子集。主要考虑召回率。Re-Rankink阶段:精排序主要的机器问答类型:机器阅读理解、开放域问答、基于知识库问答、对话式QA完形填空多选抽取式阅读理解(原文找答案)data-to-text: 可以把一些非语言性的表示的信息,通过模型,以人类可以理解的语言表示出来。例子:seq2seq比较知名的模型:T5T5是在一个被清洗过的爬取的数据集上训练的。输入时,会将其中一部分mask,在训练和模型策略上。

2024-02-02 15:05:35 427

原创 [学习笔记]刘知远团队大模型技术与交叉应用L5-BMSystem

表现:高效,便宜使用时只需要进行简单替换。介绍大规模预训练模型压缩的相关技术。以及相关工具包BMCook。下表是PLMs模型增长的趋势。如何将大规模的计算量降下来,同时保留PLMs学习到的能力。所以希望将大规模模型压缩。同时小模型基本上继承大模型的能力。有效的方法可能包括:知识蒸馏;模型剪枝;模型量化;模型的专家化现在的PLMs是十分过参数化的。有一些方法被用于提高模型效率。BMCook是一个工具包。它的目的是结合已有的有效的模型压缩方法,加速现有大规模模型。

2024-01-28 21:56:45 831

原创 [学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

预训练和fine-tuning有一定的gap。毕竟是不同的任务。通过额外增加模版。映射到标签的过程称为verbalizer。这样就使用了mask任务。弥补了不同之间的gap。

2024-01-21 22:47:30 671

原创 [学习笔记]刘知远团队大模型技术与交叉应用L3-Transformer_and_PLMs

BPE提出主要是为了解决OOV的问题:会出现一些在词表中没有出现过的词。

2024-01-21 22:47:08 521

原创 [学习笔记]刘知远团队大模型技术与交叉应用-汇总

视频:【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战[学习笔记]刘知远团队大模型技术与交叉应用L1-NLP&Big Model Basics[学习笔记]刘知远团队大模型技术与交叉应用L2-Neural Network Basics

2024-01-14 21:08:55 499

原创 [学习笔记]刘知远团队大模型技术与交叉应用L2-Neural Network Basics

本节首先介绍神经网络的一些基本构成部分。然后简要介绍神经网络的训练方式。介绍一种基于神经网络的形成词汇的向量表示的方法。接下来继续介绍常见的神经网络结构:RNN和CNN。最后使用PyTorch演示一个NLP任务的一个完整训练的Pipeline。

2024-01-14 21:08:22 881

原创 [学习笔记]刘知远团队大模型技术与交叉应用L1-NLP&Big Model Basics

相关知识,如Linux命令,Git命令等,需要自己了解。

2024-01-14 21:06:45 1401

原创 [学习笔记]PageRank算法

对于Column Stochastic矩阵,由Perreon-Frobenius定理,最大的特征值就是1,且存在唯一的主特征向量(特征值1对应的特征向量),向量所有元素求和为1。random walks with restarts:随机游走,并有传送到指定的一个节点,继续游走。pagerank的一种解释是:随机游走,并有概率随机传送到网络中的任意一个节点,继续游走。所以考虑一个网站是否重要,需要看引用它的网站是否重要,这就成了一个递归的问题。的节点的rank值,各自除以它的出度,再求和。

2023-09-11 17:46:22 637 1

原创 [学习笔记]Node2Vec图神经网络论文精读

参考资料:https://www.bilibili.com/video/BV1BS4y1E7tf/?

2023-09-10 12:13:01 371

原创 [学习笔记]词向量模型-Word2vec

skip-gram只有一组完整的中心词向量,没法像之前一样将中心词向量和周围词向量相加求平均。与skip-gram的层次softmax的区别是u0是上下文词向量avg。开n次方根是为了避免长句子的概率比小句子概率小,导致评价偏颇。重要的词往往出现的频率比较小,不重要的词往往出现的频率比较高。语言模型是计算一个句子是句子的概率的模型。下面的skip-gram和cbow也都是Log线性模型。不同模型的E和T认为一样,所以下面用Q来代表模型复杂度。简单,但词越多,向量越长。语言模型是无监督的,不需要标注语料。

2023-09-10 10:16:23 326

原创 [学习笔记]DeepWalk图神经网络论文精读

核心思想:随机游走=句子GVEG=(V,E)GVEGLVEXYGL​VEXYX∈R∣V∣×SX∈R∣V∣×S:每个节点有S维特征Y∈R∣V∣×∣Y∣Y∈R∣V∣×∣Y∣:每个节点有YY个标签任务:relational classification(不满足独立同分布假设)目标:学到XE∈Rr∣V∣×dXE​∈Rr∣V∣×d​:d是词嵌入后的维度。

2023-09-09 11:46:45 310

原创 [学习笔记]CS224W(图机器学习) 2022/2023年冬学习笔记

介绍的结构特征可以分为:节点的度不同节点的重要度度量可用于预测有影响力的节点节点的度聚类系数GDV可用于预测节点在图中的功能,桥接、枢纽、中心。

2023-09-06 16:08:02 850

原创 [学习笔记]微信小程序全套开发流程(ing)

略。

2023-08-08 18:00:32 285

原创 [学习笔记]3小时搞定DRF框架 | Django REST framework前后端分离框架实践

DRF(全称Django REST framework)是一个用于构建 Web API 的强力工具集,是一个基于Django的Python Web框架,它为开发人员提供了一套快速开发 RESTful API 的工具,它能够自动化 API 可视化、文档化,实现接口的自动化测试以及自动化的API路由、序列化、视图、验证、分页、版本管理、认证等等功能。DRF简化了API的开发,并提供了一系列的工具来构建高质量的API。学习目标:使用DRF开发RESTful API接口。

2023-08-03 13:51:53 2359

原创 [学习笔记]全面掌握Django ORM

Django的ORM详解在django中,应用的文件夹下面会自动建一个models.py文件。模型类的优势与劣势优势:让开发人员专注于业务逻辑处理,提高开发效率。不需要在业务逻辑代码中编写原生sql语句了。用操作对象方式来操作数据库。缺点:一定程度上牺牲程序执行效率。orm写久了可能会忘记怎么写sql。Django Meta元数据类属性解析每个模型类下面都有一个子类:Meta这个类就是定义元数据的地方用于定义数据库或者数据表相关的信息如设置表明,设置排序,设置唯一键等。

2023-07-27 16:30:31 674

原创 [学习笔记]drf+vue前后端分离开发必备

最新版vue自学教程(drf+vue前后端分离开发必备) [学习笔记]drf+vue前后端分离开发必备1.vue.js初体验2. vue常见指令2.1 插值表达式2.2 v-bind指令2.2.1 v-bind指令简写和单向绑定2.3 v-model指令2.3.1 更多相关标签示例2.4 v-for指令2.5 v-on指令案例:数据管理2.6 v-if指令2.7 v-show指令案例:用

2023-07-21 16:37:43 307

原创 [学习笔记]python的web开发全家桶2

创建连接,创建游标cursor,用游标execute执行sql语句,然后断开连接。动态执行sql,千万不要用字符串格式化去做sql拼接,会有安全隐患SQL注入。安装完会有django-amin.exe和django模块。varchar,节省空间。MySQL,本质上就是一个软件。

2023-06-27 18:01:15 453

原创 [学习笔记]python的web开发全家桶1-前端

源学习视频目的:开发一个平台(网站)前端开发:HTML、CSS、JavaScriptWeb框架:接收请求并处理MySQL数据库:存储数据地方快速上手:基于Flask Web框架让你快速搭建一个网站出来。深入学习:基于Django框架(主要)1.快速开发网站from flask import Flaskapp = Flask(__name__)# 创建了网站/show/info和函数index的对应关系# 以后用户在浏览器上访问/show/info,网站自动执行index

2023-05-11 10:22:37 3536

原创 [助人为乐]层次分析法

朋友论文需要用到层次分析法。于是回顾了一下。

2023-04-18 00:24:33 669

原创 [学习笔记]金融风控实战

数据探索性分析是我们初步了解数据,熟悉数据为特征工程做准备的阶段,甚至很多时候EDA阶段提取出来的特征可以直接当作规则来用。可见EDA的重要性,这个阶段的主要工作还是借助于各个简单的统计量来对数据整体的了解,分析各个类型变量相互之间的关系,以及用合适的图形可视化出来直观观察。希望本节内容能给初学者带来帮助,更期待各位学习者对其中的不足提出建议。数据预处理:a. 缺失值的填充b. 时间格式处理c. 对象类型特征转换到数值异常值处理:a. 基于3sigma原则b. 基于箱型图。

2023-04-11 10:54:21 573

原创 Python中的对象赋值和浅拷贝,深拷贝

在看一篇资料的时候.有两处代码.这个代码可以查看data_train,可查看到数据修改.但下面的代码查看data_train却无法查看到数据修改.

2023-04-05 17:20:02 73

原创 [学习笔记]PowerBI数据分析与可视化-B站数据大白

[学习笔记]PowerBI数据分析与可视化-B站数据大白

2023-03-28 10:22:53 3902

原创 [数据分析实战][37] 基于pandasql和plotly的数据科学家薪资分析与可视化 @ShowMeAI

[37]基于pandasql和plotly的数据科学家薪资分析与可视化 @ShowMeAI

2023-03-21 16:23:06 530

原创 [学习笔记]动手学深度学习v2

[学习笔记]动手学深度学习v2

2023-03-16 00:01:12 559

原创 [学习笔记]每天1小时学会数据分析、挖掘、清洗、可视化从入门到项目实战

[学习笔记]每天1小时学会数据分析、挖掘、清洗、可视化从入门到项目实战

2023-03-13 20:22:22 728

原创 [学习笔记]黑马程序员python教程

[学习笔记]黑马程序员python教程

2023-03-10 13:54:29 4115 1

原创 [学习笔记]黑马程序员Spark全套视频教程,4天spark3.2快速入门到精通,基于Python语言的spark教程

Spark解决什么问题?海量数据的计算,可以进行离线批处理、实时流计算、机器学习计算、图计算、通过SQL完成结构化数据的处理。

2023-03-04 14:42:25 4783 3

原创 [学习笔记]韩顺平-快速学习github -github教程 github视频 github入门

]韩顺平-快速学习github -github教程 github视频 github入门

2023-02-16 11:09:17 691 3

原创 [学习笔记]黑马程序员-Hadoop入门视频教程

[学习笔记]黑马程序员-Hadoop入门视频教程

2023-02-03 17:59:58 5197 1

原创 网络资源下载方式:http/https、ftp/sftp、BT种子、磁力下载、ed2k下载等的区别

http/https、ftp/sftp、BT种子、磁力下载

2023-02-03 15:35:40 9250 3

原创 家庭网络WIFI相关知识

家庭网络WIFI相关知识

2023-02-03 11:28:25 882

原创 利用SMB协议实现局域网内设备文件的共享

通过SMB协议可以实现主设备共享文件夹,及外部设备访问共享文件夹。这里的主设备可以是windows系统,macOS系统。外部设备可以是windows系统,macOS系统,ipad,iphone等。

2023-01-31 15:59:35 24176

原创 [学习笔记]2021韩顺平一周学会Linux

三个定制篇:linux怎么读linux是一个开源、免费的操作系统,其稳定性、安全性、处理多并发已经得到业界的认可,目前很多企业级的项目(c/c++/php/python/java/go)都会部署到Linux/unix系统上。常见的操作系统(windows、IOS、Android、MacOS、linux、Unix)linux吉祥物:企鹅TuxLinux之父:linus Torvalds、Git创作者、世界著名黑客、linux0.01版源码(不到1万行)

2023-01-02 21:42:00 6208 1

原创 密码学之DES,3DES与Python实现AES

DES(Data Encryption Standard-数据加密标准)属于对称加密,即使用相同的密钥来完成加密和解密。分组长度为8个字节64bit(密钥每个字节的最后一位都没有采用,所以有效位只有56位)。

2022-12-16 12:48:02 1095

原创 [学习笔记]Python for Data Analysis, 3E-附录A.高等Numpy

[学习笔记]Python for Data Analysis, 3E-附录A.高等Numpy

2022-11-29 13:15:00 265

原创 [学习笔记]Python for Data Analysis, 3E-9.绘图和可视化

[学习笔记]Python for Data Analysis, 3E-9.绘图和可视化

2022-11-29 13:00:00 286

原创 [学习笔记]Python for Data Analysis, 3E-10.数据聚合和组操作

[学习笔记]Python for Data Analysis, 3E-10.数据聚合和组操作

2022-11-29 13:00:00 366

原创 [学习笔记]Python for Data Analysis, 3E-11.时间序列

[学习笔记]Python for Data Analysis, 3E-11.时间序列

2022-11-29 13:00:00 779

学习笔记CNN实战代码

学习笔记CNN实战代码

2024-03-19

Advances in Natural Language Processing

Advances in Natural Language Processing

2024-01-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除