自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 爬虫入门--了解相关工具

非也~ 用Java也行, C也可以,请各位记住,编程语言只是工具,抓到数据是你的目的,用什么工具去达到你的目的都是可以的,和吃饭一样, 可以用叉子也可以用筷子, 最终的结果都是你能吃到饭,那为什么大多数人喜欢用Python呢?爬虫就是我们通过我们写的程序去抓取互联网上的数据资源. 比如, 此时我需要百度的资源. 在不考虑爬虫的情况下, 我们肯定是打开浏览器, 然后输入百度的网址, 紧接着, 我们就能在浏览器上看到百度的内容了. 那换成爬虫呢?其实道理是一样的. 只不过, 我们需要用。

2024-08-09 20:48:55 1574 40

原创 神经网络基础--激活函数

人工神经网络( Artificial Neural Network, 简写为ANN)也简称为神经网络(NN),是一种模仿生物神经网络结构和功能的 计算模型。人脑可以看做是一个生物神经网络,由众多的神经元连接而成。各个神经元传递复杂的电信号,树突接收到输入信号,然后对信号进行处理,通过轴突输出信号。下图是生物神经元示意图:当电信号通过树突进入到细胞核时,会逐渐聚集电荷。达到一定的电位后,细胞就会被激活,通过轴突发出电信号。本小节带着同学们了解下常见的激活函数,以及对应的 API 的使用。

2024-08-04 19:05:42 1538 20

原创 NLP--加载与使用预训练模型

🐵🐵所有上述预训练模型及其变体都是以transformer为基础,只是在模型结构如神经元连接方式,编码器隐层数,多头注意力的头数等发生改变,这些改变方式的大部分依据都是由在标准数据集上的表现而定,因此,对于我们使用者而言,不需要从理论上深度探究这些预训练模型的结构设计的优劣,只需要在自己处理的目标数据上,尽量遍历所有可用的模型对比得到最优效果即可.

2024-08-03 15:35:03 654 11

原创 fasttext工具介绍及迁移学习概念(包含训练词向量)

进行文本分类训练词向量。

2024-08-01 09:53:29 743 11

原创 Transformer--解码器,输出部分

由N个解码器层堆叠而成每个解码器层由三个子层连接结构组成第一个子层连接结构包括一个多头自注意力子层和规范化层以及一个残差连接第二个子层连接结构包括一个多头注意力子层和规范化层以及一个残差连接第三个子层连接结构包括一个前馈全连接子层和规范化层以及一个残差连接解码器中的多头注意力机制,规范化层,前馈全连接层,子层连接结构与编码器中的实现相同,我们可以直接拿来构建解码器层输出部分包含:线性层softmax层。

2024-07-29 10:33:18 978 11

原创 Transformer--编码器和解码器(包含掩码张量,注意力机制,多头注意力机制)

编码器部分: 由N个编码器层堆叠而成,每个编码器层由两个子层连接结构组成,第一个子层连接结构包括一个多头自注意力子层和规范化层以及一个残差连接,第二个子层连接结构包括一个前馈全连接子层和规范化层以及一个残差连接💡在讲述编码器的结构之前,我们先引入三个概念--掩码张量,注意力机制,多头注意力机制。

2024-07-28 13:07:53 1546 5

原创 Transformer--输入部分

输入部分主要包括源文本嵌入层以及位置编码器,目标文本嵌入层以及位置编码器。

2024-07-27 16:04:24 376 11

原创 Transformer--认识架构

在接下来的架构分析中, 我们将假设使用Transformer模型架构处理从一种语言文本到另一种语言文本的翻译工作, 因此很多命名方式遵循NLP中的规则. 比如: Embeddding层将称作文本嵌入层, Embedding层产生的张量称为词嵌入张量, 它的最后一维将称作词向量等。而在BERT中发挥重要作用的结构就是Transformer, 之后又相继出现XLNET,roBERT等模型击败了BERT,但是他们的核心没有变,仍然是:Transformer。

2024-07-25 17:51:29 666 11

原创 GRU模型

更新门重置门Bi-GRU与Bi-LSTM的逻辑相同, 都是不改变其内部结构, 而是将模型应用两次且方向不同, 再将两次得到的LSTM结果进行拼接作为最终输出. 具体参见上小节中的Bi-LSTM.

2024-07-21 09:47:56 893 15

原创 LSTM模型

🏷️在介绍LSTM模型之前,我们再次见一下CNN是什么?many-to-one: MNIST(glimpse输入)字符分类many-to-many: 机器翻译🏷️接下来我们先简单介绍传统的RNN模型,了解其优缺点根据反向传播算法和链式法则, 梯度的计算可以简化为以下公式。

2024-07-20 10:22:02 947 9

原创 认识RNN模型

RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出.RNN单层网络结构:以时间步对RNN进行展开后的单层网络结构:RNN的循环机制使模型隐层上一时间步产生的结果, 能够作为当下时间步输入的一部分(当下时间步的输入除了正常的输入外还包括上一步的隐层输出)对当下时间步的输出产生影响.

2024-07-18 21:04:07 1000 14

原创 XGboost

XGBoost(Extreme Gradient Boosting)是对梯度提升树的改进,并且在损失函数中加入了正则化项。目标函数的第一项表示整个强学习器的损失,第二部分表示强学习器中 K 个弱学习器的复杂度。γT 中的 T 表示一棵树的叶子结点数量,γ 是对该项的调节系数λ||w||2 中的 w 表示叶子结点输出值组成的向量,λ 是对该项的调节系数。

2024-07-17 19:54:02 1207 6

原创 C4.5决策树及CART决策树

Cart模型是一种决策树模型,它即可以用于分类,也可以用于回归,其学习算法分为下面两步:(1)决策树生成:用训练数据生成决策树,生成树尽可能大(2)决策树剪枝:基于损失函数最小化的剪枝,用验证数据对生成的数据进行剪枝。分类和回归树模型采用不同的最优化策略。Cart回归树使用平方误差最小化策略,Cart分类生成树采用的基尼指数最小化策略。Scikit-learn中有两类决策树,他们均采用优化的Cart决策树算法。

2024-04-23 14:55:08 900 16

原创 ID决策树的构造原理

有的同学可能在大学学习过一门课程叫《数据结构》,里面有一个重要的结构就是“树”,和现实生活中的树一样,树的主要由四部分树根树干树枝树叶组成,今天的决策树也是一种树结构,大家学习的时候可以想象现实生活中的树来来理解。决策树算法是一种监督学习算法,英文是Decision tree。决策树思想的来源非常朴素,试想每个人的大脑都有类似于if-else这样的逻辑判断,这其中的if表示的是条件,if之后的then就是一种选择或决策。

2024-04-22 19:56:43 1039 6

原创 分类的评估指标及不平衡数据的处理

'''y_true:真实目标值y_pred:估计器预测目标值labels:指定类别对应的数字target_names:目标类别名称return:每个类别精确率与召回率'''

2024-04-19 09:42:31 1509 12

原创 逻辑回归介绍

逻辑回归可以用于解决常见的分类问题,也是解决分类中常用的一种算法。在本章我们主要学习逻辑回归的应用场景了解逻辑回归的原理,掌握逻辑回归的损失函数和优化方案,最后,在介绍完分类评估指标后,我们应用逻辑回归模型实现案例。

2024-04-17 14:59:00 711 8

原创 梯度下降法及回归问题评估

首先,我们有一个可微分的函数。这个函数就代表着一座山。我们的目标就是找到这个函数的最小值,也就是山底。最快的下山的方式就是找到当前位置最陡峭的方向,然后沿着此方向向下走,对应到函数中,就是找到给定点的梯度,然后朝着梯度相反的方向,就能让函数值下降的最快!因为梯度的方向就是函数值变化最快的方向。所以,我们重复利用这个方法,反复求取梯度,最后就能到达局部的最小值,这就类似于我们下山的过程✏️这里介绍四种梯度下降算法,不做其他要求,了解即可。

2024-04-15 15:12:00 941 3

原创 线性回归及原理

初步了解线性回归

2024-03-24 14:52:45 883 5

原创 KNN算法API

K近邻中最主要的问题--K值的选择,分类模型贯穿整个机器学习

2024-03-22 10:50:09 1152 3

原创 初步了解K近邻

学习KNN算法之前我们需要了解的概念

2024-03-19 20:29:38 615 2

原创 机器学习相关概念--拟合问题

一个只能优化的问题

2024-03-18 16:18:49 854 1

原创 机器学习相关概念

机器学习的相关定义及概念

2024-03-17 16:23:51 1013 4

原创 WEB前端期末实训大作业---我的家乡

该网页从宣传自己的家乡出发,设计到家乡的旅游观光,生态环保,现代农业,人文精神,总共设计了五个页面,主要使用的布局房市flex布局,运用最基本的HTML内容。

2024-01-04 12:13:46 715 6

原创 数据结构算法--1 冒泡排序,选择排序,插入排序

思想就是将相邻元素两两比较,当一个元素大于右侧相邻元素时,交换他们的位置,小于右侧元素时,位置不变,最终序列中的最大元素,像气泡一样,到了最右侧。这时第一轮结束,数列最右侧元素9的位置可认为是一个有序区,有序区目前有一个元素.第二轮排序结束后,数列右侧的有序区有了两个元素.由于该每一轮都要遍历所有元素,平均时间复杂度为O(n*n)

2023-12-27 19:34:36 531 7

原创 Linux用户和权限

普通用户使用sudo 的前提: 需要在root用户下 修改sudoers 文件, 将普通用户添加到这个文件中,普通用户才可以使用sudo。DNS服务器的作用就是做域名解析, 会把url → ip, 使用这个ip做后续的访问, 如果域名没有对应IP就会返回网址不存在。访问网络的服务(浏览器, 其它程序) 会先使用这个URL 查询本机的hosts 文件。两个不同的程序如果都默认使用了相同的端口, 后启动的程序在启动的时候可能会报错。chown 用户: 用户组 文件名 同时修改这个文件/文件夹的 用户和用户组。

2023-12-25 14:30:23 986 8

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除