自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Transformer笔记 Attention Is All You Need

主要的序列转录模型(sequence transduction model)主要基于复杂的RNN或者CNN网络,这些网络都包含encoder和decoder两部分。性能最好的模型也在encoder和decoder中加入了注意力机制(attention mechanism)。我们提出了一种简单的神经网络架构——Transformer,完全摒弃了RNN和CNN,仅仅基于注意力机制。在两个机器翻译的任务中也展示了这些模型在性能上表现更优,可以更加并行化(parallelizable),而且需要很少的时间训练。

2023-11-14 21:14:52 83

原创 ResNet笔记 Deep Residual Learning for Image Recognition

深层的神经网络很难去训练,所以我们提出了一个残差学习框架去应对这个问题。所提出的网络更容易优化、能够通过显着增加的深度获得准确性。并且网络在ILSVRC 2015比赛上获得第一名的成绩,并且该网络具有很好的泛化性,可以应用到各种计算机视觉任务(检测、定位、分割)中。

2023-11-13 16:51:18 101

原创 代价函数,损失函数,目标函数区别

https://blog.csdn.net/lyl771857509/article/details/79428475

2023-10-23 15:30:36 55

原创 前馈神经网络(前向传播和误差反向传播)

这个博客写的很不错:https://www.cnblogs.com/Luv-GEM/p/10694471.html。

2023-10-23 15:07:34 68

原创 常见激活函数笔记

非线性无论使用多少线性变换,都还是线性的,只能解决线性的问题连续可导反向传播过程中求导定义域是R(全体实数)单调递增的曲线。

2023-10-19 22:56:50 41

原创 反向传播算法、计算图笔记

参考https://www.bilibili.com/video/BV1yG411x7Cc/?前向传播时,需要存储这一次前向传播过程中所有的中间值和参数值,如下图中。这些值,之后在反向传播计算中需要使用。参考B站up主风中摇曳的小萝卜视频。

2023-10-19 20:49:31 38

原创 梯度下降、随机梯度、动量随机梯度、自适应学习率(AdaGrad、RMSProp)、Adam笔记

参考B站up主风中摇曳的小萝卜视频。

2023-10-19 19:39:22 56

原创 python中x+=y和x=x+y的区别

2、对于可变对象而言,x=x+y产生的新的x保存在新的内存中,而x+=y是原地操作。另外对于列表而言,原地操作也可以使用x[:]=x+y,这意味着将原来x中的每个元素值改变,而不改变x的内存地址。不可变类型的变量的+=不进行原地操作的原因是不可变类型是没有iadd方法的,因此会重载add方法。1、对于不可变对象而言,没有区别,不论是x+=y还是x=x+y,新的x值都是保存在新的内存中,与原x不同。+调用的是add方法,add方法会将相加之后的值赋值给新变量。小心大的矩阵过度复制造成内存消耗。

2023-10-19 14:18:11 452

原创 torch的广播机制(broadcast mechanism)

以下内容均来源于https://zhuanlan.zhihu.com/p/86997775。

2023-10-19 12:24:19 159

原创 交叉熵和KL散度笔记

以下内容均参考王木头学科学B站up主的视频和专栏导:比较两个概率分布的最大障碍出现了。两个不同类型的概率分布,它们无法直接公度。所有的概率分布,都可以统一地被转换成熵,比较两个概率分布是不是相同,不同的话,它们之间又相差多少,都可以用熵来进行衡量了。

2023-10-18 23:19:19 48 1

原创 LeetCode初级算法

在计算机中都是以二进制来进行运算,在代码中直接使用(+、-、*、/)运算符,合理的运用位运算更能显著提高代码在机器上的执行效率。nums和nums[:]的区别在于它们指向的对象不同,nums是列表对象的引用,nums[:]是对列表nums的元素的引用。要用nums[:]原地更改,同时考虑到k大于len(nums)的情况,所以要取余。空间复杂度:O(min⁡(m,n))空间复杂度:O(min⁡(m,n))时间复杂度:O(n*k)时间复杂度:O(m+n)时间复杂度:O(n)空间复杂度:O(n)

2023-09-16 17:22:40 63 1

原创 目标检测——FasterRCNN

Faster RCNN理论合集。

2023-07-27 20:04:48 89 1

原创 Python基础——zip()和zip(*)

函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组。利用 * 号操作符,可以将元组解压为列表。python3返回的是一个对象。

2023-07-26 20:17:31 267 1

原创 Python基础——部分类的内置函数

执行结果。

2023-07-26 20:08:26 56 1

原创 目标检测基础——评价指标

交并比(IOU, Intersetion Over Union),意思就是交集和并集的比值,用来评价两个几何图形的面积重合度,在目标检测算法模型中,通常被用来计算预测框与真实框的误差(损失函数)或者在非极大值抑制(NMS)算法中用于过滤多余重叠的目标,亦或者在。

2023-07-24 21:41:00 206

原创 用python导出班级成绩单

目的:由全院成绩单导出单个班级的成绩单并且计算总分、平均分、按照总分排名。一、示例下图为全院成绩单中一个同学本学年所有成绩;需要使用的列有:班级、学号、姓名、课程名称、成绩、学分下图为导出的班级成绩单二、代码第一次写,代码挺不简洁的,但是基本功能有的import pandas as pdimport warningsimport openpyxl as op#student类class student: def __init__(self, num):.

2022-01-22 15:06:50 2912 1

原创 JavaWeb学习(Day5)

Day5学习进度1.web概念概述2.HTML一、web概念概述1.JavaWeb:使用Java语言开发基于互联网的项目2.软件架构①C/S架构在用户本地有一个客户端程序,在远程有一个服务器程序。优点:用户体验好缺点:开发、安装、部署、维护麻烦②B/S架构只需要一个浏览器,用户通过不同的网址(URL),客户访问不同的服务器端程序。优点:开发、安装、部署、维护简单缺点:对硬件要求较高;应用过大,用户体验会受到影响。资源分类:静态资源、动态资源a.静态资源:使用静态网.

2021-11-08 11:10:54 76

原创 JavaWeb学习(Day4)

Day41.数据库连接池2.Spring JDBC:JDBC Template一、数据库连接池数据库连接池:存放数据库连接的容器当系统初始化好后,容器被创建,容器中会申请一些连接对象,当用户访问数据库时,从容器中获取连接对象,用户访问完后,将连接对象归还。好处:节约资源、用户访问高效实现:标准接口:DataSource(由数据库厂商来实现)数据库连接技术:C3P0、Druid等方法:获取连接:getConnection();归还连接:Connection.close();.

2021-11-07 19:31:09 241

原创 JavaWeb学习(Day3)

Day31.JDBC基本概念2.对JDBC中各个接口和类详解一、JDBC概念Java语言操作数据库本质:官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口。各个数据库厂商去实现这套接口,提供数据库驱动jar包,真正执行的代码是jar包中的实现类。二、JDBC入门public class JdbcDemo1 { public static void main(String[] args) throws Exception { //1.导入驱动jar包,.

2021-11-05 22:05:53 91

原创 JavaWeb学习(Day2)

Day2学习进度1.数据库的基本概念2.MySQL的安装、配置、使用常用的数据库软件:Oracle、MySQL、DB2、SQLServer、SQLite一、MySQL认识net start mysql启动mysql服务net stop mysql关闭mysql服务mysql -uroot -p登录mysql(后续输入密码)quit退出因为刚刚学过数据库基本原理,就不写那些具体的了。几个概念:1.数据库:文件夹2.表:文件3.数据:文件中存储的具体的数据.

2021-11-04 20:07:52 224

原创 JavaWeb学习(Day1)

Day1学习进度1.Juit单元测试2.反射3.注解一、Junit单元测试测试分类:黑盒测试(不需要写代码)、白盒测试(需要写代码,关注具体流程)Junit是白盒测试中的一种1.Junit使用:1.定义一个测试类(测试用例)规范:包名:xx.xx.test类名:xxTest(CalculatorTest)2.定义测试方法(可以独立运行)规范:方法名:testxx(testAdd)参数:空参(不被调用)返回值:void(不被调用)3.给方法加@Tes.

2021-11-02 21:03:10 120

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除