自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 二、大模型的能力(DataWhale大模型理论基础)

本节主要是通过对GPT-3论文中的基准测试深入研究,从而获得关于GPT-3更深程度的认识我们应该知道,

2024-01-17 15:31:38 838

原创 一、引言(DataWhale大模型理论基础)

语言模型(LM:language model)说明:假设我们有一个令牌集的词汇表V。语言模型p为x, …,x∈ Vpx1​...xL​概率的大小pthemouseatethecheese0.02pthecheeseatethemouse0.01pmousethethecheeseate0.0001(简而言之,就是不合常理的概率低,符合常理的概率高)

2024-01-15 19:30:46 975 1

原创 DataWhale 大数据处理技术组队学习task5

Hadoop, 面试题

2023-02-27 22:27:59 378 1

原创 DataWhale 大数据处理技术组队学习task4

MapReduce,Shuffle

2023-02-24 22:11:47 410 2

原创 DataWhale 大数据处理技术组队学习task3

HBase基本知识

2023-02-21 21:50:52 384

原创 DataWhale 大数据处理技术组队学习task2

Hadoop分布式文件系统

2023-02-18 19:41:51 559

原创 DataWhale 大数据处理技术组队学习task1

大数据处理技术概述;Hadoop的安装

2023-02-14 14:17:55 607

原创 第十一届蓝桥杯大赛软件类省赛第二场C/C++大学B组的python实现

题目1. 门牌制作2. 既约分数3. 蛇形填数4. 跑步锻炼5. 七段码6. 成绩查询7. 回文日期8.子串分值和9. 平面切分10.字串排序1. 门牌制作思路:从1到2020,查看之间有多少个2即可代码实现:ls = []for i in range(1, 2021): ls.append(str(i))ans = 0for i in ls: ans += i.count('2')print(ans)答案为:6242. 既约分数思路:暴力遍历即可代码实现

2022-01-24 17:35:13 1041

原创 优先队列及其相关题目(python,更新中)

优先队列1. 优先队列简介2. 适用场景3. 优先队列的实现4. 二叉堆实现的优先队列5. 优先队列相关题目239.滑动窗口最大值347.前K个高频元素1. 优先队列简介优先队列(Priority Queue):一种特殊的队列。在优先队列中,元素被赋予优先级,当访问队列元素时,具有最高优先级的元素最先删除与普通队列最大的不同:出队顺序,在优先队列中,具有最高优先级的元素最先出队普通队列的出队顺序跟入队顺序相关,符合**先进先出(First in, First out)**的规则。而优先队列的出队顺

2022-01-23 16:24:15 1283

原创 Python队列与广度优先搜索(BFS)及其相关题目(更新中)

队列与广度优先搜索及其相关题目1. 队列基础知识1. 队列简介1. 队列基础知识1. 队列简介定义队列(Queue):一种线性表数据结构,是一种只允许在表的一端进行插入操作,而在表的另一端进行删除操作的线性表队尾(rear):队列中允许插入的一端队首(front):队列中允许删除的一端空队:队列中没有任何元素时基本操作插入,也称为入队删除,也称为出队与栈的 先进后出 不同,队列是一种 先进先出(First In First Out)的线性表,简称为 FIFO 结构...

2022-01-22 19:46:54 1423

原创 单调栈及其相关题目

单调栈1. 单调栈简介1.1 单调递增栈1.2 单调递减栈2. 单调栈的适用场景3. 单调栈模板3.1 单调递增栈模板3.2 单调递减栈模板4. 单调栈相关题目496.下一个更大元素I[739.每日温度]1. 单调栈简介单调栈(Monotone Stack):一种特殊的栈。在栈的先进后出规则基础上,要求从栈顶到栈底 的元素是单调递增(或者单调递减)。其中满足从栈顶到栈底(在本文中是,有的文章中顺序与此相反)的元素是单调递增的栈,叫做「单调递增栈」。满足从栈顶到栈底的元素是单调递减的栈,叫做「单调递减栈

2022-01-19 14:54:43 843

原创 堆栈知识及其相关题目(持续更新中)

堆栈1. 堆栈基础知识1.1 堆栈简介1.2 堆栈的顺序存储与链式存储1. 堆栈基础知识1.1 堆栈简介定义堆栈(Stack):简称为栈。一种线性表数据结构,是一种只允许在表的一端执行插入和删除操作的线性表。栈顶(Top):栈中允许插入和删除的一端栈底(Bottom):不是栈顶的另一端空栈:没有任何元素的栈特点:后进先出(Last In First Out),即LIFO结构相关解释线性表:栈首先是一个线性表,栈中元素具有前驱后继的线性关系。栈中元素按照次序依次进栈根据堆栈的定义,每

2022-01-18 16:14:40 1173

原创 python链表及其相关题目(更新中)

链表1. 链表简介1.1 定义:二级目录三级目录1. 链表简介1.1 定义:链表(Linked List):一种线性存储结构。它使用一组任意的存储单元(可以是连续的或不连续的),来存储一组具有相同类型的数据链表,是实现线性表的链式存储结构的基础二级目录三级目录...

2022-01-13 19:22:16 1339

原创 sklearn:线性回归和逻辑回归(对数几率回归)

sklearn:线性回归与逻辑回归(对数几率回归)

2021-12-15 20:30:22 2228

原创 双指针算法以及滑动窗口Python(及其相关题目)(待更新)

双指针1. 双指针基础知识1. 双指针简介2. 对撞指针3. 快慢指针4. 分离双指针2. 滑动窗口2.1 算法介绍2.2 适用范围:2.3 固定长度窗口2.4 不定长度窗口3. 双指针相关题目:2.1 对撞指针167.两数之和||输入有序数组125.验证回文串344.反转字符串15.三数之和2.2 快慢指针80.删除有序数组中的重复项||283.移动零2.3 分离指针88.合并两个有序数组1. 双指针基础知识1. 双指针简介双指针(Two Pointers):在遍历元素的过程中,不是使用单个指针进行

2021-11-27 23:28:20 988

原创 二分查找的python实现(及相关题目)

二分查找1. 二分查找相关知识1.1 算法介绍:1. 二分查找相关知识1.1 算法介绍:二分查找算法(Binary Search Algorithm):也叫做折半查找算法、对数查找算法。是一种在有序数组中查找某一特定元素的搜索算法。注意, 有序数组中的一种搜索算法,有序数组中的一种搜索算法,有序数组中的一种搜索算法。当你看到有序数组时,就可以往二分查找这里想一想,看看能否运用。基本思想:先确定带查找元素所在的区间范围,再逐步缩小范围,直到找到元素或找不到元素为止。...

2021-11-24 17:13:23 1214

原创 排序算法的python实现(以及相关题目)(待更新)

排序算法1. 五种排序算法实现1.1 冒泡排序(Bubble Sort)1.2 选择排序(Selection Sort)3. 插入排序(Insertion Sort)2. 相关题目:[剑指offer 45. 把数组排成最小的数](https://leetcode-cn.com/problems/ba-shu-zu-pai-cheng-zui-xiao-de-shu-lcof/).283.移动零.912.排序数组.1. 五种排序算法实现相关原理请点击此链接.1.1 冒泡排序(Bubble Sort)

2021-11-21 19:24:02 1217 1

原创 1.数组基础

数组基础1. 数组简介1.1 数组定义1.2 数组的随机访问1.3 多维数组1.4 不同语言的数组的实现2. 数组的基本操作2.1 查:ls[i]2.2 改:ls[i] = val2.3 增2.4 删3. 数组的基础题目[66. 加一](https://www.csdn.net/)1. 将数组转换为整数在转换为数组2. 找出最长的后缀724:寻找数组的中心下标.1. 计算前缀和与后缀和1. 数组简介1.1 数组定义数组(Array): 一种线性表数据结构。它使用一组连续的内存空间,来存储一种具有相同类

2021-11-17 14:12:08 207

原创 2021-11-15 数据结构与算法简介

数据结构与算法简介,Leetcode入门及攻略1. 数据结构与算法1.1 相关定义1.2 为什么要学习算法和数据结构1.3 数据结构1.3.1 数据的逻辑结构1.3.2 数据的物理结构1.4 算法1.4.1 算法的基本特性1.4.2 算法追求的目标2. 算法复杂度2.1 时间复杂度2.1.1 渐进符号2.1.2 时间复杂度的计算2.1.3 最佳, 最坏,平均时间复杂度2.2 空间复杂度1. 数据结构与算法数据结构是程序的骨架,而算法则是程序的灵魂1.1 相关定义算法(Algorithm): 解决

2021-11-15 15:53:43 676

原创 总结(李宏毅深度学习 task 7)

总结1.人工智能、机器学习、深度学习之间的区别和联系2. 回归模型建立的步骤3. 深度学习的三个步骤4. 网络设计时需要思考的点5.卷积神经网络最后通过这一段时间的学习,我对相关的原理有了更深的理解,以下对知识点做一下简单的总结1.人工智能、机器学习、深度学习之间的区别和联系三者的关系:人工智能 > 机器学习 > 深度学习2. 回归模型建立的步骤模型假设:选择模型框架模型评估:如何判断模型的好坏(损失函数的确定)模型优化:如何筛选最优模型(梯度下降)3. 深度学习的三个步骤

2021-07-25 17:06:01 323

原创 卷积神经网络(李宏毅深度学习 task 6)

卷积神经网络1. 为什么使用CNN1.1 Small region为什么我们可以把一些参数拿掉(为什么可以用较少的参数来做影像处理)1.2 Same Patterns1.3 Subsampling2. CNN架构1. 图像分析引出的架构2. 每一个layer所做之事1. 卷积(Convolution)1. property 1(着眼于局部)2. property 2(不同区域相同特征的检测)1. 为什么使用CNN本质:使用power-knowledge把原来fully connect layer中一些参

2021-07-23 16:11:07 397

原创 网络设计技巧(李宏毅深度学习 task 5)

网络设计技巧1. 局部最小值与鞍点1.1 相关定义:1.2 梯队逼近为0的原因情况的判断local minima和saddle point哪个更常见?2. 批次(batch)与动量(momentum)2.1 批次(batch)2.1.1 概述:2.1.2 为什么要用batch2.1.3 神奇之处:1.noisy的gradient 反而 可以帮助training2. 小的batch也对testing有帮助2.2 动量(momentum)2.2.1 一般的gradient descent2.2.2 加上mome

2021-07-21 22:37:24 303

原创 深度学习简介(李宏毅深度学习 task 4)

深度学习1. 深度学习的三个步骤1.1 神经网络(Neural network)完全连接前馈神经网络本质:通过隐藏层进行特征转换问题1.2 模型评估(Goodness of function)交叉熵总体损失1.3 选择最优函数(Pick best function)梯度下降反向传播1.链式法则2.相关损失及其解释思考隐藏层越多越好?普遍性定理1. 深度学习的三个步骤1.1 神经网络(Neural network)神经网络有着多种的模型,而这也对应着神经元不同的连接方式。下面时一些常见的连接方式对应

2021-07-18 16:58:32 368

原创 误差和梯度下降(李宏毅深度学习task 3)

误差和梯度下降1. 误差的来源1.1 error (误差)1.2 bias(偏差)1.3 variance (方差)1.4 举例说明1.5 偏差方差困境2 估测2.1 估测X的偏差2.1.1 估测平均值2.1.2 估测方差2.2 为什么会有多个模型3 判断分析3.1 欠拟合-偏差大3.2 过拟合4 比较检验4.1 交叉验证4.2 N折交叉验证5. 梯度下降5.1 学习率的调整(η\etaη)5.1.1 一般学习率的调整5.1.2 自适应调整学习率5.2 随机梯度下降法5.3 特征缩放5.3.1 缩放的原因

2021-07-16 22:33:48 539 2

原创 回归任务详解(李宏毅深度学习 task2)

回归任务详解1. 回归任务的定义2. 回归任务的举例3. 模型建立的步骤3.1 模型假设,选择模型框架(以线性模型为例)3.1.1 线性模型的定义3.1.2 一元线性模型(单特征)3.1.3 多元线性模型(多特征)3.2 模型评估,如何判断众多模型的好坏(损失函数的确定)3.2.1 收集和查看训练数据3.2.2 如何判断众多模型的好坏(Loss Function)3.2.3 公式推导3.3 模型优化,如何筛选最优的模型(梯度下降)3.3.1 如何筛选最优的模型w,bw,bw,b(梯度下降法的一般步骤)3.3

2021-07-14 16:25:13 10175

原创 1.机器学习介绍(李宏毅深度学习task1)

1. 人工智能、机器学习、深度学习之间的区别和联系人工智能是我们最终要达到的目的,为机器赋予人的智能机器学习是我们达成目的的一种手段深度学习是机器学习中的一种方法,它指的是涉及到深度神经网络的机器学习算法三者的关系:人工智能 > 机器学习 > 深度学习2. 机器学习的定义机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。本质上就是通过程序让机器具备学习的能力,大量数据来训练机器,最终得到一个学习后的模型。3. 机器学习任务

2021-07-12 14:34:58 236 1

原创 Linux磁盘管理

1. 什么是磁盘磁盘(disk):利用磁记录技术存储数据的存储器。磁盘可以分为软磁盘(Floppy Disk,简称软盘,早期计算机使用)和硬磁盘(Hard Disk,简称硬盘,如今常用)1.1 磁盘运行原理简单来说就是多个盘片之间靠主轴连接,电机带动主轴做旋转运动,通过多个磁头臂的摇摆和磁盘的旋转,磁头就可以在磁盘旋转的过程中就读取到磁盘中存储的各种数据名称含义扇区磁盘的每个盘片被划分为许多同心圆,划分园的线条叫做磁道。磁道硬盘的盘片被磁道划分成多个扇区。硬盘的读

2021-06-26 22:04:33 171 2

原创 文件和目录管理

1.Linux目录1.1 目录的交互状态static:不可变的variable:可变的shareable:可分享的。指可以存储在一台主机上并在其他主机上使用的文件unshareable:不可分享的。指那些不可共享的文件1.2 目录详解ls / :可查看目录结构名称理解/ - 根目录Linux文件系统的入口,每一个文件和目录都从这里开始。/bin - 基本用户命令二进制文件目录包含系统管理员和用户都可以使用的命令/etc - 配置文件目录本目录包含所有

2021-06-23 22:13:42 86

原创 Linux用户与组管理

一、用户和用户组1.1 什么是用户:Linux是多用户多任务的操作系统,也就是说,多个用户可以同时登陆执行不同任务。用户需要使用系统资源则需向系统管理员申请账户进入系统。不同的用户则拥有不同的权限。多用户的分类:超级用户:拥有对系统的最高管理权限,即root用户。普通用户:只能对自己目录下的文件进行访问和修改,具有登录系统的权限,www用户、ftp用户等。虚拟用户:也叫“伪”用户,这类用户最大的特点是不能登录系统,它们的存在主要是方便系统管理,满足相应的系统进程对文件属主的要求。例如系统默认的

2021-06-19 15:49:39 178

原创 Linux的安装

一、Oracle VM VirtualBox的安装1.win10版本不兼容问题在安装完成之后,显示版本不兼容,到官网下载最新版本即可。二、Ubuntu ISO镜像文件的准备本次组队学习使用的是ubuntu-20.04.2.0-desktop-amd64.ios。到官网上面下载发现速度过慢(Ubuntu的官网不在国内),然后到网上找了一些国内的开源镜像网站来进行下载。在这里,我选择使用清华源进行下载。详情请看Ubuntu清华源下载教程...

2021-06-16 20:12:45 83

原创 Linux简介

一、什么是Linux1.定义Linux,全称为GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,我们常说的Linux,指的是Linux内核,一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。2.两大思想2.1 一切都是文件系统中的所有都归结为一个文件,包括命令、硬件和软件设备、操作系统、进程等等。对于操作系统内核而言,都被视为拥有各自特性或类型的文件2.2 每个文件都有确定的用途二、为什么要使用Linux1.开源免费2.多用户、多任务3.安全可靠4.稳

2021-06-13 12:08:58 823 1

原创 熟悉规则(Datawhale)

一、选择输出格式使用CSDN撰写技术博客二、学习过程1. 根据Datawhale提供的学习材料以自学为主2. 按照学习任务进行学习并打卡2.1 学习任务的查看查看Datawhale所提供的学习材料,进行学习任务的查看,并按照所建议的学习节奏进行学习2.2 打卡内容选择CSDN平台,将学习体会,输出成【学习分享】,将分享的链接,填至问卷的 “打卡链接” 中相应的位置。2.3 打卡要求打卡形式不限,可撰写学习笔记,包含运行代码;可记录重要知识,记录总结的学习体会。要有自己的理解,不

2021-06-12 22:48:02 86

原创 enumerate函数说明

enumerate函数说明1.enumerate函数是python的一个内置函数2.enumerate函数作用于一个可遍历对象(如列表,元组或者字符串),将其组合为一个索引序列,可以同时获得索引和值(常使用在for循环中)3- enumerate函数的使用:enumerate(sequence,[start = 0])sequence:可遍历对象start:下标的起始位置,可以指定遍历的起始位置函数的作用同时获得可遍历对象的索引和值(有的文章说可以实现计数的功能,我有点没搞明白,

2021-02-13 20:32:34 4039

原创 并查集的python实现

并查集的python实现这一阵子在做leecode题的时候出现了太多的并查集,所以趁此机会想系统性的总结一下相关的知识,以便帮助大家更好的理解。如果有错误希望大家指正本文的结构并查集的python实现并查集的介绍并查集的理解并查集的相关功能的python实现并查集的介绍并查集是在多集合问题中,刚开始时将每个元素构成一个单元素的集合,然后按照一定的顺序将属于同一组的元素进行合并。在此期间要反复查找一个元素在哪个集合中。总之,并查集是处理一些不相关集合的合并及查询问题的一种树形的数据结构(与它的名字很

2021-01-25 15:20:03 1755

原创 python找出日期推迟或提前某天的日期(高斯日记)

如果我们要找出某日推迟或者提前某天的确切日期,我们一般的思路有三个步骤下面我们就按照我们的思路来找出我们的结果(这里我们用到了datetime中的date和datedelta)找出我们需要的日期输入开始日期实现日期的推迟或者提前输出最终日期输入开始日期这里我们使用date模块来储存我们的日期start_time = date(1777,4,30)假设日期为1777年4月30号(可能有朋友发现了这是高斯的生日,这也是我写这篇博客的缘由,哈哈)实现日期的推迟或者提前我们已经把开始日期输入进去

2021-01-06 11:38:36 479

原创 python三种保留两位小数的方法

python三种保留两位小数方法汇总#’%.2f’%f#format函数#round函数1.’%.2f’%f该方法会进行四舍五入下面展示一些 内联代码片。f = 2.3456789print('%.2f'%f)print('%.3f'%f)print('%.4f'%f)结果如下所示2.352.3462.34572.format函数该方法也会进行四舍五入下面展示一些 内联代码片。f = 2.3456789print('{:.2f}'.format(f))prin

2020-12-25 17:03:03 146583 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除