自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 解决tensorflow-addons下载问题Could not find a version that satisfies the requirement

由于要用到tensorflow-addons,所以需要安装对应的库。遇到的问题是:ERROR: Could not find a version that satisfies the requirementtensorflow-addons (from versions: none) ERROR: No matchingdistribution found for tensorflow-addons网上有很多说是pip源的原因,所以我先切换pip源:pip config set global

2022-03-03 19:33:01 2614

原创 解决Tensorflow不能用GPU加速问题

解决Tensorflow不能用GPU加速问题用tensorflow_gpu运行代码出错下面就一步一步找问题第一个错误:第二个错误:第三个错误:用tensorflow_gpu运行代码出错tensorflow_gpu版本是2.3.1通过nvidia-smi发现确实是安装了cuda的。下面就一步一步找问题第一个错误:tensorflow/stream_executor/platform/default/dso_loader.cc:59] Could not load dynamic library ‘

2021-11-28 21:08:09 2457

原创 pip 安装出错以及pip 更新报错————Exception: Traceback (most recent call last):

问题:在pip install coverage==5.3的时候报错如下:Exception:Traceback (most recent call last):File “C:\Users\Jade\Anaconda3\envs\Sylvia\lib\site-packages\pip_vendor\pkg_resources_init_.py”, line 2862, in _dep_mapreturn self._dep_mapFile "C:\Users\Jade\Anaconda3\

2021-08-30 10:23:51 2198 1

原创 conda配置pytorch环境遇到的问题与解决方案

之前配置pytorch的时候一直timeout,,http error,各种网络报错或者就是conda error,当时也没有注意,以为是网的问题。因为下载的时候真的超级超级慢,快哭了~~~常常不到20%就不行了为了不和大家拥挤,今天早上5点多起床配置,很仔细的看了一下,出现了conda error问题如下:Downloaded bytes did not match Content-Length然后,就在网上搜索,终于搞到了解决方法,2分钟不到就配置好了环境,今天可以出去浪一天了,哈哈!太感

2021-08-01 08:22:43 1069 2

原创 百度 AI课程学习03

01 决策树Questions:节点的分裂?以下述数据为例:如何判断一个好学生?对应的决策树如下:因此,决策树的生成有如下步骤:怎么确定分裂阈值?02 svm(支持向量机)支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。支持向量机属于一般化线性分类器,这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机也被称为最大边缘区分类器。...

2021-07-10 22:14:52 71 3

原创 百度机器学习 课程 02

01 机器学习原理与背景1、机器学习分类:有监督学习: 有标签的数据无监督学习:无标签的学习(如:聚类算法)——探索杂乱的数据内部的规律在nlp里面,词向量模块:强化学习:定义了环境,agent,动作,奖励。通过与环境进行交互得到奖励,经过若干次迭代后学习到规律输入,输出,评价指标2、回归与分类1) 线性回归训练过程:拓展到多元线性回归:...

2021-07-09 11:27:00 125 1

原创 LR ,DT and MLP

01 LR(Linear regression)Definition:The case of only one independent variable is called univariate regression, and the case of more than one independent variable is called multiple regression。In the above formula, x is the independent variable (character

2021-07-04 09:29:57 363

原创 数据清洗总结——python数据分析

导入相应的库和数据import numpy as npimport pandas as pdimport seaborn as sns# read the datadf = pd.read_csv('sberbank.csv')# shape and data types of the dataprint(df.shape)print(df.dtypes)#select numeric columnsdf_numeric=df.select_types(include=[np.numb

2020-08-28 20:51:08 451

原创 国内某金融技术公司笔试题2020年

差不多一个半小时五道题。最后一道题没有看懂。直接上前四道题。虽然是场景题,但是所用到的算法基本都是剑指offer原题。但是在输入输出上面有点变化,主要是细节处理哦!第一题数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。例如输入一个长度为9的数组{1,2,3,2,2,2,5,4,2}。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。如果不存在则输出0。利用排序算法,因为这个数字的出现次数超过数组长度的一半,所以排序之后,中间的数必定为答案: int majorityElem

2020-08-28 09:39:01 400

原创 算法题:leetcode200:岛屿数量

题目描述:给定一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,计算岛屿的数量。一个岛被水包围,并且它是通过水平方向或垂直方向上相邻的陆地连接而成的。你可以假设网格的四个边均被水包围。深度搜索class Solution { public int numIslands(char[][] grid) { if (grid == null || grid.length == 0 || grid[0].length == 0) return 0 ;

2020-08-25 11:43:04 218

原创 剑指offer系列:二维数组中的查找

题目描述:在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。python版:# -*- coding:utf-8 -*-class Solution: # array 二维列表 def Find(self, target, array): # write code here if not array or not

2020-08-24 08:49:21 116

原创 跳台阶 and 过河卒: C++版

题目描述有n级台阶,每次可以向上边最多n级台阶,问到达n级台阶有多少种不同方式:f(1)=1f(2=2f(3)=f(2)+f(1)+1=4f(4)=f(3)+f(2)+f(1)+1=8f(n)=2^(n-1)#include<iostream>using namespace std;int f[10000]={0};int main(){ int n; cin>>n; f[1]=1; f[2]=2; for(int i=3;i++;i

2020-08-23 10:38:16 178

原创 递推算法:C++版斐波那契数列

1、题目描述有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子.假如兔子都不死,并且第一个月出生一对兔子,请问第n个月有多少只兔子?分析第一个月:1对第二个月:1 对第三个月:1对+新生=2对第四个月:已有的兔子+新生=2+1=3对第五个月=已有的兔子+新生=3+2=5第n个月:f(n)=f(n-1)+f(n-2)2、斐波那契数列1)、递推f(n)=f(n-1)+f(n-2)#include<iostream>using namep

2020-08-21 10:40:09 3605

原创 数据结构与算法——最大字段和

1、题目描述求一个序列的最大子段和即最大连续子序列之和2、枚举法枚举变量:每一段的起点和终点枚举范围:起点:1- n,终点:起点-n;判断条件:找最大值即可复杂度:O(NNN)#include<iostream>using nampespace std;int a[20005];int main(){ int n; cin>>n; for(int i=1;i<=n;i++) { cin>>a[i];

2020-08-20 12:17:34 433

原创 砝码称重——不同算法解决

1、问题砝码称重问题:设有1g、2g、3g、5g、10g、20g的砝码各若干枚(其质量<=1000g),求出用他们能称出的质量的种类数(不包括质量为0的情况)。2、枚举法算法思路:1、枚举不同砝码的个数,计算总重量。并将总重量对应的标志置为12、根据标志,计算总质量的个数#include<iostream>using namespace std;int flag[1000]={0}int main(){int n1,n2,n3,n5,n10,n20;cin>&

2020-08-19 11:20:18 4583 5

原创 C++算法与数据结构:枚举

枚举循环+判断的结构1.例题公鸡一只五块钱、母鸡一只三块钱、小鸡一块钱三只,现用一百买一百只鸡,每种鸡最少一只,问公鸡、母鸡、小鸡各多少只?2、代码#include<studio.h>int main(){for (int i=1;i<=100;i++)for(intj=1;j<=100;j++)for(intk=1;k<=100;k++){if(5*i+3*j+k/3==100 && k%3==0 && i+k+j==1

2020-08-19 10:25:09 127

原创 SecureBoost: A Lossless Federated Learning Framework论文笔记

摘要保护用户隐私是机器学习中的一个重要问题,2018年5月欧盟推出的《通用数据保护条例》(General Data protection Regulation,简称GDPR)就是明证。GDPR旨在让用户对自己的个人数据有更多的控制权,这激发了我们探索在不侵犯用户隐私的情况下共享数据的机器学习框架。为了实现这一目标,在本文中,我们提出了一种新的基于联邦学习的无损隐私保护树增强系统SecureBoo...

2020-03-23 16:55:59 4556 3

原创 伯禹 动手学深度学习 打卡19之词嵌入与文本分类

词嵌入进阶载入预训练的 GloVe 向量GloVe 官方 提供了多种规格的预训练词向量,语料库分别采用了维基百科、CommonCrawl和推特等,语料库中词语总数也涵盖了从60亿到8,400亿的不同规模,同时还提供了多种词向量维度供下游模型使用。torchtext.vocab 中已经支持了 GloVe, FastText, CharNGram 等常用的预训练词向量,我们可以通过声明 to...

2020-02-25 21:27:16 328

原创 伯禹 动手学深度学习 打卡18之数据增强

图像增广在5.6节(深度卷积神经网络)里我们提到过,大规模数据集是成功应用深度神经网络的前提。图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,...

2020-02-25 21:18:05 166 1

原创 伯禹 动手学深度学习 打卡18之 word2vec

词嵌入基础在这里我们主要介绍 Skip-Gram 模型的实现,CBOW 实现与其类似,读者可之后自己尝试实现。后续的内容将大致从以下四个部分展开:PTB 数据集Skip-Gram 跳字模型负采样近似训练模型import collectionsimport mathimport randomimport sysimport timeimport osimport nump...

2020-02-24 20:27:28 187

原创 伯禹 动手学深度学习 打卡17 之梯度下降

梯度下降%matplotlib inlineimport numpy as npimport torchimport timefrom torch import nn, optimimport mathimport syssys.path.append('/home/kesci/input')import d2lzh1981 as d2ldef f(x): retu...

2020-02-24 20:07:35 130 1

原创 伯禹 动手学深度学习 打卡16之凸优化

优化与深度学习优化与估计尽管优化方法可以最小化深度学习中的损失函数值,但本质上优化方法达到的目标与深度学习的目标并不相同。优化方法目标:训练集损失函数值深度学习目标:测试集损失函数值(泛化性)%matplotlib inlineimport syssys.path.append('/home/kesci/input')import d2lzh1981 as d2lfrom mpl...

2020-02-24 19:44:49 162

原创 伯禹 动手学深度学习 打卡15之Transformer

Transformer在之前的章节中,我们已经介绍了主流的神经网络架构如卷积神经网络(CNNs)和循环神经网络(RNNs)。让我们进行一些回顾:CNNs 易于并行化,却不适合捕捉变长序列内的依赖关系。RNNs 适合捕捉长距离变长序列的依赖,但是却难以实现并行化处理序列。为了整合CNN和RNN的优势,[Vaswani et al., 2017] 创新性地使用注意力机制设计了Transfo...

2020-02-18 15:09:28 160

原创 伯禹 动手学深度学习 打卡14之注意力机制和Seq2seq模型

注意力机制在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量(context vector)来获取输⼊序列信息。当编码器为循环神经⽹络时,背景变量来⾃它最终时间步的隐藏状态。将源序列输入信息以循环单位状态编码,然后将其传递给解码器以生成目标序列。然而这种结构存在着问题,尤其是RNN机制实际中存在长程梯度消失的问题,对于较长的句子,我们很难寄希望于将输入的序列转化为...

2020-02-18 14:47:24 314

原创 伯禹 动手学深度学习 打卡13之机器翻译和数据集

机器翻译和数据集机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。import syssys.path.append('/home/kesci/input/d2l9528/')import collectionsimport d2limpor...

2020-02-18 14:25:12 377

原创 伯禹 动手学深度学习 打卡12之 RNN 进阶

GRURNN存在的问题:梯度较容易出现衰减或爆炸(BPTT)⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系RNN:GRU:重置⻔有助于捕捉时间序列⾥短期的依赖关系;更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。载入数据集import osos.listdir('/home/kesci/input')[‘d2lzh1981’, ‘houseprices2807’,...

2020-02-18 11:11:45 144

原创 伯禹 动手学深度学习 打卡11之循环神经网络

循环神经网络循环神经网络的构造从零开始实现循环神经网络我们先尝试从零开始实现一个基于字符级循环神经网络的语言模型,这里我们使用周杰伦的歌词作为语料,首先我们读入数据:import torchimport torch.nn as nnimport timeimport mathimport syssys.path.append("/home/kesci/input")impo...

2020-02-18 10:48:03 119

原创 伯禹 动手学深度学习 打卡10之文本预处理

读入文本我们用一部英文小说,即H. G. Well的Time Machine,作为示例,展示文本预处理的具体过程。import collectionsimport redef read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachine.txt', 'r') as f: ...

2020-02-17 21:44:41 86

原创 伯禹 动手学深度学习 打卡09 之批量归一化和残差网络

批量归一化(BatchNormalization)对输入的标准化(浅层模型)处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。标准化处理输入数据使各个特征的分布相近批量归一化(深度模型)利用小批量上的均值和标准差,不断调整神经网络中间输出,从而使整个神经网络在各层的中间输出的数值更稳定。1.对全连接层做批量归一化位置:全连接层中的仿射变换和激活函数之间。全连接:2...

2020-02-17 21:28:20 177

原创 伯禹 动手学深度学习 打卡08 之 深度卷积神经网络(AlexNet)

深度卷积神经网络(AlexNet)LeNet: 在大的真实数据集上的表现并不尽如⼈意。1.神经网络计算复杂。2.还没有⼤量深⼊研究参数初始化和⾮凸优化算法等诸多领域。机器学习的特征提取:手工定义的特征提取函数神经网络的特征提取:通过学习得到数据的多级表征,并逐级表⽰越来越抽象的概念或模式。神经网络发展的限制:数据、硬件AlexNet首次证明了学习到的特征可以超越⼿⼯设计的特征,从而...

2020-02-17 21:00:17 109

原创 伯禹 动手学深度学习 打卡07 之 LeNet

Convolutional Neural Networks使用全连接层的局限性:图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。对于大尺寸的输入图像,使用全连接层容易导致模型过大。使用卷积层的优势:卷积层保留输入形状。卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算,从而避免参数尺寸过大LeNet 模型LeNet分为卷积层块和全连接层块两...

2020-02-17 15:31:04 155

原创 伯禹 动手学深度学习 打卡06之卷积神经网络基础

卷积神经网络基础二维卷积层本文介绍的是最常见的二维卷积层,常用于处理图像数据。二维互相关计算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。卷积核的尺寸通常小于输入数组,卷积核在输入数组上滑动,在每个位置上,卷积核与该位置处的输入子数组按元素相乘并求和,得到...

2020-02-17 15:13:04 111

原创 伯禹 动手学深度学习 打卡05 之梯度消失、梯度爆炸以及Kaggle房价预测

梯度消失和梯度爆炸深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。当神经网络的层数较多时,模型的数值稳定性容易变差。随机初始化模型参数在神经网络中,通常需要随机初始化模型参数。下面我们来解释这样做的原因。回顾多层感知机一节描述的多层感知机。为了方便解释,假设输出层只保留一个输出单元o1(删去o2和o3以及指向它们的箭头),且隐藏层使用相同的激活...

2020-02-16 21:55:25 178

原创 伯禹 动手学深度学习 打卡04 之过拟合、欠拟合及其解决方案

模型选择、过拟合和欠拟合训练误差和泛化误差在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数,例如线性回归用到的平方损失函数和so...

2020-02-16 21:12:02 184

转载 伯禹 动手学深度学习 打卡03 之Softmax与分类模型

softmax和分类模型softmax的基本概念分类问题权重矢量神经网络图输出问题直接使用输出层的输出有两个问题:一方面,由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义。例如,刚才举的例子中的输出值10表示“很置信”图像类别为猫,因为该输出值是其他两类的输出值的100倍。但 ,那么输出值10却又表示图像类别为猫的概率很低。另一方面,由于真实标签是离散值,...

2020-02-13 21:46:44 210

转载 伯禹 动手学深度学习 打卡02 之多层感知机

多层感知机理论知识深度学习主要关注多层模型。在这里,我们将以多层感知机(multilayer perceptron,MLP)为例,介绍多层神经网络的概念。隐藏层下图展示了一个多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。表达公式激活函数上述问题的根源在于全连接层只是对数据做仿射变换(affine transformation),而多个仿射变换的叠加仍然是一个仿射...

2020-02-13 20:47:32 158

转载 伯禹 动手学深度学习 打卡01 之线性回归

线性回归基础知识模型为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:数据集我们通常收集一系列的真实数据,例如多栋房屋的真实售出价格和它们对应的面积和房龄。我们希望在这个数据上面寻找模型参数来使模型的预测价格与真实价格的误差最小。在机器学习术语里,该数据集被称为...

2020-02-12 21:51:46 129

转载 百度飞浆学习——python中numpy库基础知识

Numpy是Numerical Python的简称,是Python中高性能科学计算和数据分析的基础包。Numpy提供了一个多维数组类型 ndarray,它具有矢量算术运算和复杂广播的能力,可以实现快速的计算并且能节省存储空间。在使用Python调用飞桨API完成深度学习任务的过程中,通常会使用Numpy实现数据预处理和一些模型指标的计算,飞桨中的Tensor数据可以很方便的和ndarray数组进行...

2020-01-22 17:05:26 557

原创 哈工大操作系统之用户级线程笔记

问题:OS如何切换多个进程切换?进程=资源+指令执行序列资源:内存的映射表线程:保留了并发的优点,避免了进程切换代价(只切换程序,不切换资源)create() 和yield()函数栈两个线程:两个TCB,两个栈,切换的PC在栈中程序:void WebExplorer()//main() { ThreadCreate(GetData,URL, buffer);... ...

2020-01-21 22:09:10 147

原创 百度人工智能学习笔记 L1 概念

人工智能 与机器学习 、深度学习的关系:机器学习,尤其是监督学习则有更加明确的指代。机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习的实现步骤可以分成两步,训练和预测。这两个专业名词类似于归纳和演绎的含义。归纳是从具体案例中抽象一般规律,机器学习中的“训练”亦是如此。从一定数量的样本(已知模型输入X和模型输出...

2020-01-21 22:07:37 181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除