qq_43498494-CSDN博客

原创 win10平台实录-1

@TOC[目录]# win10平台实录-11确认显卡是NVIDIA2、桌面右键看没有下面这个，说明电脑还么有安装显卡驱动3若没有安装驱动，因为CUDA自动带了驱动这种情况更简单。4看电脑是否安装Visual Studio，因为CUDA会配合这个使用。未安装VS，安装CUDA要设置，否则安装CUDA也是会出错的。所以安装前确认电脑是否装VS与显卡驱动；若当电脑版本大于CUDA版本时候，此时Display这一项一定不能安装，因为此时CUDA版本的老版本无法覆盖电

2020-12-04 17:05:10 102

原创数据结构----第三天---链表提出

文章目录链表的提出单链表的ADT模型链表的提出是否有一种数据结构在原有的顺序表数据基础上，多一个我就加一个，要有这样一种数据结构存在。对于此时我们不需要管这个数据集合最终要存多少，且也不是连续存放，即多一个我给他存一个即可。来一个我就申请一个空间存入即可。但是要将他们封装成一个整体，即要关联到一起，即找一根线穿起来，让200数据空间多找一块空间指向400数据。线性表不管是连续存储还是元素外置存储，都表现为1维空间的线连起来的。称为线性表，分为：顺序表和用线串起来的链表。单链表的ADT模

2020-07-17 11:58:11 185

原创数据结构之初步认识----第二天

文章目录基本顺序表与元素外围顺序表内存内存、类型本质、连续存储元素外置顺序表顺序表的一体式结构与分离式结构顺序表数据区替换与扩充顺序表添加与删除元素_Python列表的实现基本顺序表与元素外围顺序表内存直接存储数据，且直接跟CPU打交道的。一堆连续存储单元组合到一起组成内存。内存以一个字节为索引单位的，计算机找数据时基本位置。整型的话要申请多少个内存空间去存呢？对于32位机器，可能基本整型需要4个字节存储，且将整型数据转化为二进制去存。char理解为字符串中的一个字符。占一个字节即一个存储单元，

2020-07-14 12:14:08 179

原创数据结构与算法---第一天

文章目录算法引入方法1--效率低方法2算法效率衡量时间复杂度最坏时间复杂度与计算规则算法引入方法1–效率低算法：面对问题时，将我们的思路用计算机程序写出来，告诉计算机怎么做，如何让计算机运行将题解答出来，这种思路解决方法就是算法。即计算的方法。方法2固定a与b后，c就确定了，所以可以将代码改进。解决同一问题方法有多种算法，算法之间是有差别的。算法效率衡量时间复杂度当两个程序执行效率不同时候，说明这两段程序基本运算数量是不同的。程序运行总时间=基本运算数量乘以每个基本运算

2020-07-13 22:17:26 145

原创 Tensorflow2第五天---深度学习--语音识别

文章目录上周验证码作业程序上周验证码作业最后一层没用softmax，但用sofymax损失，这个最后也可以达到比较好结果也可以达不到好的效果。根据目标词汇可能预测上下文的一个或两个词，或多个词。word2vec模型也是通过神经网络训练出来的，一般将词转化为向量，向量长度一般我们可以用128维度或者256维度，这个词转化为固定长度维度，之后权值就是通过神经网络训练的。把每个词对应的向量训练好之后，都放入到一个空间中，可以发现词性相近的

2020-06-19 08:38:40 490 1

原创 Tensorflow第四天---深度学习--GPU训练

文章目录GPU安装---Windows安装cuDNN训练自己的图片分类模型思路二实践从头开始训练一个图像识别模型利用验证码识别讲解多任务学习做法生成验证码与tfrecords文件验证码识别的两种方式方式1多任务--联合训练过程测试程序GPU安装—Windows下载完后有个压缩包之后就可以安装了。然后加入到环境变量后，确定即可。此时CUDA生效安装cuDNN用于为深度学习加速用的。注册一个账号后才可以下载。拷贝到cuda对应目录即可。类似将文件夹下的文件对应

2020-06-17 13:47:02 258

原创 Tensorflow第三天---深度学习--卷积神经网络---RNN---LTSM

文章目录卷积神经网络手写数字代码卷积神经网络传统神经网络的弊端对于处理图片计算量太大。若数据很少，建立的模型很复杂，就会过拟合，或者数据量大，但是构建的网络太简单，就会欠拟合。一般网络越复杂，就需要越多的样本来进行训练。一般样本数量大小最好是里面权值的5-10倍。CNN一个神经元只连接到前面图片的某一部分。不同的卷积核可以对图片的不同特征进行采样，如有5个不同的卷积核，就可以采样出5幅不同的特征图，不同的特征图对于后面我们做图片分类是有很大作用的。手写数字代码即

2020-06-16 11:57:04 294

原创 tensorflow2介绍第二天----代价函数----拟合

文章目录交叉熵代价损失函数拟合过与欠程序dropout优化器优化器使用提升准确率优化达到98%可视化网络训练过程查看网络运行数据tensorflow官方代码实现交叉熵代价损失函数、当激活函数是sigmoid或者双曲函数时，用交叉熵损失比较好。交叉熵代价函数在调整权值或者偏置值时，调整的策略比较合理，因为调整的合理，所以训练过程模型收敛速度比较快。拟合过与欠回归分类问题如果数据太少，模型又越复杂，即容易出现过拟合问题。lamda调节正则化的那部分的重要性

2020-06-15 12:11:28 248 1

原创 tensorflow2介绍第一天----各个环境配置

文章目录安装tensorflow介绍CPU版本或GPU版本Anaconda安装tensorflow安装基本概念tensorflow变量使用fetch与feed操作简单使用案例创建卷积网络--回归例子手写数字数据集手写数字识别问题安装tensorflow介绍CPU版本或GPU版本之后可以用GPU加快计算训练，tensorflow支持python与C++语言，底层是用C++写的，使用一般用python，可以用于图像识别，可以在一个或多个CPU或GPU上运行，还可以运行在嵌入式系统中，比如手机平板电脑等，或

2020-06-14 09:32:01 190

原创 tensorflow第七天---深度学习

文章目录分布式的原理，架构，更新参数模式分布式的原理，架构，更新参数模式所有电脑服务器组成了集群。老大创建好会话文件等后，之后与小弟都可以一起计算并用这个会话资源了。不断调整过程。同步模式更新参数过程：同步意思是说：若两个工作服务器计算速度不一样，有速度差异后就必须有个等待过程，只有两个工作服务器都计算好后，才将梯度变化量传入参数服务器中之后再去计算平均更新参数了。异步更新参数模式：若3个工作服务器都进行各自有一批数据训练，工作1计算好后将梯度变化量直接传

2020-06-13 08:15:16 100

原创 tensorflow之深度学习-----第六天

文章目录复习验证码识别原理分析验证码识别程序流程以及图片数据的处理复习验证码识别原理分析字母之间等距离，即分割简单。用一些库就可以达到分割目的。但是分割不是通用的方法，对于更多图片并不适用。若字母之间倒一点，离的近就无法分割了。所以对于神经网络来说分割是不必要的，我们可以整体识别他。即类别有几千种甚至上万，所以会造成干扰。此时一张图片就有4个目标值了，每个目标值假设有26种可能性。并不像之前狗图片最后只会得出识别出是狗即可。字母用数字标记后，然后转换为独热编码。

2020-06-12 12:03:28 115

原创 tensorflow之深度学习-----第五天

文章目录卷积神经网络介绍以及卷积层结构激活层与池化层面试题分析卷积神经网络介绍以及卷积层结构一种特定的卷积结构：指定每一层怎么加，加的是什么层，经过这些层得到结果。所以目的尽量减少最后一层全连接层的权重数量，因为是要线性方程求的。若是1000类别，即权重参数更多了。造成训练耗时间。此时可以在全连接层之前削减特征数量，只找出关键特征，之后全连接层就可以减少参数了。所以输入以及输出结构怎么改，这就是CNN的灵活性，即基本结构是不变，只是将输出或者一些特定结构一改就可以做其他事情

2020-06-11 17:23:43 170

原创 tensorflow之深度学习-----第五天

文章目录感知机模型神经网络结构简单的神经网络实现手写数字图片识别感知机模型单个神经元手获取杯子温度，传到大脑，神经元感觉温度过高放下杯子。神经网络即也让算法模拟这个神经元过程。一个感知机解决不了，再加上一个感知机就可以解决复杂问题了。感知机与逻辑回归输入都是线性回归，但是感知机是通过阈值判断，而逻辑回归是通过激活函数求得一个0-1的概率进行判断。神经网络结构一种结构的神经网络是一种算法的统称。对于图像识别有特

2020-06-11 08:30:33 107

原创 tensorflow之深度学习-----第四天

文章目录图像基本知识分析图片文件读取二进制文件读取分析![在这里插入图片描述](https://img-blog.csdnimg.cn/20200610080631308.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNDk4NDk0,size_16,color_FFFFFF,t_70)二进制文件读取tfrecords文件的读取与存储

2020-06-10 11:22:19 142

原创 tensorflow之深度学习-----第三天

文章目录tensorflow解决读取数据、实现同步模拟tensorflow解决读取数据、实现同步模拟

2020-06-09 15:03:19 148

原创 tensorflow之深度学习---第二天

文章目录可视化学习注意：**所有的op都有name名称**可视化学习只有进行初始化操作之后，此时变量中var才真正有值了。默认对于张量a，b在程序中没有用时，图中不显示。若定义的是变量即使不用也显示。以下更新代码后会生成一个新的图结构。注意：所有的op都有name名称...

2020-06-08 17:30:27 106

原创 Tensorflow之深度学习---第一天

文章目录tensorflow基本介绍安装Tensorflow安装Tensorflow01tensorflow图的结构分析Tensorflow框架数据流图结构的思想图tensorflow基本介绍0.12版本tensorflow可以可视化，像web界面一样，好用。安装TensorflowTensorflow框架使用GPU很简单，只需要一行代码就可以搞定，不像之前要部署代码，需要一大堆配置文件，这里若你本地有一个GPU设备，在你的程序中指定一行代码，就可以了，就会自动用GPU计

2020-06-08 11:01:49 117

原创 sklearn第五天

文章目录算法总结-梯度提升树二分类原理算法流程算法总结-梯度提升树二分类原理算法流程

2020-05-31 12:04:54 81

原创 sklearn----第四天-决策树--随机森林原理

文章目录决策树的熵原理如何构建这个树，哪个属性特征放在第一位有标准ID3算法例子决策树熵原理（二）决策树使用（一）-决策树属性列分时计算.决策树gini系数.随机森林原理随机森林和决策树比较决策树的熵原理如何构建这个树，哪个属性特征放在第一位有标准原来混乱的熵减去排序过后的熵，就是信息增益。即ID3算法例子决策树熵原理（二）决策树使用（一）样本分成几份，即2分；leaf即叶子。-决策树属性列分时计算.

2020-05-28 12:29:41 184

原创机器学习之--sklearn介绍

文章目录机器学习框架sklearn框架结构启动notebook算法一---KNN机器学习框架数据挖掘：我们从数据中找出有规律的规则。数据分析：对数据分类处理，找出内在规律。这就是机器学习。sklearn框架结构会将依赖库也同时安装。启动notebook6个子文件夹模块算法一—KNN...

2020-05-26 11:29:35 272

原创 sklearn第二天

文章目录KNN鸢尾花分类总体流程KNN参数cross_val_score调参KNN中的另一个参数weightsKNN癌症诊断KNN鸢尾花分类总体流程1导包2345KNN参数cross_val_score调参数据分成多分，留一份去验证，其他分用作训练；再换另一份，其他份作为训练，依次让每一份做验证集，其他作为训练即可。训练5次，验证5次，得到5次结果取平均，则更有说服力。KNN中的另一个参

2020-05-26 11:29:03 85

原创机器学习第8天---逻辑回归---k-means原理以及案例

文章目录模型的保存与加载已线性回归为例读取数据文件分类算法---逻辑回归定义，损失函数，优化与线性回归比较应用损失函数模型的保存与加载模型训练好后之后再用时肯定不用再重新训练了。可以用sklearn将我们的模型给保存下来。加载相当于读取序列化后的文件。pkl是sklearn固定的保存文件的格式，是一个二进制文件，保存后返回就是保存的模型。已线性回归为例读取数据文件此时不用再去训练模型了，即根据读取的模型参数直接去预测。分类算法—逻辑回归定义，损失函数，优化与线性回归比较应用

2020-05-23 07:59:31 524

原创机器学习第五天---朴素贝叶斯算法原理---分类模型评估

文章目录朴素贝叶斯算法原理朴素贝叶斯算法原理将三篇文章划分为三个类别的概率是多少，即占得比例。即贝叶斯思想，预测你这篇文档属于这10个类别的每个概率是多少，找出最大的概率即可。求在给定文档的词下，属于哪个类别的概率。之后可以选择每篇文章的重要性大的前几个词，可以找到一些比较重要的词进行统计了。每篇文章都可以将重要的词拿出来，就可以组成一个新的词列表。加上拉普拉斯平滑，保证某个文档属于某一类别的概率不会为0了。...

2020-05-18 11:05:27 581

原创机器学习第五天---k-近邻算法

文章目录k-近邻算法k-近邻算法思想案例预测入住位置k-近邻算法需要做标准化。k-近邻算法思想有个人来了放在某一个位置上，但是不知道处于哪个区，有微信，将那昌平，朝阳，石景山三个人拉进群里，你们几个发一下距离我的距离定位，这样5个人处于的区以及位置都告诉了这个人，老王获得后，就可以知道自己所在区了，因为每个人到老王有个距离，我可以定位找到这个距离。即既然不知道我处于哪，但是可以找到离我最近的那个人，若小明距离老王近，且小明在朝阳区，那老王也在朝阳区了，即老王可以通过这些条件特征找到自己的目标值。

2020-05-17 12:33:30 125

原创机器学习---数据的降维---机器学习算法分类以及开发流程

文章目录特征选择主成分分析--降维![在这里插入图片描述](https://img-blog.csdnimg.cn/20200515100744490.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNDk4NDk0,size_16,color_FFFFFF,t_70)特征选择也作为机器学习的数据输入。有一些特征不需要，即可

2020-05-16 11:05:45 160

原创机器学习2第二天---特征预处理

文章目录特征预处理-归一化归一化以及标准化对比标准化标准化总结以及缺失值处理缺失值处理注意：并不是所有的算法都需要进行标准化与归一化。根据不同的算法来的。特征预处理-归一化归一化以及标准化对比最小最大缩放对结果影响：即有异常点，即数据中有一些点不对，就会影响归一化公式中的最小最大值，导致每一列的最大值都改变了。因此归一化对于有异常点的数据处理不是太好。鲁棒性：即稳定性，适应能力要好。标准化数据分散方差大，数据集中，方差越小。标准化

2020-05-15 09:39:01 149

原创机器学习2----第一天

文章目录机器学习概述数据集的组成数据集的结构可以用的现成数据集常用的库网址常用数据集的结构组成机器学习概述数据集的组成格式不用mysql原因：1、对于存储读取几M或几G文件数据时，读取速度慢。2、格式不太符合机器学习要求的数据格式，还需要自己进一步处理数据格式。所以一般企业中获取数据不在数据库中获取。对于mongodb数据库，读取性能好，但是大多数都是以json格式，但是json格式又不太适合机器学习，所以数据还是得处理。因此大多数数据以文件形式存储，如存储在csv文件中。panda

2020-05-14 10:54:02 244

原创 HMM--实践

文章目录HMM理论补充后向算法期望学习算法利用频率估计概率HMM理论补充r是求一个时刻位于的隐状态后向算法第t个时刻位于第i号隐状态下，而后面的观测值Ot+1，Ot+2，OT期望学习算法绿色可用EM算法进行。利用频率估计概率因为算初始概率，所以统计每句话的句首时，可能是单字成词或者开始态，不可能是中间与结束字。...

2020-05-11 09:13:09 152

原创 HMM

文章目录隐马尔可夫模型隐马尔可夫模型做一些隐特征的挖掘以及时间序列的分析。

2020-05-09 10:57:36 206

原创主题模型---实践

文章目录理论LDA开源库介绍以文本分类为例Gensim安装word2vec实践理论LDA开源库介绍以文本分类为例保证所有样本的特征映射成的维度都是一样的。即由0-1组成的V维度向量。Gensim安装爬一些新闻，如下：word2vec实践...

2020-05-07 11:52:38 111

原创主题模型---理论

主题模型主要内容若想做文档的提取，分类，以及发现，做0-1向量得到长度为V的向量。每一个文档的长度都是V维的，保证每个文档对应的0-1向量是一样的，所以不管是喂给logistic回归，还是SVM，随机森林，都是可能得到监督学习模型的。也可以使用朴素贝叶斯进行分类。对于同样一个词，放在不同的语义中即隐含的意义是不同的，即topic就不同，主题就不同，因此希望将这个词背后的topic拿到...

2020-05-01 14:42:13 316

原创贝叶斯网络实践

文章目录主要内容小插曲形式化理解马尔科夫模型一点马尔科夫模型知识文本数据的处理流程TF-IDF模型Word2vec的使用主要内容利用库想去做分类时候，是怎样的一个现象。尤其关注分类的时间和效率怎么样，以及精度与logistic回归，SVM，岭回归可做一个比较。即每个词出现的位置，即标注为1，未出现的词，即标注为0.公式有时会有点差别，但是这是我们在自然语言中提取特征的办...

2020-04-30 10:34:00 223

原创贝叶斯网络---理论

文章目录贝叶斯网络主要内容相对熵互信息信息增益概率高斯朴素贝叶斯朴素贝叶斯贝叶斯网络利用图论知识帮我们做点推敲主要内容相对熵互信息信息增益概率高斯朴素贝叶斯朴素贝叶斯...

2020-04-22 09:19:01 510

原创 EM算法实践

文章目录多维度的GMM聚类EM是聚类的一种吗？GMM--高斯混合模型调参多维度的GMM聚类对称正定矩阵，即协方差矩阵。EM是聚类的一种吗？EM算法是可以解决高斯混合模型他的参数的推断的，这是EM算法可做的。而聚类中有个k均值算法，其中假定各个类别是服从的等方差的高斯分布。即K均值可以解决一种特殊的高斯混合模型。所以EM与聚类有些问题是都可以解决的。EM算法对于观测数据不完整的，我们仍然可...

2020-04-20 16:13:58 275

原创 EM算法---重要的数据挖掘算法---期望最大化

文章目录主要内容EM代码说明Jensen不等式最大似然估计考虑如下问题一种欧拉式的说明问题解决从理论公式推导GMM-高斯混合模型主要内容EM代码说明在1000个用户中，有两种服从不同分布的高斯模型。先验假定只有男女两个类别，即一个是男性部分，一个是女性部分，二者进行混合得到所观测到的1000个数据，即称为高斯混合模型。可以用EM算法进行这4个参数的推断。甚至推断这1000个中，有多少个...

2020-04-19 07:56:55 250

原创聚类--第二天实践

文章目录层次聚类方法凝聚层次聚类分裂层次聚类簇间距离的不同定义密度聚类方法具体算法过程问题讨论不同的参数有不同的结果层次聚类方法凝聚层次聚类这个使用多一些，即先把相似的样本合在一起，依次进行下去。分裂层次聚类簇间距离的不同定义加入噪声后ward平方和取平均就好了，complete最大距离不太好了，欧式距离也不太好了。所以要多进行尝试几次参数试试。但是做时，不希望引入噪...

2020-04-16 07:42:02 189

原创聚类第一天

文章目录聚类有监督学习：无监督学习--聚类解决问题主要内容聚类定义相似度度量通过欧式距离得到进一步的讨论聚类有监督学习：在样本中y是离散的称为分类；y是连续的称为回归；无监督学习–聚类如果样本中只是有一些x，而y是不存在的，缺失的，没有的，我们现在希望指出x本身这些数据，利用相似性，将x做一个聚类。相当于用聚类算法选择出一些新的特征来了。解决问题在有些场景下，算法就是模型...

2020-04-14 13:27:37 105

原创 SVM实践

文章目录核函数核函数本质问题解答:核函数二阶全映射采用多项式核函数采用高斯核函数：求得是两个样本x与y之间的相似度。当两个维度相同，相似度为1，即最高。当不同时，相似度反正是个0-1的数。无穷远时，相似度为0。所以就可以看成以当前xi为中心的高斯核函数。如在3维空间中的超平面，在2维空间中就是曲线，如在100维中的超平面，在50维中可能就是某一...

2020-04-12 08:43:02 139

原创 SVM学习第一天

文章目录主要内容与目标SVM中各种概念问题解答1主要内容与目标SVM中各种概念问题解答1

2020-03-10 14:17:09 98

原创 XGBoost实践

文章目录XGBoost简介Kaggle简介根据乘客数据预测是否存活数据中有缺失值时如何处理问题1问题二代码实践实例1实例2实例3实例4实例5结果分析SVM效果相对好XGBoost简介XGBoost实践用的是train来训练，并传一些参数进行训练。Kaggle简介根据乘客数据预测是否存活数据中有缺失值时如何处理问题1问题二代码实践实例...

2020-03-06 18:37:39 136

空空如也

空空如也