机器学习
学习笔记
黑黑白白君
这个作者很懒,什么都没留下…
展开
-
关于测试岗的思考
确定下来今年毕业以后做测试岗,所以做个相关的分析。#软件测试的职业发展1、管理方向2、技术方向3、半路掉头方向目前只考虑技术方向:软件测试的技术型路线发展:1、自动化测试工程2、性能测试工程3、持续集成工程师4、测试开发工程师5、开发工程师最高境界:架构工程师/全栈工程师*关于软件测试的思维和方法论:《Google软件测试之道》、《敏...原创 2019-03-11 23:20:42 · 474 阅读 · 0 评论 -
#计算机专业权威期刊#
一、计算机科学期刊介绍计算机科学的publication最大特点在于:极度重视会议,而期刊则通常只用来做re-publication。大部分期刊文章都是会议论文的扩展版,首发就在期刊上的相对较少。也正因为如此,计算机期刊的影响因子都低到惊人的程度,顶级刊物往往也只有1到2左右----被引的通常都是会议版论文,而不是很久以后才出版的期刊版。因此,要讨论计算机科学的publication,首先必须强调...转载 2018-06-14 21:30:21 · 2098 阅读 · 0 评论 -
深度学习之LSTM案例分析(三)
#背景来自GitHub上《tensorflow_cookbook》【https://github.com/nfmcclure/tensorflow_cookbook/tree/master/09_Recurrent_Neural_Networks】Stacking Multiple LSTM LayersWe stack multiple LSTM layers to impro...原创 2019-04-02 15:59:25 · 1048 阅读 · 0 评论 -
深度学习之LSTM案例分析(二)
#背景来自GitHub上《tensorflow_cookbook》【https://github.com/nfmcclure/tensorflow_cookbook/tree/master/09_Recurrent_Neural_Networks】Implementing an LSTM Model for Text GenerationWe show how to implement...原创 2019-04-02 15:24:45 · 1130 阅读 · 0 评论 -
深度学习之LSTM案例分析(一)
#背景知识见《深度学习之tensorflow(六)》【https://blog.csdn.net/m0_37621024/article/details/88680580】#《深度学习之tensorflow(六)》中的代码import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_d...原创 2019-04-02 10:55:08 · 4540 阅读 · 1 评论 -
深度学习之tensorflow(七)
#保存和载入模型import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#载入数据集mnist = input_data.read_data_sets("MNIST_data",one_hot=True)#每个批次的大小batch_size = 100#计算一共有多少个批...原创 2019-03-20 14:11:19 · 223 阅读 · 0 评论 -
深度学习之tensorflow(六)
#RNN(Recurrent Neural Network 循环神经网络)BP神经网络没有反馈回路,而RNN有。RNN存在梯度消失的问题,随时间的流逝信号会不断地衰弱:#LSTM(Long Short Term Memory)输出门:判断信号输出多少; 输入门:判断信号能不能输入,如果信号有用就让它输入,如果没有用就让它变成0; 忘记门:判断信号衰减程度;...原创 2019-03-20 11:13:54 · 571 阅读 · 0 评论 -
深度学习之tensorflow(五)
#卷积神经网络传统神经网络存在的问题:权值太多,计算量太大; 权值太多,需要大量样本进行训练。卷积神经网络CNN:CNN通过感受野和权值共享减少了神经网络需要训练的参数个数:卷积:多个卷积核:*卷积核可以看作是一个滤波器,卷积操作之后会得到一个特征图,不同的卷积核得到的特征图是不一样的,所以不同的卷积核可以对图的不同特征进行取样。#pooling(池化)...原创 2019-03-18 15:44:51 · 1182 阅读 · 1 评论 -
深度学习之tensorflow(四)
#tensorboard可视化学习。TensorFlow 可用于训练大规模深度神经网络所需的计算,使用该工具涉及的计算往往复杂而深奥。为了更方便 TensorFlow 程序的理解、调试与优化,发布了一套名为 TensorBoard 的可视化工具。您可以用 TensorBoard 来展现 TensorFlow 图,绘制图像生成的定量指标图以及显示附加数据(如其中传递的图像)。当 Tensor...原创 2019-03-17 11:33:51 · 815 阅读 · 0 评论 -
深度学习之tensorflow(三)
#二次代价函数(quadratic cost)C是代价函数; x表示样本,y表示实际值,a表示输出值; n表示样本总数。 以一个样本为例进行说明,此时: a=δ(z),z=∑Wj*Xj+b; δ()是激活函数 假如我们使用梯度下降法(Gradient descent)来调整权值参数的大小,权值w和偏置b的梯度推导:z表示神经元的输入,δ表示激活函数; ...原创 2019-03-14 20:28:27 · 1195 阅读 · 0 评论 -
深度学习之tensorflow(二)
#非线性回归import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt#使用numpy生成200个随机点x_data = np.linspace(-0.5,0.5,200)[:,np.newaxis]noise = np.random.normal(0,0.02,x_data.shape)y_...原创 2019-03-14 20:27:31 · 329 阅读 · 0 评论 -
深度学习之tensorflow(一)
#tensorflowTensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Goo...原创 2019-03-04 23:51:59 · 321 阅读 · 0 评论 -
深度学习之tensorflow安装
#tensorflowTensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Goo...原创 2019-03-04 21:20:47 · 305 阅读 · 0 评论 -
机器学习之总结
supervised learning(监督学习算法) 线性回归、逻辑回归、神经网络、支持向量机 会有带标签的数据和样本 unsupervised learning(无监督学习) K-均值聚类算法、主成分分析法(来进行降维)、异常检测算法 特定的应用和话题 推荐系统、大规模机器学习系统(包括并行和映射-化简算法)、滑动窗口分类器(用于解决计算机视觉问题) 如何...原创 2019-03-12 21:17:08 · 165 阅读 · 0 评论 -
机器学习之应用举例
#Photo OCRPhoto Optical Character Recognition(照片光学字符识别),注重的问题是如何让计算机读出图片中的文字信息。1、给定某种图片,它将图像扫描一遍,然后找出照片中的文字信息;2、重点关注这些文字区域,进行文字分离,并对区域中的文字进行识别;3、用一个分类器对这些可见字符进行识别。将像这样的一个系统称为machine learni...原创 2019-03-12 21:06:22 · 4434 阅读 · 0 评论 -
机器学习之大规模机器学习
#Large scale machine learning(大规模机器学习)即处理大数据集的算法。#Learning with large datasets(学习大数据集)在需要训练大量模型时,预先检查往往是个明智的选择; 使用一个非常小的训练集的效果可能相同。它也是绘制学习曲线的常用方法; 右者即使训练集增大,效果也不会更好。应该添加额外的特征项或在神经网络中添加额...原创 2019-03-12 15:56:05 · 532 阅读 · 1 评论 -
机器学习之推荐系统
#Recommender Systems(推荐系统)机器学习的一个很重要的应用。#Problem formulation(问题规划)所以如果想开发一个推荐系统,就要想出一个能自动填补这些缺失值的学习算法,这样就可以看看该用户和那些没看过的电影并推荐新电影给该用户。#Content-based recommendations(基于内容的推荐算法)把每个用户的评...原创 2019-03-12 10:44:06 · 2555 阅读 · 0 评论 -
机器学习之异常检测
#Anomaly detection(异常检测)这是机器学习算法的一个常见应用,虽然主要用在非监督学习问题,但从某些角度看跟监督学习问题是非常相似的。更正式的定义:给定无标签的训练集,对数据建模即p(x),即对x的分布概率建模,对于新样本,如果p(Xtest)低于阈值ε,则将其标记为异常。举例:#Gaussian distribution(高斯分布)也称为n...原创 2019-03-11 19:44:56 · 4473 阅读 · 0 评论 -
机器学习之降维
#Dimensionality Reduction(降维)【无监督学习】#Motivation 1:Data compression(目标1:数据压缩)如果我们能把所有的原始样本投影这条绿色线上,则只需要一个数就能指定点在直线上的位置; 这会让学习算法运行得更快。投影在一个平面上;#Motivation 2:Data Visualization(目标2:可视化)...原创 2019-03-11 14:37:18 · 437 阅读 · 0 评论 -
机器学习之无监督学习
#Unsupervised learning(无监督学习)supervised learning(监督学习):有一系列标签,然后用假设函数去拟合它; unsupervised learning(无监督学习):将这系列无标签的数据输入到算法中,然后让算法找到一些隐含在数据中的结构;#clustering algorithm(聚类算法)能够找出图中所圈出的cluster(簇)的算法【...原创 2019-03-10 21:51:22 · 240 阅读 · 0 评论 -
机器学习之支持向量机SVM
#Support Vector Machine(支持向量机SVM)与logistic回归和神经网络相比,SVM在学习复杂的非线性方程时能够提供一种更为清晰和更加强大的方式。【监督学习算法】#Optimization objective(优化目标)支持向量机(SVM)的总体优化目标:如果优化了这个函数(下图最后一个式子),就得到了SVM学习得到的参数。变化一)去...原创 2019-03-09 16:44:48 · 308 阅读 · 0 评论 -
机器学习之机器学习系统测试
#Prioritizing what to work on:Spam classification example实际工作工程中,我们应该优先处理哪些事情?为了应用监督学习,首先要想的是如何来表示邮件的特征向量x:在特征向量中放入0和1,对应文本中该单词是否出现。如何在有限时间下让你的垃圾邮件分类器具有高精准度和低错误率?收集大量数据 “honeypot”项目通过构...原创 2019-03-08 20:01:07 · 1364 阅读 · 0 评论 -
机器学习之应用机器学习的建议
#Deciding what to try next?(决定下一步做什么)如何改进算法?使用更多训练样本(但有时候没有用) 尝试使用更少的特征(仔细挑选一小部分来防止过拟合) 使用更多特征 增加多项式特征 增加或减小正则化参数λ#Evaluationg a hypothesis(评估假设)仅仅因为一个假设具有很小的训练误差并不能说明它一定是一个好的假设。#评...原创 2019-03-08 16:55:38 · 341 阅读 · 0 评论 -
机器学习之神经网络参数的反向传播算法
#Cost function(代价函数)我们不把bias term(偏差项)θ0正则化 神经网络现在输出了属于R^K的向量 每个h(x)_i表示第i个输出 求和项主要是k个输出单元之和 第二项类似于在逻辑回归里面所用的正则化项#Backpropagation algorithm(反向传播算法)使代价函数最小化的算法。只含一个训练样本的情况:为了计算...原创 2019-03-06 19:44:08 · 931 阅读 · 0 评论 -
机器学习之神经网络学习
#Neural Network(神经网络)Non-linear hypothesis(非线性假设)为什么需要神经网络?pixel(像素点)只是包括平方项或者立方项特征,简单的logistic回归算法并不是一个在n很大的时候学习复杂的非线性假设的好方法,因为后者特征过多。而神经网络在学习复杂的非线性假设上被证明是一种好得多的算法,即使输入的特征空间很大也能轻松搞定。...原创 2019-03-06 14:49:33 · 299 阅读 · 0 评论 -
机器学习之正则化
#Overfittion(过拟合)如果有过多的变量,而只有非常少的训练数据,就会出现过度拟合的问题。#如何解决?1、减少特征的数量2、正则化#Cost function(代价函数)penalize(加入惩罚项)#正则化背后的思想:修改代价函数,来缩小所有的参数(因为不知道该去缩小哪些参数)。即加一个额为的正则项,来缩小每个参数的值。*约定...原创 2019-03-06 09:42:48 · 209 阅读 · 0 评论 -
机器学习之logistic回归算法
#Classification(分类)#Logistic regression(logistic回归)一种分类算法,用在标签y为离散值0或1的情况下。#背景线性回归应用在分类问题上通常不是一个好主意:所以引出logistic回归算法#Logistic Regression Modelsigmoid函数/logistic函数:g(z)#...原创 2019-03-05 21:14:32 · 450 阅读 · 0 评论 -
机器学习之多变量线性回归
#the hypothesis for linear regression with multiple features or with multiple variables(多元或多向量线性回归假设)#Gradient descent for multiple variables(多元梯度下降法)#多元梯度下降法演练1、Feature Scaling(特征缩放)...原创 2019-03-05 15:50:45 · 339 阅读 · 0 评论 -
机器学习之线性代数回顾
#Matrix(矩阵)Matrix Elements(entries of matrix)(矩阵元素)#Vector(向量)*通常大写字母表示矩阵,小写字母表示向量。#Matrix Addition(矩阵加法)#Scalar Multiplication(标量乘法)#Matrix-matrix Multiplication(矩阵乘法)#Matrix inverse(逆运算...原创 2019-03-05 10:52:23 · 112 阅读 · 0 评论 -
机器学习之梯度下降算法
#梯度下降learning rate(学习速率):控制以多大幅度更新参数。 太小移动慢; 太大可能越过最小值甚至无法收敛。 partial derivative terms(偏导项) #如果参数已经在局部最小值,则参数不再改变。#线性回归中的梯度下降为了应用梯度下降算法,关键步骤是这个导数项。推导导数项:注意要同时更新两个参...原创 2019-03-05 09:51:25 · 211 阅读 · 0 评论 -
深度学习之机器学习
#深度学习深度学习(英语:deep learning)是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。表征学习的目标是寻求更好的表示方法并创建更好的模型来从大规模未标记数据中学习这些表示方法。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。【https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA...原创 2019-03-03 18:31:48 · 1838 阅读 · 0 评论 -
深度学习入门之配置装置
#python安装Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。https://baijiahao.baidu.com/s?id=1606573927720991570&wfr=spider&for=pc#Anacond...原创 2019-03-03 18:25:27 · 727 阅读 · 0 评论