Fitz_p-CSDN博客

原创我对机器学习的整理理解

在机器学习通常来说，特征工程对模型性能影响最大，参数调优一般提升不如特征工程提升。首先需要对数据进行充分探索，如属性是字符串类型、日期类型还是数值类型；若提供的数据存在几张表中，表中数据是否存在关联，是否可以进行统计、聚合；从业务理解上，可能影响模型性能的因素有哪些，表中数据能否构造该因素。其次，我们需要对数据进行预处理。对字符串、categories 一般来说我们可以： ...

2019-12-08 23:51:41 467

原创 svc实战fashion-mnist图像分类

支持向量机 (SVMs)可用于以下监督学习算法:分类,回归和异常检测.支持向量机的优势在于:在高维空间中非常高效. 即使在数据维度比样本数量大的情况下仍然有效. 在决策函数（称为支持向量）中使用训练集的子集,因此它也是高效利用内存的. 通用性: 不同的核函数核函数与特定的决策函数一一对应.常见的 kernel 已经提供,也可以指定定制的内核.支持向量机的缺点包括:...

2019-09-24 01:23:01 2950 4

原创实战fashion-mnist图像分类

1.分类原理（以crossentropy为例）分类误差: 通过梯度下降 w：=w-d(L)/d(w) 来更新w的值，使得w朝梯度=0的方向变化，减少分类误差.2.下面来上代码2.1数据加载import matplotlib.pyplot as pltimport matplotlib as mpl%matplotlib ...

2019-09-21 21:20:03 2238

原创 Mysql添删改查，修改字段属性

1.创建表 Create table tableName(file type,file type …) 2.创建数据库： Create database databaseName3.使用数据库： Use databaseName4.删除表： Drop table tableName 5.select Select * from tableName where file=c...

2019-09-19 23:59:41 321

原创 MySql基本使用2（select，between，in，where，like，count，distinct，group by，order by，多表查询）

2019-09-19 23:25:51 368

原创排序算法--快速排序

快速排序原理1.选择一个基准值，这里我们选arr[0],即52.从右向左找，找到第一个比首元素小的后停止，找到4；记下标为j3.从左向右找，找第一个比首元素大的后停止，我们找到8；记下标为i4.交换4和8的位置5.从刚刚停下的地方继续从右向左找比首元素小的，从左向右找比首元素大的，然后互换位置。…6.直到j=i为止，此时交换基准arr[0]和arr[j]的位置，则得到：在基准的左...

2019-03-04 22:49:23 231

算法原理（默认从小到大排序）1.从前往后依次比较相邻两个元素，如果arr[j-1]&gt;arr[j] ,则交换两元素位置，直到len(arr)-1处停止，记录最后发生交换的位置right=j2.从前向后依次比较相邻两元素，若前一个大于后一个，则交换两元素，直到right位置停止；若此时不发生元素交换，则算法过程结束。3.循环执行2过程，直到right&lt;2 或不在发生元素交换。righ...

2019-03-04 21:46:20 743

原创排序算法--插入排序

算法原理如数组: [18, 2, 15, 9, 3, 19, 14, 7] ,从index=0开始,拿出18,认为[18]排序排好了。然后拿index=1，得到[18,2]，此时找2应当插入的位置，从右向左排依次排搜索，得到[2,18]。然后拿index=2，得到[2,18,15],从右开始排序，18和15比，18&gt;15，18和15互换位置，得到[2,15,18]。然后拿到inde...

2019-03-04 20:53:03 212

原创决策树-处理连续值（5）

一.决策树根据属性进行一步步判断，连续值存在无限可能，故为了能够处理连续值，需要将连续值转化为离散值二.连续属性离散化技术：二分法（最简单）三.二分法做法：将连续值划分为 >t,<t，两类遍历属性所有值，按从小到大排序则Ta={（ai+ai+1）/2 | 0<i<n } 遍历Ta，考察划分点，这里采用信息增益的方式，选取信息增益最大的划分点 a...

2019-02-04 23:59:27 637

原创决策树-后剪枝（4）

1.目的：提高泛化性能，2.后剪枝做法：先生成完整的决策树由最底层结点开始考察，若把其替换成叶节点（取样例数最多的一类），比较验证集精度，如果精度提升，则将其替换为叶节点（剪枝）；否则不进行剪枝；参考书籍：机器学习-周志华...

2019-02-04 23:52:01 464

原创决策树预剪枝（3）

1.预剪枝的目的：提升决策树的泛化性能 2.预剪枝的做法：将数据划分为训练集和验证集在划分每个节点之前进行评估，若当前节点的划分不能提升泛化性能，则停止划分，并将其标记为叶节点；若当前节点的划分能够提升泛化性能（从信息增益 or 其他方式选择最优属性），则继续划分； 3.如何判断泛化性能是否提升：用留出法（机器学习-性能评...

2019-02-04 23:47:12 1039

原创决策树sklearn实现（2）

上一篇文章已经讲了决策树的原理：模拟人决策过程，按因素影响程度从大到小，依次决策，得出最终结论。也讲了如何判断因素的影响程度的一种方法：信息增益越大，影响程度越大。也大致讲了递归构建决策树的过程，今天我们来使用sklearn实现决策树。我不建议重复造轮子，除非当前轮子无法满足需求。sklearn实现决策树的核心代码就3句：1.声明决策树模型model=tree.DecisionTr...

2019-02-04 23:30:26 1170

原创决策树思维方式及实现过程（1）

1.决策树是模拟人决策过程，按因素影响程度从大到小，依次决策，得出最终结论。如下图：为分类一封邮件是否为垃圾邮件 2.如何评判因素的影响程度a.评判影响程度的一种方法是信息增益，信息增益越大，表示该因素的影响程度越高，用该因素决策，越容易到达结论（只剩下单一可能类别）b.信息的定义：如果待分类的事物可能划分在多个分类之中，则符号xi的信息定义为：c.熵：信息的...

2019-02-03 11:02:17 913

原创每天学点算法->进化策略->遗传算法简单例子解读

假设草原上有一群斑马,这群斑马里面,有些斑马跑的比较快,有的跑的慢,而狮子每次捕猎能抓到跑的慢的斑马,那么经过一代代的繁衍,根据达尔文进化论,留下的大部分斑马都是跑的比较快的。进化策略也是基于这优胜略汰,适者生存的套路,通过模拟一个种群的进化过程,逐步优化参数,最终使得目标函数达到最优.在这个例子中目标函数:max=sin(10*x)*x + cos(2*x)*x ; x属于[0,5]...

2018-10-12 00:34:21 781

原创每天学点算法->强化学习->Q_learning走迷宫

今天给大家分享如何用Q_learning算法来实现走迷宫,我们的红色方块会一次次的尝试不同的格子,直到落入黑格子,获得惩罚*1;或者走进黄格子,获得奖励*1为止。每一次游戏都会更新Q_table的权重，以实现红色方块下一次能够更加快速的找到黄格子。本文参照了莫烦python的博客：https://morvanzhou.github.io/tutorials/machine-learning...

2018-10-08 23:34:26 3126 5

原创每天学点算法->强化学习->Q_learning

本文将按照以下顺序进行内容安排：一.Q_learning 简单示例二.示例的逻辑思路和代码三.Q_learning应用拓展第一部分：Q_learning 简单示例——寻找目标T表示目标位置o表示人物位置人物随机出生在一个地点，人物不知道T的位置，但每次可以向左或向右走一步，走到T位置则完成任务。第二部分：简单示例的逻辑代...

2018-10-08 00:21:16 401

原创算法思维-Demo3 树的实现

树的实现特定的树结构会使得他们更加容易实现其中最容易实现的就是根的树结构了，这种树的每条边都统根出发，并向下延伸。此类结构所代表的往往是某个数据集拥有所有的层次结构，其根节点代表着全部对象（这些对象获取就被直接包含在叶节点内）而其内部各节点所代表的对象都是以该节点为跟的树结构的叶节点。在这里我们甚至可以直接利用类似直觉，将各个子树组织成一个子树列表 T=[ ["a","b"...

2018-07-29 19:10:41 525

原创算法-图的几种表示方法

表示如下的一个图有哪些方法呢，import numpy as np1.邻接矩阵图的一种常见的表示方法就是邻接矩阵了，这种表示的主要不同之处在于，它不在列出每个节点的所有邻居节点，而是会将每个节点的可能的邻居位置排成一排也就是一个数组，用于对应图的每一个节点，然后用某种值，如True或false来表示相关节点是否是当前节点的邻居。其最简单的形式也可用嵌套list来实现。a,...

2018-07-28 18:23:00 4410

原创 Android使用Recycler View实现瀑布流效果

下图是淘宝上瀑布流的一个应用场景，今天我们就来用Recycler View实现以下瀑布流效果一：创建Activityactivity中核心代码为mRvPu.setLayoutManager(new StaggeredGridLayoutManager(2,StaggeredGridLayoutManager.VERTICAL));该行代码使用layoutmanager实现一...

2018-07-24 23:22:12 15603 3

原创 Android使用RecyclerView实现列表功能

在Android中，列表是使用最多最广的功能之一，而RecyclerView是Android中最灵活的列表控件之一，在企业开发中广泛运用，本章我们使用RecyclerView实现如下图的列表功能。一.与ListView类似，RecyclerView需要有容纳其布局的layout，以及展示layout的activity1.activity_...

2018-07-22 21:52:34 7217 1

转载 Tensorflow学习笔记——Summary用法

最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。其中tensorboard 作为一款可视化神器，可以说是学习tensorflow时模型训练以及参数可视化的法宝。而在训练过程中，主要用到了tf.summary()的各类方法，能够保存训练过程以及参数分布图并在tensorboard显示。tf.summary有诸多函数：1、tf.summ...

2018-07-10 22:32:34 392

原创神经网络-实现学习率随迭代次数变化

1.需要变化的学习率的原因:经历一段时间的学习之后,我们距离目标值越来越近,此时如果学习率太大,则会造成训练在最优值附近来回波动,这时候我们就需要减少学习率2.实现:学习率是在Optimizer中使用,我们每次迭代通过tf.assign修改学习率3.note: tf.assign(ref, value, validate_shape=None, use_locking=None, name=...

2018-07-09 22:08:27 6143

转载为什么有的机器学习应用公司必将失败？

作者 | Cassie Kozyrkov编译 | Leo出品 | 人工智能头条告诉大家一个秘密：当人们说起“ 机器学习 ”时，听起来好像只是在谈论一门学科，但其实是两门。如果企业不了解其中的差异，那么就可能招惹来满世界的麻烦。▌两个关于机器学习的故事在机器学习方面，企业经常犯的错误类似于：请一位厨师来制造烤箱或请一位电气工程师去烘烤面包。假设你是一家面包店的店主，你需要聘请的是一位经验丰富的面包师...

2018-07-08 19:29:04 235

原创神经网络使用drop_out消除过拟合+MNIST

1.drop_out的原理为:通过将某神经元的输出设置为0,达到使其失活的效果,消除网络中过分依赖某个神经元2.过拟合一般出现在网络过分复杂,且训练数据较少的情况,数据较少而未知参数太多,则较易产生过拟合3.核心代码:layer1=tf.nn.dropout(layer1,drop_out)#3-3 MNIst数据集使用drop-out提升准确率,消除部分过拟合import tensorflow ...

2018-07-08 19:25:49 4772 1

原创神经网络HelloWorld

神经网络界的 HelloWorld代码,了解神经网络过程1.输入2.通过参数拟合曲线,Helloworld中使用 y=∑ax+b,3.训练,反向传播,修改a,b的值修正拟合曲线#3-2 MNIst数据集分类简单版本import tensorflow as tf;import numpy as np;from tensorflow.examples.tutorials.mnist import i...

2018-07-08 19:18:44 537

原创 tensorflow入门，完成1元1次方程拟合

tensorflow入门，完成1元1次方程拟合该一元一次方程为：x_data = np.float32(np.random.rand(2, 100)) # 随机输入y_data = np.dot([0.100, 0.200], x_data) + 0.300由于是x_data是随机数，故而无法画出图形，若我们定义x为等差数列[[0,1,2,...100],[101...200]]则y=ax+b为分...

2018-06-30 10:37:13 927

原创 TensorFlow实现基础CNN,两层卷积+2层全连接网络demo

TensorFlow实现基础CNN,两层卷积+2层全连接网络demo,代码如下,注释都有import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#加载数据集mnist=input_data.read_data_sets('MNIST_data',one_hot=True)#每个批次的大小bat...

2018-06-27 23:59:47 4575

原创 Python正则表达式制作简单爬虫,爬取知乎主题/关注度/url

import requestsimport re#---------------------#作者:qyqin#时间:20170617#内容:简单爬虫爬取知乎首页主题/关注度/超链接#---------------------#设置请求头headers={ 'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.3...

2018-06-17 22:18:32 524

原创解决ubuntu17安装anaconda并解决conda ：找不到命令

1)首先安装anaconda部分：1.在anaconda官网下载linux安装包2.在下载目录打开终端键入：$bash Anaconda**.sh**表示完成的anaconda安装包filename3.一路yes4.最后会提示你是否下载vscode，这个看个人心意-----------------------------------------------------------------...

2018-03-28 22:02:33 2557 1

原创通过U盘实现硬盘安装kali 2018.1

#-----------------------------------------------#modify by qyqin#20180327#硬盘安装kali2018.1#-----------------------------------------------硬盘安装kali 2018.1的时候遇到深坑：“无法挂载光盘镜像”，最终发现只有用win32DiskImager烧录安装过程才能...

2018-03-27 23:48:56 4639

Fitz_p的博客

原创 3.3-什么是微服务架构

原创线性回归、对数几率回归的部分数学基础