- 博客(32)
- 收藏
- 关注
原创 我对机器学习的整理理解
在机器学习通常来说,特征工程对模型性能影响最大,参数调优一般提升不如特征工程提升。 首先需要对数据进行充分探索,如属性是字符串类型、日期类型 还是 数值类型;若提供的数据存在几张表中,表中数据是否存在关联,是否可以进行统计、聚合;从业务理解上,可能影响模型性能的因素有哪些,表中数据能否构造该因素。 其次,我们需要对数据进行预处理。对字符串、categories 一般来说我们可以: ...
2019-12-08 23:51:41 453
原创 svc实战fashion-mnist图像分类
支持向量机 (SVMs)可用于以下监督学习算法:分类,回归和异常检测.支持向量机的优势在于:在高维空间中非常高效. 即使在数据维度比样本数量大的情况下仍然有效. 在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的. 通用性: 不同的核函数核函数与特定的决策函数一一对应.常见的 kernel 已经提供,也可以指定定制的内核.支持向量机的缺点包括:...
2019-09-24 01:23:01 2889 4
原创 实战fashion-mnist图像分类
1.分类原理(以crossentropy为例) 分类误差: 通过梯度下降 w:=w-d(L)/d(w) 来更新w的值,使得w朝梯度=0的方向变化,减少分类误差.2.下面来上代码2.1数据加载import matplotlib.pyplot as pltimport matplotlib as mpl%matplotlib ...
2019-09-21 21:20:03 2210
原创 Mysql添删改查,修改字段属性
1.创建表 Create table tableName(file type,file type …) 2.创建数据库: Create database databaseName3.使用数据库: Use databaseName4.删除表: Drop table tableName 5.select Select * from tableName where file=c...
2019-09-19 23:59:41 305
原创 MySql基本使用2(select,between,in,where,like,count,distinct,group by,order by,多表查询)
---------------part1.【student、score、course】表结构及数据示例-----------mysql> select * from student;+-----+--------+------+---------------------+-------+| sno | sname | ssex | sbirthday | cla...
2019-09-19 23:25:51 350
原创 排序算法--快速排序
快速排序原理1.选择一个基准值,这里我们选arr[0],即52.从右向左找,找到第一个比首元素小的后停止,找到4;记下标为j3.从左向右找,找第一个比首元素大的后停止,我们找到8;记下标为i4.交换4和8的位置5.从刚刚停下的地方继续从右向左找比首元素小的,从左向右找比首元素大的,然后互换位置。…6.直到j=i为止,此时交换基准arr[0]和arr[j]的位置,则得到:在基准的左...
2019-03-04 22:49:23 221
原创 排序算法-冒泡排序
算法原理(默认从小到大排序)1.从前往后依次比较相邻两个元素,如果arr[j-1]>arr[j] ,则交换两元素位置,直到len(arr)-1处停止,记录最后发生交换的位置right=j2.从前向后依次比较相邻两元素,若前一个大于后一个,则交换两元素,直到right位置停止;若此时不发生元素交换,则算法过程结束。3.循环执行2过程,直到right<2 或不在发生元素交换。righ...
2019-03-04 21:46:20 719
原创 排序算法--插入排序
算法原理如数组: [18, 2, 15, 9, 3, 19, 14, 7] ,从index=0开始,拿出18,认为[18]排序排好了。然后拿index=1,得到[18,2],此时找2应当插入的位置,从右向左排依次排搜索,得到[2,18]。然后拿index=2,得到[2,18,15],从右开始排序,18和15比,18>15,18和15互换位置,得到[2,15,18]。然后拿到inde...
2019-03-04 20:53:03 204
原创 决策树-处理连续值(5)
一.决策树根据属性进行一步步判断,连续值存在无限可能,故为了能够处理连续值,需要将连续值转化为离散值二.连续属性离散化技术:二分法(最简单)三.二分法做法:将连续值划分为 >t,<t,两类遍历属性所有值,按从小到大排序 则Ta={(ai+ai+1)/2 | 0<i<n } 遍历Ta,考察划分点,这里采用信息增益的方式, 选取信息增益最大的划分点 a...
2019-02-04 23:59:27 614
原创 决策树-后剪枝(4)
1.目的:提高泛化性能,2.后剪枝做法:先生成完整的决策树 由最底层结点开始考察,若把其替换成叶节点(取样例数最多的一类),比较验证集精度,如果精度提升,则将其替换为叶节点(剪枝);否则不进行剪枝; 参考书籍:机器学习-周志华...
2019-02-04 23:52:01 444
原创 决策树预剪枝(3)
1.预剪枝的目的:提升决策树的泛化性能 2.预剪枝的做法:将数据划分为训练集和验证集在划分每个节点之前进行评估,若当前节点的划分不能提升泛化性能,则停止划分,并将其标记为叶节点; 若当前节点的划分能够提升泛化性能(从信息增益 or 其他方式 选择最优属性),则继续划分; 3.如何判断泛化性能是否提升:用留出法(机器学习-性能评...
2019-02-04 23:47:12 1023
原创 决策树sklearn实现(2)
上一篇文章已经讲了决策树的原理:模拟 人决策过程,按因素影响程度 从大到小,依次决策,得出最终结论。也讲了如何判断因素的影响程度的一种方法:信息增益越大,影响程度越大。也大致讲了递归构建决策树的过程,今天我们来使用sklearn实现决策树。我不建议重复造轮子,除非当前轮子无法满足需求。sklearn实现决策树的核心代码就3句:1.声明决策树模型model=tree.DecisionTr...
2019-02-04 23:30:26 1151
原创 决策树思维方式及实现过程(1)
1.决策树是模拟 人决策过程,按因素影响程度 从大到小,依次决策,得出最终结论。如下图:为分类一封邮件是否为垃圾邮件 2.如何评判因素的影响程度a.评判影响程度的一种方法是 信息增益,信息增益越大,表示该因素的影响程度越高,用该因素决策,越容易到达结论(只剩下单一可能类别)b.信息的定义:如果待分类的事物可能划分在多个分类之中,则符号xi的信息定义为:c.熵:信息的...
2019-02-03 11:02:17 875
原创 每天学点算法->进化策略->遗传算法简单例子解读
假设草原上有一群斑马,这群斑马里面,有些斑马跑的比较快,有的跑的慢,而狮子每次捕猎能抓到跑的慢的斑马,那么经过一代代的繁衍,根据达尔文进化论,留下的大部分斑马都是跑的比较快的。进化策略也是基于这优胜略汰,适者生存的套路,通过模拟一个种群的进化过程,逐步优化参数,最终使得目标函数达到最优.在这个例子中目标函数:max=sin(10*x)*x + cos(2*x)*x ; x属于[0,5]...
2018-10-12 00:34:21 747
原创 每天学点算法->强化学习->Q_learning走迷宫
今天给大家分享如何用Q_learning算法来实现走迷宫,我们的红色方块会一次次的尝试不同的格子,直到落入黑格子,获得惩罚*1;或者走进黄格子,获得奖励*1为止。每一次游戏都会更新Q_table的权重,以实现红色方块下一次能够更加快速的找到黄格子。本文参照了莫烦python的博客:https://morvanzhou.github.io/tutorials/machine-learning...
2018-10-08 23:34:26 3064 5
原创 每天学点算法->强化学习->Q_learning
本文将按照以下顺序进行内容安排: 一.Q_learning 简单示例 二.示例的逻辑思路和代码 三.Q_learning应用拓展 第一部分:Q_learning 简单示例——寻找目标T表示目标位置o表示人物位置人物随机出生在一个地点,人物不知道T的位置,但每次可以向左或向右走一步,走到T位置则完成任务。 第二部分:简单示例的逻辑代...
2018-10-08 00:21:16 381
原创 算法思维-Demo3 树的实现
树的实现特定的树结构会使得他们更加容易实现 其中最容易实现的就是根的树结构了,这种树的每条边都统根出发,并向下延伸。此类结构所代表的往往是某个数据集拥有所有的层次结构,其根节点代表着全部对象(这些对象获取就被直接包含在叶节点内)而其内部各节点所代表的对象都是以该节点为跟的树结构的叶节点。在这里我们甚至可以直接利用类似直觉,将各个子树组织成一个子树列表 T=[ ["a","b"...
2018-07-29 19:10:41 504
原创 算法-图的几种表示方法
表示如下的一个图有哪些方法呢,import numpy as np1.邻接矩阵图的一种常见的表示方法就是邻接矩阵了,这种表示的主要不同之处在于,它不在列出每个节点的所有邻居节点,而是会将每个节点的可能的邻居位置排成一排 也就是一个数组,用于对应图的每一个节点,然后用某种值,如True或false来表示相关节点是否是当前节点的邻居。其最简单的形式也可用嵌套list来实现。a,...
2018-07-28 18:23:00 4375
原创 Android使用Recycler View实现瀑布流效果
下图是淘宝上瀑布流的一个应用场景,今天我们就来用Recycler View实现以下瀑布流效果一:创建Activityactivity中 核心代码为mRvPu.setLayoutManager(new StaggeredGridLayoutManager(2,StaggeredGridLayoutManager.VERTICAL));该行代码使用layoutmanager实现一...
2018-07-24 23:22:12 15565 3
原创 Android使用RecyclerView实现列表功能
在Android中,列表是使用最多最广的功能之一,而RecyclerView是Android中最灵活的列表控件之一,在企业开发中广泛运用,本章我们使用RecyclerView实现如下图的列表功能。 一.与ListView类似,RecyclerView需要有容纳其布局的layout,以及展示layout的activity1.activity_...
2018-07-22 21:52:34 7177 1
转载 Tensorflow学习笔记——Summary用法
最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。其中tensorboard 作为一款可视化神器,可以说是学习tensorflow时模型训练以及参数可视化的法宝。而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在tensorboard显示。tf.summary有诸多函数:1、tf.summ...
2018-07-10 22:32:34 377
原创 神经网络-实现学习率随迭代次数变化
1.需要变化的学习率的原因:经历一段时间的学习之后,我们距离目标值越来越近,此时如果学习率太大,则会造成训练在最优值附近来回波动,这时候我们就需要减少学习率2.实现:学习率是在Optimizer中使用,我们每次迭代通过tf.assign修改学习率3.note: tf.assign(ref, value, validate_shape=None, use_locking=None, name=...
2018-07-09 22:08:27 6088
转载 为什么有的机器学习应用公司必将失败?
作者 | Cassie Kozyrkov编译 | Leo出品 | 人工智能头条告诉大家一个秘密:当人们说起“ 机器学习 ”时,听起来好像只是在谈论一门学科,但其实是两门。如果企业不了解其中的差异,那么就可能招惹来满世界的麻烦。▌两个关于机器学习的故事在机器学习方面,企业经常犯的错误类似于:请一位厨师来制造烤箱或请一位电气工程师去烘烤面包。假设你是一家面包店的店主,你需要聘请的是一位经验丰富的面包师...
2018-07-08 19:29:04 229
原创 神经网络使用drop_out消除过拟合+MNIST
1.drop_out的原理为:通过将某神经元的输出设置为0,达到使其失活的效果,消除网络中过分依赖某个神经元2.过拟合一般出现在网络过分复杂,且训练数据较少的情况,数据较少而未知参数太多,则较易产生过拟合3.核心代码:layer1=tf.nn.dropout(layer1,drop_out)#3-3 MNIst数据集使用drop-out提升准确率,消除部分过拟合import tensorflow ...
2018-07-08 19:25:49 4734 1
原创 神经网络HelloWorld
神经网络界 的 HelloWorld代码,了解神经网络过程1.输入2.通过参数拟合曲线,Helloworld中使用 y=∑ax+b,3.训练,反向传播,修改a,b的值修正拟合曲线#3-2 MNIst数据集分类简单版本import tensorflow as tf;import numpy as np;from tensorflow.examples.tutorials.mnist import i...
2018-07-08 19:18:44 525
原创 tensorflow入门,完成1元1次方程拟合
tensorflow入门,完成1元1次方程拟合该一元一次方程为:x_data = np.float32(np.random.rand(2, 100)) # 随机输入y_data = np.dot([0.100, 0.200], x_data) + 0.300由于是x_data是随机数,故而无法画出图形,若我们定义x为等差数列[[0,1,2,...100],[101...200]]则y=ax+b为分...
2018-06-30 10:37:13 897
原创 TensorFlow实现基础CNN,两层卷积+2层全连接网络demo
TensorFlow实现基础CNN,两层卷积+2层全连接网络demo,代码如下,注释都有import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#加载数据集mnist=input_data.read_data_sets('MNIST_data',one_hot=True)#每个批次的大小bat...
2018-06-27 23:59:47 4542
原创 Python正则表达式制作简单爬虫,爬取知乎主题/关注度/url
import requestsimport re#---------------------#作者:qyqin#时间:20170617#内容:简单爬虫爬取知乎首页主题/关注度/超链接#---------------------#设置请求头headers={ 'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.3...
2018-06-17 22:18:32 508
原创 解决ubuntu17安装anaconda并解决conda :找不到命令
1)首先安装anaconda部分:1.在anaconda官网下载linux安装包2.在下载目录打开终端 键入:$bash Anaconda**.sh**表示完成的anaconda安装包filename3.一路yes4.最后会提示你是否下载vscode,这个看个人心意-----------------------------------------------------------------...
2018-03-28 22:02:33 2532 1
原创 通过U盘实现硬盘安装kali 2018.1
#-----------------------------------------------#modify by qyqin#20180327#硬盘安装kali2018.1#-----------------------------------------------硬盘安装kali 2018.1的时候遇到深坑:“无法挂载光盘镜像”,最终发现只有用win32DiskImager烧录安装过程才能...
2018-03-27 23:48:56 4521
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人