自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 机器学习实战-逻辑回归

首先是较为简单的梯度上升算法的回归函数具体原理啥的不介绍了直接看代码:刚开始是导入数据集的操作总的来说很简单输出的结果为:下一个函数是sigmoid函数,这个函数很好写最后一个函数就是gradAscent函数这个函数我错了很多次首先看几个函数首先是mat函数,功能大概就是将一个输入转换成矩阵类型只有转换成矩阵类型后,才可以使用相应的函数p...

2018-07-28 12:41:40 326

原创 机器学习实战-朴素贝叶斯

根据自己的理解,把书上的代码都遍历了一遍又自己写了一遍,发现了一些错误,现在贴上来这个写的第一个函数,要注意append和extend的用法的区别在这里,因为item仅仅是一个值,一个元素,所以只能用append,不能用extend具体二者的区别看python文档这个函数没啥大的问题,但是要注意line列表的建立方式,我之前一直都没这么用过还有index这个内建函数...

2018-07-27 15:13:37 331

原创 机器学习实战-决策树

决策树的第一个算法为,计算给定数据集的香农熵香农熵的计算公式都给出来了,下面贴一下代码还是比较好懂的,就是先创建一个字典,在字典里面对每个类别新建一个键值对,值为每个类别的样本个数之后分别计算概率啊什么的输出如下跟书上的答案是一样的我个人有一点点的疑问是对字典类型的自建函数下面看看python文档dict.keys()             返回一个包...

2018-07-26 13:38:54 250

原创 k-近邻算法--使用k-近邻算法识别手写数字

listdir函数:os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。返回指定路径下的文件和文件夹列表。python文档:listdir(path=None)    Return a list containing the names of the files in the directory.        path can be specifi...

2018-07-25 16:07:43 762

原创 python文本处理的函数总结

就刚刚写的程序中,用到了map、strip和split函数下面对这几个函数重新认识一下:strip函数:这个函数是字符串的方法help(str.strip)之后返回:strip(...)    S.strip([chars]) -> str        Return a copy of the string S with leading and trailing...

2018-07-25 13:18:27 7025

原创 python处理文本文件

初始的数据集一般存放在txt文件,如何将其从文本文件中提取出来进行处理。下面就刚学的一种方法,进行试探性总结:这里我用下面的一个txt文件为例:上图这个文本文件中一共有20行数据,每行数据有四列,前三列为属性列,最后一列为类别标签。我想将这个文件最终划分为两个列表,一个是样本列表,只包含前三列数据,另一个是标签列表,只包含最后一列数据首先看一看readline这个函数的用法:...

2018-07-25 12:48:34 6432

原创 机器学习实战——使用k近邻算法改进约会网站的配对效果

整个示例总的来说没什么难度,就是先将文本文件进行解析,将文本文件中的数据分割成数据集和标签集函数如下:将文本文件解析完成后,我们需要考虑一个问题,就是如果就直接拿这个数据集去训练,由于各个属性的值不一致,数量级差别比较大,而我们又是根据距离的大小来判断类别的这样自然造成数量级比较大的属性的在最后的结果中影响较大,这不是我们所希望的结果,故我们需要将整个训练集进行归一化之后,再进...

2018-07-24 13:55:57 287

原创 机器学习实战——k-近邻算法概述

k近邻算法是最基础的分类算法,它的原理很简单,就是拿当前的测试样本与训练样本集中的所有样本进行比较,采用欧式距离进行比较。然后按照距离大小进行排序,从小到大排。然后在根据k的数值,选取前k个训练样本的分类结果进行统计,统计结果中出现的类别次数最多的类别,即为测试样本的类别。下面把书上的代码贴出来,解释每一句:注意:这里的dataSet类型为array,为什么后面会讲下面是cla...

2018-07-24 12:47:27 218

原创 array的用法

array(...)    array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0)        Create an array.        Parameters    ----------    object : array_like        An array, any object e...

2018-07-24 11:55:47 884

原创 argsort的用法

argsort(a, axis=-1, kind='quicksort', order=None)    Returns the indices that would sort an array.        Perform an indirect sort along the given axis using the algorithm specified    by the `kin...

2018-07-24 11:54:28 2136

原创 sum的用法(numpy)

sum(a, axis=None, dtype=None, out=None, keepdims=<class 'numpy._globals._NoValue'>)    Sum of array elements over a given axis.        Parameters    ----------    a : array_like        Ele...

2018-07-24 11:50:00 471

原创 tile的用法

tile函数在numpy库中python文档如下:tile(A, reps)    Construct an array by repeating A the number of times given by reps.通过由reps给出的参数,重复A相应的次数,构造一个新的数组        If `reps` has length ``d``, the result will...

2018-07-24 11:44:55 1845 1

原创 shape的用法

shape函数是numpy.core.fromnumeric中的函数,它的功能是查看矩阵或者数组的维数。下面是python中的文档:shape(a)Return the shape of an array. Parameters----------a : array_like    Input array. Returns-------shape : tuple of...

2018-07-24 11:35:29 867

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除