- 博客(6)
- 资源 (7)
- 收藏
- 关注
原创 初识机器学习-理论篇
机器学习就是利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。与传统的数据分析相比,区别如下: - 传统数据分析的主体是人,依靠人的经验和知识水平;机器学习的主体是机器,抛弃对人的依赖。 - 机器学习数据量越大,找出的规律越精准。 - 从数据中找规律转换成数学规律和数学公式。 - 解决业务问题不同,数据分析,报告历史上发生的事情。机器学习,通过历史上发生的事情,来预测未来的事情。
2017-08-14 16:17:12 1445 3
原创 神经网络-感知器算法python代码实现
在上一篇我们介绍了神经网络感知器算法,现在我们用python代码实现感知器算法。# -*- coding: utf-8 -*-import numpy as npclass Perceptron(object): """ eta:学习率 n_iter:权重向量的训练次数 w_:神经分叉权重向量 errors_:用于记录神经元判断出错次数 """
2017-08-09 16:05:10 4282
原创 神经网络入门-感知器算法
w是每个神经元的权重,x是每个神经元的输入信号,进行矩阵点乘运算得到神经元的输入和,这个时候需要一个阈值来进行判断输出是1还是0。 当求和得到的z小于等于阈值的时候,输出为0,反之为1。感知器算法权重和阈值的训练其中,最困难的部分就是确定权重(w)和阈值(b)。目前为止,这两个值都是主观给出的,但现实中很难估计它们的值,必需有一种方法,可以找出答案。 这种方法就是试错法。
2017-08-08 19:33:48 2176
原创 Pyhton数据挖掘-电力窃漏电用户的自动识别
概述本来主要是对博主在Python数据分析与挖掘实战的上第六章实践过程中所出现问题的总结,看本文的之前最好是看过这本书的第六章。问题一:采用anaconda环境下安装tensorFlow后,pycharm识别不了TensorFlow。情况是这样的,博主在首先安装好tensorFlow后,再安装keras成功后,pycharm识别不了TensorFlow。 然后设置python解析器路径,如图:
2017-08-06 13:42:10 4304 14
原创 用餐饮客户消费数据进行K-Means算法实战
概念对于连续属性,要先进行零-均值规范,在进行距离的计算。在K-Means算法中,一般需要度量样本间的距离,样本与簇之间的距离以及簇与簇之间的距离 数据现在有部分餐饮客户的消费数据见表方法R表示最近一次消费时间间隔,F表示消费频率,M表示消费总金额。 采用K-Means聚类算法,设定聚类个数为3,最大迭代次数为3,距离函数只能采用欧式距离代码与解释# -*- coding: utf-8 -*-
2017-08-01 16:10:39 11342 9
原创 聚类分析初识
实例举两个实际列子: 1. 如何通过对餐饮客户消费行为的测量,进一步评判餐饮客户的价值和对餐饮客户进行细分,找到有价值的客户群和需要关注的客户群 2. 如何合理对菜品进行分析,以便区分哪些菜品畅销毛利又高,哪些菜品滞销毛利又低。 聚类分析定义聚类分析是在没有给定划分类别的情况下,根据相似度进行样本分组的一种方法。是一种非监督的学习算法,划分的原则是组内距离最小化而
2017-08-01 12:49:09 937
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人