2018年01月_qq_28088259

09月 07月 06月 04月 02月 01月

转载机器学习各个算法6--决策树

计算香农熵相关函数from math import logimport operatordef createDataSet(): dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'],

2018-01-31 13:14:42 1112

转载机器学习各个算法5---KNN

实施kNN算法相关函数from numpy import *import operator #本模块主要包括一些Python内部操作符对应的函数import matplotlibimport matplotlib.pyplot as pltfrom os import listdir# import py_compile# py_compile.compile('MLIAk

2018-01-30 18:47:55 317

转载机器学习各个算法3--SVM

简化版本的SMO相关函数from numpy import *from time import sleepdef loadDataSet(fileName): #得到类标签和数据矩阵 dataMat = []; labelMat = [] fr = open(fileName) for line in fr.readlines(): l

2018-01-30 10:34:11 385

转载机器学习各个算法2---逻辑回归

是

2018-01-29 13:54:29 319

转载机器学习各个算法---1.线性回归

1.最原始的linear regression标准回归函数和文本数据导入函数from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t'

2018-01-25 20:01:51 614

转载基于Spark推荐系统阅读3

是

2018-01-17 15:23:46 653

转载基于Spark推荐系统设计与实现阅读1

1.技术：推荐系统、搜索引擎、信息分类-------解决信息过载不同于搜索引擎，推荐系统通过分析用户、物品和上下文等信息主动向用户进行推荐。推荐引擎通过对用户本身兴趣的研究，将一些用户不会感兴趣的内容过滤掉，只提供他们可能会喜欢的信息，从而大大缩减了用户选择的信息范围。推荐系统的作用决定了它往往需要处理海量数据。-------大数据带来的挑战：推荐系统在系统架构、推荐算法等方面的挑战。

2018-01-16 16:38:10 1517

转载基于Spark的推荐系统设计及实现阅读2

大数据处理领域的框架有很多。从计算的角度看，主要有MapReduce框架（属于Hadoop）生态系统和Spark框架【计算效率优秀。从存储角度来看，主要还是用Hadoop生态环境中的HDFS框架。Spark分布式计算框架：基于内存的集群计算系统。解决MapReduce磁盘读写的开销问题。吸引很多数据研究人员。逐渐形成了自己的生态系统:以Spark为基础，上层包括Spark SQL,MLib

2018-01-16 16:23:37 1438