- 博客(8)
- 资源 (5)
- 收藏
- 关注
转载 机器学习各个算法6--决策树
计算香农熵相关函数from math import logimport operatordef createDataSet(): dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'],
2018-01-31 13:14:42 1112
转载 机器学习各个算法5---KNN
实施kNN算法相关函数from numpy import *import operator #本模块主要包括一些Python内部操作符对应的函数import matplotlibimport matplotlib.pyplot as pltfrom os import listdir# import py_compile# py_compile.compile('MLIAk
2018-01-30 18:47:55 317
转载 机器学习各个算法3--SVM
简化版本的SMO相关函数from numpy import *from time import sleepdef loadDataSet(fileName): #得到类标签和数据矩阵 dataMat = []; labelMat = [] fr = open(fileName) for line in fr.readlines(): l
2018-01-30 10:34:11 385
转载 机器学习各个算法---1.线性回归
1.最原始的linear regression标准回归函数和文本数据导入函数from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t'
2018-01-25 20:01:51 614
转载 基于Spark推荐系统设计与实现阅读1
1.技术:推荐系统、搜索引擎、信息分类-------解决信息过载不同于搜索引擎,推荐系统通过分析用户、物品和上下文等信息主动向用户进行推荐。推荐引擎通过对用户本身兴趣的研究,将一些用户不会感兴趣的内容过滤掉,只提供他们可能会喜欢的信息,从而大大缩减了用户选择的信息范围。推荐系统的作用决定了它往往需要处理海量数据。-------大数据带来的挑战:推荐系统在系统架构、推荐算法等方面的挑战。
2018-01-16 16:38:10 1517
转载 基于Spark的推荐系统设计及实现阅读2
大数据处理领域的框架有很多。从计算的角度看,主要有MapReduce框架(属于Hadoop)生态系统和Spark框架【计算效率优秀。从存储角度来看,主要还是用Hadoop生态环境中的HDFS框架。Spark分布式计算框架:基于内存的集群计算系统。解决MapReduce磁盘读写的开销问题。吸引很多数据研究人员。逐渐形成了自己的生态系统:以Spark为基础,上层包括Spark SQL,MLib
2018-01-16 16:23:37 1438
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人