- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 Spark机器学习(Chapter 04)推荐系统
代码:#coding:utf-8from pyspark import SparkContextsc = SparkContext("local[4]", "MovieLens Spark App")rawData=sc.textFile("../02/ml-100k/u.data")print rawData.first()rawRating=rawData.map(lambda
2017-06-26 22:42:19 698
转载 spark机器学习(Chapter 03)--使用spark-python进行数据预处理和特征提取
1、首先需要准备MovieLens数据集,并查看数据基本情况数据主要包含3个数据集:u.data,是用户对电影的评分数据,u.item是电影的基本数据,u.user是用户的基本数据。2、数据分析及可视化表示2.1用户数据分析及可视化对用户数据进行基本统计如下:#coding:utf-8from pyspark import SparkContextsc = SparkCo
2017-06-24 23:03:03 3236 1
原创 spark机器学习(Chapter 01)
代码:#coding:utf-8from pyspark import SparkContextsc=SparkContext("local[2]","First Spark App");#将csv格式数据映射到record数组中,record[0],record[1],record[2]data=sc.textFile("data/UserPurchaseHistory.csv"
2017-06-23 20:14:04 340
转载 spark常用函数:transformation和action
1、RDD提供了两种类型的操作:transformation和action所有的transformation都是采用的懒策略,如果只是将transformation提交是不会执行计算的,计算只有在action被提交的时候才被触发。1)transformation操作:得到一个新的RDD,比如从数据源生成一个新的RDD,从RDD生成一个新的RDDmap(func):对调用map的RDD数
2017-06-23 20:09:13 773
原创 最长子序列问题
1、最长递增子序列问题(可以不连续)a) .使用动态规划,时间复杂度为O(n*n)解法:public int lengthOfLIS(int[] nums) { if(nums.length==0) return 0; int[] dp=new int[nums.length]; for(int i=0;i<nums.length;i++)
2017-06-14 11:15:41 324
原创 最长子序列回文问题,Longest Palindromic Subsequence
Given a string s, find the longest palindromic subsequence's length in s. You may assume that the maximum length of s is 1000.Example 1:Input: "bbbab"Output:4One possible longest palin
2017-06-03 16:01:23 342
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人