自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 Spark机器学习(Chapter 04)推荐系统

代码:#coding:utf-8from pyspark import SparkContextsc = SparkContext("local[4]", "MovieLens Spark App")rawData=sc.textFile("../02/ml-100k/u.data")print rawData.first()rawRating=rawData.map(lambda

2017-06-26 22:42:19 698

转载 spark机器学习(Chapter 03)--使用spark-python进行数据预处理和特征提取

1、首先需要准备MovieLens数据集,并查看数据基本情况数据主要包含3个数据集:u.data,是用户对电影的评分数据,u.item是电影的基本数据,u.user是用户的基本数据。2、数据分析及可视化表示2.1用户数据分析及可视化对用户数据进行基本统计如下:#coding:utf-8from pyspark import SparkContextsc = SparkCo

2017-06-24 23:03:03 3236 1

原创 spark机器学习(Chapter 01)

代码:#coding:utf-8from pyspark import SparkContextsc=SparkContext("local[2]","First Spark App");#将csv格式数据映射到record数组中,record[0],record[1],record[2]data=sc.textFile("data/UserPurchaseHistory.csv"

2017-06-23 20:14:04 340

转载 spark常用函数:transformation和action

1、RDD提供了两种类型的操作:transformation和action所有的transformation都是采用的懒策略,如果只是将transformation提交是不会执行计算的,计算只有在action被提交的时候才被触发。1)transformation操作:得到一个新的RDD,比如从数据源生成一个新的RDD,从RDD生成一个新的RDDmap(func):对调用map的RDD数

2017-06-23 20:09:13 773

原创 最长子序列问题

1、最长递增子序列问题(可以不连续)a) .使用动态规划,时间复杂度为O(n*n)解法:public int lengthOfLIS(int[] nums) { if(nums.length==0) return 0; int[] dp=new int[nums.length]; for(int i=0;i<nums.length;i++)

2017-06-14 11:15:41 324

原创 最长子序列回文问题,Longest Palindromic Subsequence

Given a string s, find the longest palindromic subsequence's length in s. You may assume that the maximum length of s is 1000.Example 1:Input: "bbbab"Output:4One possible longest palin

2017-06-03 16:01:23 342

spark机器学习第三章数据集(MovieLens)

spark机器学习数据集MovieLens。

2017-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除