自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

路越的专栏

生活,除了眼前的苟且,还可以有诗和远方

  • 博客(9)
  • 资源 (7)
  • 收藏
  • 关注

原创 Spark系列:Spark学习笔记

Spark阅读官方文档 Spark Quick Start Spark Programming Guide Spark SQL, DataFrames and Datasets Guide Cluster Mode Overview Spark Standalone Mode重要的概念:resilient distributed dataset (RDD), a collection

2016-07-15 15:51:33 3295

原创 推荐系统系列:商品关联分析

商品关联分析关联 relevance: 主要用在互联网的内容和文档上,比如搜索引擎算法文档中之间的关联性。association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。 比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%。置信度(Confidence):在数据集中已经出现A时,B

2016-07-15 15:47:45 14116

原创 python 读文件 写文件 字符串操作 LIBSVM格式数据转换

利用python脚本将数据转换成符合LIBSVM格式的数据#coding=utf-8from sys import argvscript, input, output = argvtxt = open(input,'r')svm_data = open(output,'w')for line in txt.readlines(): features = line.split(',')

2016-07-13 15:14:04 5446

原创 商品关联分析

商品关联分析关联 relevance: 主要用在互联网的内容和文档上,比如搜索引擎算法文档中之间的关联性。association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。 比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%。置信度(Confidence):在数据集中已经出现A时,B

2016-07-12 17:21:45 7445

原创 Hadoop单节点

Hadoop: Setting up a Single Node Cluster[first time] install ssh, rsync注意: 修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh中的JAVA_HOME。这一步很重要,然后启动时会报错。 Unpack the downloaded Hadoop distribution. In the distr

2016-07-15 15:45:30 370

原创 Scala学习笔记

Scala语法函数式,面向对象,JVM val常量 var变量 函数是一等公民 函数可以作为参数传递 表达式没有返回值时,默认返回Unit Unit类型?对应于没有值 借贷模式 按名称传递与按值传递参数 def log(msg: String)vsdef log(msg:=>String) 按名称传递参数可以减少不必要的计算和异常 柯里化(Currying)? def add

2016-07-15 15:43:56 301

原创 Hadoop常用命令及常见问题

Hadoopwinutils.exe in the hadoop binaries Apache 官方发行版的Hadoop的bin目录下没有winutils.exe文件。解决方法:自己在Windows平台上编译或者下载网上别人编译好的Hadoop 2.6.0 Windows 64-bit BinariesHadoop移植到Windows需要做的改变 How To Install Hadoop o

2016-07-15 15:42:05 618

原创 python 文件操作

逐行读取文本文件#coding=utf-8from sys import argvscript, filename = argvtxt = open(filename)for line in txt.readlines(): print line

2016-07-13 14:45:54 365

原创 概率语言模型

LSA(隐性语义分析,Latent Semantic Anaiysis)LSA(隐性语义分析)的目的是要从文本中发现隐含的语义维度-即“Topic”或者“Concept”。 VSM将各关键词之间假设为线性无关的这个前提造成VSM模型无法进行语义相关的判断,没有能力处理更复杂的一词多义、一义多词问题。而潜在语义分析(Latent Semantic Anaiysis,LSA)是一种用于自动地实现知识提

2016-07-12 17:14:19 3947

The Little SAS Book-5th edition

学习SAS的必读书籍!!! 学习SAS的必读书籍!!! 学习SAS的必读书籍!!! 学习SAS的必读书籍!!!

2018-06-08

Maven 实战

关于 Maven 最好的书籍。Java 开发者必读。

2016-12-15

数学建模算法全收录799页

数学建模的经典模型算法,带matlab代码,参加数学建模的童鞋必看的一本书

2015-01-30

2015年美国大学生数学建模竞赛MCM_ICM参赛帮助中文翻译

2015年美国大学生数学建模竞赛MCM_ICM参赛帮助中文翻译,参加美赛的童鞋快下吧!

2015-01-30

即时通讯软件源代码用于学习

C的即时通讯软件的源代码,用来学习即时通讯的开发很有用

2014-05-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除