自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

何瑞龙的专栏

国软排球

  • 博客(55)
  • 资源 (1)
  • 收藏
  • 关注

原创 c++ vector

vectorpushback()  //添加元素到尾部size()  pop_back()  //删除最后一个元素并返回该元素clear()  //清空vectorempty()  //检查vector是否为空iteratorvector::iterator iter;vector::const_iterator iter2;for (i

2015-07-21 23:33:51 426

原创 工作报告11/10

本周主要工作内容1.mahout随机森林的程序运行2.ALS算法在集群上f

2014-11-14 13:52:57 541

原创 工作报告11/03

11/031.研究院集群

2014-11-10 13:51:31 575

转载 java 多线程笔记

进程(Process)是最初定义在Unix等多用户、多任务操作系统环境下用于表示应用程序在内存环境中基本执行单元的概念。

2014-10-29 13:34:58 553

原创 工作报告10/29

10/271.ALS参数调优10/281.研究院开会,制定测试的目标,编写

2014-10-29 12:56:22 507

原创 工作报告10/21

10/211.对spark1.1的新特征搜集,编写测试代码

2014-10-27 11:39:18 456

原创 工作报告10/13

10/131.10/141.10/15

2014-10-16 09:20:13 454

转载 矩阵求导

基本公式:Y = A * X --> DY/DX = A'Y = X * A --> DY/DX = AY = A' * X * B --> DY/DX = A * B'Y = A' * X' * B --> DY/DX = B * A' 1. 矩阵Y对标量x求导: 相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了 Y = [y(ij)] --> dY/

2014-10-10 09:59:44 538

原创 工作报告0928

09/281.制作三个ALS文档()

2014-09-30 11:28:53 573

原创 mahout中的LogLikelihoodSimilarity 分析

参考:

2014-09-25 12:46:51 2722 1

原创 工作报告0922

09221.运行

2014-09-22 14:24:17 580

原创 周工作报告140915

09161.早上修改全网集中fcu

2014-09-17 09:52:34 615

原创 工作报告14/09/15

上周工作报告:1.利用

2014-09-15 09:32:11 569

翻译 矩阵分解

推荐系统的策略content filtering(内容过滤)原理用户档案:描述用户的属性(个人喜好,特征)产品档案:描述产品的特征利用用户档案与产品档案将用户与产品联系起来,求出用户对某个产品的喜爱程度collaborative filtering(协同过滤)协同过滤利用历史的记录来进行推荐优点: do

2014-08-08 15:18:50 624

原创 spark连接web界面

今天想了一下自己构想的项目

2014-07-09 17:46:58 3331 3

转载 聚类分析应用

cross selling: 让客户了解产品,并推荐客户尝试使用适合他们的新

2014-07-07 15:56:53 622

原创 聚类应用 crap

(1)数据抽取(2)数据净化

2014-07-07 15:04:44 720

原创 Spark + Flume

SparkStreaming 提供一个处理Flume流的事件,

2014-07-03 11:37:31 7093 2

原创 root无法启动virt-manager

After the first launch of virt-manager, which worked as expected, i can not launch it again. I have to launch it with the dbus-launch command.# virt-manager --no-fork --debug(same problem if i d

2014-06-24 10:35:15 1451

原创 软件学报的主题分析

下载了50篇文章cb

2014-06-24 09:44:02 710

原创 集群介绍

spark集群:  ue191(master)    ue192(worker)    ue193(worker)    ue194(wor)

2014-06-20 11:30:14 567

原创 2014/06/16-2014/06/22周工作日志

1.配置好服务器集群 ue13  ue191 ue192 ue193

2014-06-18 23:30:27 470

原创 spark 利用hdfs与本地文件系统的时间比较

hdfs: Total time: 674 s, completed 2014-6-18 12:44:48local file system: 1067s

2014-06-18 12:49:23 888

原创 spark1.0 与spark0.9

1.0 MLlib分类与回归分析线性支持向量机2.

2014-06-18 08:13:17 622

原创 创建hadoop2.2.0遇到的问题

1. incorrect configuration: namenode addres dfs.namenode.servicerpc-address or dfs.namenode.rpc

2014-06-17 17:50:56 724

原创 centos 安装kvm

1.首先检查CPU是否支持KVMegrep '(vmx|svm)' --color = always /proc/cpuinfo如果有显示红色字体,则表明cpu支持kvm

2014-06-16 11:02:17 563

原创 2014/06/09-2014/06/15周工作日志

本周工作完成情况:1.    修复服务器的硬盘失败,要拿到外面修复2.    在一个有两个工作节点(节点内存为15G)的集群运行lda算法。[success] Total time: 1197 s, completed 2014-6-13 13:23:23数据集篇1224短文组成,词汇量是10747, 单词总数为:302031 结果topic: prices marke

2014-06-16 09:39:59 747

原创 lda 优化后用的内存小了

import org.apache.spark.SparkContextimport org.apache.spark.SparkContext._import org.apache.spark.SparkConfimport org.apache.spark.rdd._import scala.io.Sourceimport scala.collection.mutable.

2014-06-13 13:01:37 1469

原创 centos VNC服务器与VNC客户端配置

服务器端1. 首先查看服务器有没有安装vncserver

2014-06-09 11:41:14 798

原创 2014/06/02-2014/06/09周工作日志

本周工作完成情况:1.    清理地铁的原始数据,包括标签不完整,与标签内容不对的情况,共有大概50个文件有这些情况。2.    学习linux系统的管理,包括磁盘管理,DNS服务器的配置,KVM虚拟系统的配置,网络管理, VNC服务器的配置3.    在服务器上安装了centos 6.5 系统

2014-06-09 09:29:47 487

转载 vmware 桥接网络

bridged(桥接模式)是一种网络连接模式,也是VMware的一种工作模式。bridge 就是“桥”的意思,说起桥接,就不能不说局域网。比如我们有两个局域网络,他们的ip段都处于192.168.0.*,同时,我们希望把这两个网络链接起来,这中情况下,我们就可以采用桥接。这个时候,“桥”就是一个主机,这个机器拥有两块网卡,分别处于两个局域网中,同时在“桥”上,运行着程序,让局域网A中的所有数据

2014-06-08 15:47:09 653

原创 centos 6.5 设置FTP服务器 与客户机连接FTP服务器

服务器端

2014-06-08 13:35:49 5146

原创 centos 6.5 DNS服务器配置

DNS 资源记录1. SOA:域名系统 (DNS) 区域中的任何文件中的第一个资源记录应是起始授权机构 (SOA) 资源记录。SOA 资源记录表示该 DNS 名称服务器的 DNS 域中的数据的信息的最佳来源

2014-06-07 23:13:06 3357

原创 创建centos

1.设置网络桥接模式

2014-06-05 17:59:57 452

翻译 图像物体分类与检测算法综述

物体分类与检测的难点与挑战

2014-06-03 17:56:35 1733

原创 scala 读写文本设置字符编码

1. val lb = Source.fromFile(filePath,"GBK").getLines().toArray2. val writer = new PrintWriter(new File(filePath), "gbk")

2014-06-03 15:49:59 3747

翻译 spark 调优

1.数据序列化2.内存调优3.其它因素

2014-05-29 17:54:12 860

原创 linux常用命令

free -m  查看机器内存使用情况df -h      查看机器d

2014-05-29 10:11:39 596

原创 遇到的spark 错误

1.Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient memory

2014-05-28 18:48:05 1030

原创 在程序中设置spark applicaton的属性

设置spark application 属性    val environmentV = Map[String, String]()     environmentV += ("spark.cores.max"->"1")     environmentV += ("spark.executor.memory"-> "2g")    val conf = new SparkConf

2014-05-28 16:16:56 765

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除