- 博客(55)
- 资源 (1)
- 收藏
- 关注
原创 c++ vector
vectorpushback() //添加元素到尾部size() pop_back() //删除最后一个元素并返回该元素clear() //清空vectorempty() //检查vector是否为空iteratorvector::iterator iter;vector::const_iterator iter2;for (i
2015-07-21 23:33:51 426
转载 矩阵求导
基本公式:Y = A * X --> DY/DX = A'Y = X * A --> DY/DX = AY = A' * X * B --> DY/DX = A * B'Y = A' * X' * B --> DY/DX = B * A' 1. 矩阵Y对标量x求导: 相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了 Y = [y(ij)] --> dY/
2014-10-10 09:59:44 540
翻译 矩阵分解
推荐系统的策略content filtering(内容过滤)原理用户档案:描述用户的属性(个人喜好,特征)产品档案:描述产品的特征利用用户档案与产品档案将用户与产品联系起来,求出用户对某个产品的喜爱程度collaborative filtering(协同过滤)协同过滤利用历史的记录来进行推荐优点: do
2014-08-08 15:18:50 625
原创 root无法启动virt-manager
After the first launch of virt-manager, which worked as expected, i can not launch it again. I have to launch it with the dbus-launch command.# virt-manager --no-fork --debug(same problem if i d
2014-06-24 10:35:15 1452
原创 spark 利用hdfs与本地文件系统的时间比较
hdfs: Total time: 674 s, completed 2014-6-18 12:44:48local file system: 1067s
2014-06-18 12:49:23 888
原创 创建hadoop2.2.0遇到的问题
1. incorrect configuration: namenode addres dfs.namenode.servicerpc-address or dfs.namenode.rpc
2014-06-17 17:50:56 727
原创 centos 安装kvm
1.首先检查CPU是否支持KVMegrep '(vmx|svm)' --color = always /proc/cpuinfo如果有显示红色字体,则表明cpu支持kvm
2014-06-16 11:02:17 567
原创 2014/06/09-2014/06/15周工作日志
本周工作完成情况:1. 修复服务器的硬盘失败,要拿到外面修复2. 在一个有两个工作节点(节点内存为15G)的集群运行lda算法。[success] Total time: 1197 s, completed 2014-6-13 13:23:23数据集篇1224短文组成,词汇量是10747, 单词总数为:302031 结果topic: prices marke
2014-06-16 09:39:59 750
原创 lda 优化后用的内存小了
import org.apache.spark.SparkContextimport org.apache.spark.SparkContext._import org.apache.spark.SparkConfimport org.apache.spark.rdd._import scala.io.Sourceimport scala.collection.mutable.
2014-06-13 13:01:37 1469
原创 2014/06/02-2014/06/09周工作日志
本周工作完成情况:1. 清理地铁的原始数据,包括标签不完整,与标签内容不对的情况,共有大概50个文件有这些情况。2. 学习linux系统的管理,包括磁盘管理,DNS服务器的配置,KVM虚拟系统的配置,网络管理, VNC服务器的配置3. 在服务器上安装了centos 6.5 系统
2014-06-09 09:29:47 486
转载 vmware 桥接网络
bridged(桥接模式)是一种网络连接模式,也是VMware的一种工作模式。bridge 就是“桥”的意思,说起桥接,就不能不说局域网。比如我们有两个局域网络,他们的ip段都处于192.168.0.*,同时,我们希望把这两个网络链接起来,这中情况下,我们就可以采用桥接。这个时候,“桥”就是一个主机,这个机器拥有两块网卡,分别处于两个局域网中,同时在“桥”上,运行着程序,让局域网A中的所有数据
2014-06-08 15:47:09 658
原创 centos 6.5 DNS服务器配置
DNS 资源记录1. SOA:域名系统 (DNS) 区域中的任何文件中的第一个资源记录应是起始授权机构 (SOA) 资源记录。SOA 资源记录表示该 DNS 名称服务器的 DNS 域中的数据的信息的最佳来源
2014-06-07 23:13:06 3359
原创 scala 读写文本设置字符编码
1. val lb = Source.fromFile(filePath,"GBK").getLines().toArray2. val writer = new PrintWriter(new File(filePath), "gbk")
2014-06-03 15:49:59 3751
原创 遇到的spark 错误
1.Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient memory
2014-05-28 18:48:05 1030
原创 在程序中设置spark applicaton的属性
设置spark application 属性 val environmentV = Map[String, String]() environmentV += ("spark.cores.max"->"1") environmentV += ("spark.executor.memory"-> "2g") val conf = new SparkConf
2014-05-28 16:16:56 765
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人