Soul Joy Hub

但行好事,莫问前程。

站在路口的思考

工作一份不算低的薪资。 深度:经验能使得你有一技之长,成为某方面的专家。 广度:紧跟技术潮流,不断学习,不被淘汰。 跳槽,涨薪 第二份经济来源投资理财 小本创业 家教兼职 尽可能的是只赢不亏的,可以不稳定,但是要向成型的方向发展 爱好与梦想尽可能的将爱好(除了编码外) 转化为可以盈利(但不是目的)...

2016-06-30 14:16:49

阅读数 733

评论数 0

【Spark Mllib】性能评估 ——MSE/RMSE与MAPK/MAP

推荐模型评估MSE/RMSE均方差(MSE),就是对各个实际存在评分的项,pow(预测评分-实际评分,2)的值进行累加,在除以项数。而均方根差(RMSE)就是MSE开根号。我们先用ratings生成(user,product)RDD,作为model.predict()的参数,从而生成以(user,...

2016-06-30 11:14:04

阅读数 3973

评论数 0

深入理解Spark ML:基于ALS矩阵分解的协同过滤算法与源码分析

http://blog.csdn.net/u011239443/article/details/51752904 1. 引言 随着互联网的迅猛发展,为了满足人们在繁多的信息中获取自己需要内容的需求,个性化推荐应用而生。协同过滤推荐是其中运用最为成功的技术之一。其中,基于用户的最近邻法根据相...

2016-06-26 13:40:00

阅读数 21617

评论数 6

一篇漫画让你理解 Hadoop HDFS 读写工作原理

一篇漫画让你了解Hadoop HDFS!

2016-06-24 11:41:30

阅读数 2472

评论数 1

【Spark Mllib】TF-IDF&Word2Vec——文本相似度

http://blog.csdn.net/u011239443/article/details/51728659 1 从数据中抽取合适的特征 1.1 TF-IDF短语加权表示 TF-IDF公式的含义是:在一个文档中出现次数很多的词相比出现次数少的词应该在词向量表示中得到更高的权...

2016-06-21 16:59:02

阅读数 19170

评论数 0

文本搜索(C实现)

#include <stdio.h> #include <string.h> using namespace std;struct cha { char aa[50];//存储单词(不重复) int num;//该单词出现的次数 int Mark...

2016-06-20 11:55:29

阅读数 1508

评论数 0

【Spark Mllib】K-均值聚类——电影类型

http://blog.csdn.net/u011239443/article/details/51707802K-均值聚类 K-均值算法试图将一系列样本分割成K个不同的类簇(其中K是模型的输入参数),其形式化的目标函数称为类簇内的方差和(within cluster sum of squar...

2016-06-18 23:29:26

阅读数 5181

评论数 0

【Spark Mllib】分类模型——各分类模型使用

数据集: 线性模型

2016-06-16 13:37:30

阅读数 3736

评论数 0

Impala的分布式查询

翻译自《Getting Started with Impala》   分布式查询   分布式查询是impala的核心。曾几何时,你需要研究并行计算,才能开始进行深奥而晦涩的操作。现在,有运行在Hadoop上面的Impala,你只需要...一台笔记本电脑。理想情况下,一个IT部门也会有运行着Clou...

2016-06-13 10:06:01

阅读数 776

评论数 0

轻量级文本搜索引擎的后台设计、实现与优化

转载请注明:转载 from http://blog.csdn.net/u011239443/article/details/51655480主框架图见:http://r.photo.store.qq.com/psb?/V12VvuOZ2vxbmG/M2gzPWfnBLS8buBT*16Y2xm9Q...

2016-06-13 10:05:56

阅读数 4204

评论数 0

1 producer — n consumers 模型 实现

1 #include 2 #includestring.h> 3 #include 4 #include 5 #include 6 #include 7 using namespace std; 8 #define LEN 128 9 typedef stru...

2016-06-13 10:05:48

阅读数 417

评论数 0

【Spark Mllib】逻辑回归——垃圾邮件分类器与maven构建独立项目

使用SGD算法逻辑回归的垃圾邮件分类器 1 package com.oreilly.learningsparkexamples.scala 2 3 import org.apache.spark.{SparkConf, SparkContext} 4 import org.apach...

2016-06-13 10:05:34

阅读数 3400

评论数 0

域名转化到IP地址的实现

在linux中,有一些函数可以实现主机名和地址的转化,最常见的有gethostbyname()、gethostbyaddr()等,它们都可以实现IPv4和IPv6的地址和主机名之间的转化。其中gethostbyname()是将主机名转化为IP地址,gethostbyaddr()则是逆操作,是将IP...

2016-06-13 10:01:04

阅读数 1117

评论数 0

特定用户QQ群聊天记录导出的实现

一、把QQ群的聊天记录txt格式导出 消息管理器 -> 选择要导出的群 -> 右击、导出   这里要注意 : 导出之后的 文本是 unicode 编码的,需要转换 ==|| 之前不知道,搞了大半天。 重新建一个txt , 把原来的 txt 内容 复制 到 新的 txt ,保存就行了。 ...

2016-06-13 10:01:00

阅读数 2095

评论数 0

STL中mem_fun和mem_fun_ref的用法及区别

原文:http://www.cppblog.com/mysileng/archive/2012/12/25/196615.html 引子: 怎么对容器中的所有对象都进行同一个操作?我们可能首先想到的是用循环来实现。比如有如下的一个类: class ClxECS{public:    int DoS...

2016-06-13 10:00:55

阅读数 489

评论数 0

《世界杯彩票竞猜系统》设计报告

目录 1 文档介绍    4 1.1 文档目的    4 1.2 文档范围    4 1.3 读者对象    4 1.4 参考文献    5 1.5 术语与缩写解释    5 2 系统环境说明    6 3 需求分析    7 3.1 功能需求分析    7 3.2 非功能需求分析    7 4...

2016-06-13 10:00:46

阅读数 2442

评论数 0

clients(PV操作共享内核内存进行输入输出分屏) - server(进程间通信)模型实现

1、拓扑结构       2、PV操作共享内核内存进行输入输出分屏 (1) 1 int semop(int semid,struct sembuf *sops,size_t nsops); 功能描述 操作一个或一组信号。     semid: 信号集的识别码,可通过semget获取。  ...

2016-06-13 10:00:20

阅读数 460

评论数 0

父子进程间通信模型实现(popen)

0、FILE *popen(const char *command, const char *type); popen 函数相当于做了以下几件事: 1、创建一个无名管道文件 2、 fork() 3、在子进程里, exec command 4、 在子进程里, 若 type == “r” ,  相当于...

2016-06-13 10:00:15

阅读数 713

评论数 0

1 server - n clients 模型实现(select)

拓扑结构:   各个客户端创建读写管道,通过“上下线信息管道”向服务器发送上下线信息和读写管道名称。服务器接受信息,修改链表(存储客户端信息)。客户端、服务器打开读写管道,服务器通过“W”管道接收从客户端发来的信息,在根据链表同个其他各个“R”管道向其他客户端发送信息。   具体流程: 1、建立...

2016-06-13 10:00:11

阅读数 336

评论数 0

人为什么而活?

人,无论如何首先都要立足于使自己活着。客观上,人们也都是竭尽全力地想要使自己不仅活着而且活得更好、更有意义和价值。那么在活着的前提下,区分人生境界、人生价值和意义的不同层面的标准有哪些呢?            1、为基本的生存而活     这类人要么由于极端的愚昧和无能,要么由于自身处在极端的环...

2016-06-13 09:58:50

阅读数 1192

评论数 0

提示
确定要删除当前文章?
取消 删除