排序:
默认
按更新时间
按访问量

学习别跟我谈兴趣

2018-03-02大蕉一名叫大蕉的程序员一名叫大蕉的程序员一名叫大蕉的程序员WeChat IDDaBananaTalkIntro感谢订阅,我叫杨钊,也叫big banana,大家都叫我大蕉。技术探针一枚。主要分享最近关注或者将要关注的东西。万一能对您有一点点的帮助那就更好了。许岑老师说:学习别跟...

2018-03-08 08:14:38

阅读数:73

评论数:0

关于学习和复习

经常有学员问我:学习一两个月以后,就把最开始学习的东西忘记了,然后就要复习。但是每天都要学习新东西,那么晚上自习时就不知道该看当天学习的内容,还是看以前学习的内容。经常觉得在瞎忙活,什么都没有弄明白,不知道从哪里下手。我分析:一般这样的学员就是以前的基础没有打好,那么就应该从基础开始复习。复习非常...

2018-03-05 21:54:55

阅读数:72

评论数:0

Rational Rose2007无法正常启动解决方案

安装完Rational Rose发现无法正常启动,我遇到了以下两个问题,希望能帮到相同经历的同学。 问题一: 安装完Rational Rose后不能用,提示如下:无法启动此程序,因为计算机中丢失suite object.dll。尝试重新安装该程序以解决此问题。   出现这种现象主要是,安装...

2018-08-07 16:46:48

阅读数:15

评论数:0

eclipse版本和jdk对应关系

jdk最新版历史版本下载 http://www.oracle.com/technetwork/java/javase/downloads/index.html http://www.oracle.com/technetwork/java/javase/archive-139210.html ...

2018-08-03 15:09:53

阅读数:22

评论数:0

用户画像总结

       最近在工作之余,结合自己的理解和论坛上的一些帖子,整理了份用户画像的文章,个人觉得这篇文章在宏观上很好地描述了用户画像的主要内容。(文章内的图片来源于不同帖子,权当分享,侵删)一、 什么是用户画像        用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来...

2018-07-12 10:56:53

阅读数:200

评论数:0

获取当前类的一些东西(当前路径,claspath路径,类,类名)

1、获取类、类名 在类里面,this.getClass()获取当前类,类外,实例.getClass(),或者知道类名:类名.class;不知道类名就先获取类名:this.getClass().getName();Test.class.getName()2、获取当前文件–》当前文件路径,当前文件所属...

2018-07-12 09:08:14

阅读数:44

评论数:0

协同过滤算法简析

推荐系统必须有快速反应能力,众所周知,现在网络上充满着各种各样的信息,而且数量相当庞大,并且还在以相当惊人的速度增长,如何在海量的信息中快速的找到我们所需要的信息并快速的反馈给用户,是互联网推荐系统需要考虑的一个十分重要的问题。  推荐系统中最核心和关键的部分就是使用的推荐算法,其在很大程度上决定...

2018-07-10 14:31:24

阅读数:44

评论数:0

系统学习机器学习之算法评估

一、引言  分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择分类,如何评价一个分类算法的好坏,前面关于决策树的介绍,我们主要用的正确率(accuracy)来评价分类算法。  正确率确实是一个...

2018-07-10 14:26:13

阅读数:76

评论数:0

推荐算法评估方式

1.评分预测评分预测主要用来预测用户对item的评分,离线评估主要有RMSE和MAE两种评估方式,它们的计算方式如下RMSE=∑(u,i)∈T(rui−r^ui)2−−−−−−−−−−−−−−−√|T|RMSE=∑(u,i)∈T(rui−r^ui)2|T|MAE=∑(u,i)∈T|rui−r^ui...

2018-07-10 14:17:36

阅读数:69

评论数:0

基于用户的协同过滤(user-based collaborative filtering)

姓名:wagsyang 日期:星期四, 08. 十二月 2016 03:25下午简介本文是集体智慧编程一书的学习笔记。 12一个协作型过滤算法通常是对一大群人进行搜索,并从中找出与我们品味相近的一小群人。算法会对这些人所偏爱的其它内容进行考察,并将它们组合起来构造出一个经过排名的推荐列表。收集偏好...

2018-07-10 06:28:25

阅读数:50

评论数:0

基于物品的协同过滤(item-based collaborative filtering)

姓名:wagsyang 日期:星期四, 08. 十二月 2016 08:26下午简介 本书是集体智慧编程一书的学习笔记。 12之前我们已经完成了基于用户的协同过滤的推荐算法,它的思想是将所有的用户和自己对比,显然对于小数据集还是可以忍受的,但是对于大量或巨量的用户数据集,这种实时进行相似度计...

2018-07-10 06:28:10

阅读数:37

评论数:0

使用sqoop从Oracle或mysql抽取数据到HDFS遇到的报错及解决

一、参考文档:1、https://www.rittmanmead.com/blog/2014/03/using-sqoop-for-loading-oracle-data-into-hadoop-on-the-bigdatalite-vm/2、http://www.cnblogs.com/bjtu...

2018-07-10 06:25:28

阅读数:55

评论数:0

Spark SQL 简单使用

环境:scala 版本2.11.8,spark 版本2.0.1,使用 Intellij IDEA 来开发。 准备工作:创建maven项目可以从官网上找到我们建项目时使用的 archetype  至于具体怎么创建项目,请参考一个朋友的文章Intellij IDEA 创建 spark/scala 项目...

2018-07-09 06:42:03

阅读数:43

评论数:0

flume-1.7.0 简单使用

在上一篇中,我们安装了 flume-ng,这一篇我们就来简单使用一下。官网上是这么介绍的,我们需要指定一个配置文件,需要定义一个 agent 的名称,然后我们就可以使用 flume-ng 命令来启动了。1 编写配置文件我们先拿官网上的例子来跑一下看看,就使用 example.conf 文件:[ro...

2018-07-09 06:41:06

阅读数:37

评论数:0

flume-1.7.0 安装配置 (详细图文)

准备工作: 从官网下载安装包,一直以来我们安装的都是已经编译好的,记住,在你心里默念三遍。 这次我们使用新的方法吧,使用 UltraEdit 上传 :1.1 跟我们之前使用 EditPlus 上传类似,都是先创建一个账号然后我们就可以选择 ”FTP浏览器“,然后找到相应的文件拖拽过去就行了 其实我...

2018-07-09 06:40:03

阅读数:38

评论数:0

kafka_2.11 简单使用

进过上一篇的引导,相信大家应该都已经安装好了。这次我们就来简单使用一下。1 创建 topic像官网上写的那样,我们可以使用 kafka.topics.sh 脚本来创建一个 topic 。不过,前提是我们需要启动zookeeper 和 kafka 服务。 那我们就用官网上例子好了:[root@mas...

2018-07-09 06:39:12

阅读数:69

评论数:0

kafka_2.11 安装配置 (详细图文)

准备工作先从官网上下载好该版本的安装包,并上传到集群中任意一台主机(我上传到了master上) 1 安装配置1.1 解压我是放到 /usr/hadoop 目录下的,解压之后会多出来一个 kafka_2.11-0.10.1.0 的目录 1.2 配置环境变量在 /etc/profile 中添加如下配置...

2018-07-09 06:38:07

阅读数:67

评论数:0

Sqoop-1.99.7安装配置(详细图文)

环境:centos 6.5,hadoop2.6.4集群1.解压安装sqoop从官网下载好安装包,发送到集群中任意一台主机即可。相信大家已经看到,1.99.7跟1.4.6是不兼容的,而且官网也不建议使用这个版本在生产环境中使用。可是,为了学习,搞吧!一如既往,我还是发送到 master 节点上,在 ...

2018-07-09 06:36:58

阅读数:38

评论数:0

Spark-2.0.1 安装 及 WordCount (详细图文)

1 安装 scala这次我是安装到了 /usr/local/share 目录下:1.1 解压[root@master share]# pwd /usr/local/share [root@master share]# tar -zxvf scala-2.11.8.tgz ... [root@ma...

2018-07-09 06:35:48

阅读数:50

评论数:0

MapReduce多个作业协调处理

一:背景当数据来源不同的时候,比如用户表在MYSQL数据库中,而销售表在HDFS中,我们可以启动多个作业来依次处理这些数据源。二:技术实现#需求#用户表user在MYSQL数据库中,数据如下:1 liaozhongmin2 lavimer3 liaozemin#销售表user_data在HDFS中...

2018-07-09 06:33:10

阅读数:32

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭