- 博客(5)
- 资源 (6)
- 收藏
- 关注
转载 大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例
1 大数据处理的常用方法 大数据处理目前比较流行的是两种方法,一种是离线处理,一种是在线处理,基本处理架构如下: 在互联网应用中,不管是哪一种处理方式,其基本的数据来源都是日志数据,例如对于web应用来说,则可能是用户的访问日志、用户的点击日志等。 如果对于数据的分析结果在时间上有比较严格的要求,则可以采用在线处理的方式来对数据进行分析,如使用Spark、Storm等进行处理。比较贴切的...
2018-04-23 12:32:10 24341 3
转载 ubuntu链接xftp5
检查Ubuntu的ssh服务是否开启 $ ps -e|grep ssh 看到“ssh-agent”和“sshd”,否则表示没有安装服务,或没有开机启动 1.安装ssh $ sudo apt-get install openssh-server 2.启动服务: $ /etc/init.d/ssh start 3.链接xftp5...
2018-04-23 09:14:13 951
原创 Linux(ubuntu)上修改MySQL数据库root用户密码并允许远程机器访问
mysql基本操作 停止MySql服务 mysql> quit 启动mysqld_safe ubuntu16.04中执行命令: /usr/bin/mysqld_safe –skip-grant-tables& 设置新密码 mysql> update user set Password=PASSWORD(‘cj’) wh...
2018-04-19 21:42:44 457
原创 决策树
熵 决策树归纳法 ID3的核心思想:选择信息增益最大的属性进行分裂。 根节点选取: 信息获取量: Gain(属性1) = Info(D) -- Info_属性1(D) Gain(属性2) = Info(D) -- Info_属性2(D) Gain(属性...) = Info(D) -- Info_属性...(D) 取最大的信息获...
2018-04-19 16:32:59 188
原创 PyCharm激活
破解PyCharm 1. 在浏览器的地址栏输入:http://idea.lanyus.com/,该网址,无需修改用户名,点击获取注册码。复制该注册码,粘贴在注册界面的Activation code的输入框中,点击 ok。 2. 1.修改hosts文件: 在window系统下的hosts(C:\Windows\System32\drivers\etc )文件中...
2018-04-04 10:54:50 2337
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人