关闭
当前搜索:

[置顶] 数据分析教程视频 | 免费送

数据分析: 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的...
阅读(54) 评论(0)

[置顶] 利用Hadoop运行第一个程序,计算文章中不同单词数量

今天通过Hadoop来运行第一个程序,来统计一篇文章中不同英文单词的个数。 1.创建一个 t1.txt 文件夹,并将你要统计的文章粘贴进去。(这里是将txt文件创建在E盘中,跟Hadoop文件同处于一个盘) 2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务 3.准备输入、输出文件夹,在HDFS文件系统中创建。 Hadoop...
阅读(100) 评论(0)

[置顶] 大数据学习路线(完整详细版)

大数据学习路线 java(Java se,javaweb) Linux(shell,高并发架构,lucene,solr) Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume) 机器学习(R,mahout) Storm(Storm,kafka,redis) Spark(scala,spark,spark...
阅读(248) 评论(0)

【python爬虫】爬取你想要的图片

这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中需要用到的模块:re(正则表达式),request,random#!-*- coding:utf-8 -*- #FileName : img.py #Author : CSDN_fzs #Data : 2018/01/10 import re #导入正则表达式模块 import requests #pytho...
阅读(83) 评论(0)

2008年美国每月最低气温大数据分析

2008年美国每个月最低气温分析 1.点击https://pan.baidu.com/s/1c1MPnSs下载2008.txt文件(这里是将2008.txt文件放在E盘中,跟Hadoop文件同处于一个盘) 2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务 3.准备输入、输出文件夹,在HDFS文件系统中创建。 Hadoop中...
阅读(265) 评论(0)

大数据面前无隐私 到底谁才是老大哥

(原标题:大数据面前无隐私,到底谁才是老大哥) 最近,几家大型的互联网企业,都因为数据隐私过得都不太安生。 阿里系这边,旗下子公司支付宝被爆出在“年度账单”活动中,靠默认勾选套取用户数据;腾讯系也不消停,先是吉利控股董事长李书福公开质疑微信偷看用户聊天记录,几天后腾讯和广州市政度试推出的全国首张“微信身份证”又被指责“动机不纯”;撇开这两家,号称中国最大的内容平台的今日头条,被质疑利用...
阅读(753) 评论(0)

10分钟搞定Windows环境下hadoop安装和配置

Hadoop是大数据的核心武器,下面来介绍在Windows环境下Hadoop的安装和配置 1.下载Hadoop http://www.apache.org/dyn/closer.cgi/hadoop/common 2.解压 hadoop-2.7.3.tar.gz 点右键“解压到hadoop-2.7.3” 文件夹路径 xxx/xxxx/hadoop-2.7.3 复...
阅读(138) 评论(0)

什么是大数据

1.什么是数据 数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未加工的原始材料。数据经过加工之后就成为信息。 2.大数据的定义 麦肯锡给出的大数据定义是:大数据是指大小超过常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定的TB值的数据才能是大数据。 亚马逊的大数据科学家John Rauser给出了...
阅读(137) 评论(0)

为什么要学习大数据

近年来大数据越来越火爆,非常多的人转行做大数据或者开始学习大数据。现在我们看来大数据尤为重要,马云也说过现在是DT时代,也就是数据时代。“未来最大的能源不是石油,而是数据”。目前人工智能也是空前火热,而人工智能也是基于大数据的,所以现在看来,大数据的前景会非常好。在这里简单地介绍一下我们学习大数据的几点原因。 1.国家对大数据的支持 从国家层面到地方政府,出台了一系列促进大数据发展的纲要政策,...
阅读(113) 评论(0)
    个人资料
    • 访问:1849次
    • 积分:100
    • 等级:
    • 排名:千里之外
    • 原创:7篇
    • 转载:2篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档