- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 近年常用的几种DDOS攻击检测方法
1.基于组合分类器的ddos攻击流量分布式检测模型本研究提出了一种分布式攻击流量检测模型,该模型的核心检测部分采用的是机器学习中应用非常广泛的集成学习方法,即组合分类器的随机森林方法。该方法拓展性好,能够适应网络环境中异常监测的动态调整与部署。DDos攻击分布式检测模型共分为数据采集模块、数据预处理模块、分布式分类检测模块和报警响应模块四部分。a.数据采集...
2018-01-29 01:22:00 7923
原创 2008年美国每月最低气温MapReduce大数据分析
2008年美国每个月最低气温分析1.点击https://pan.baidu.com/s/1c1MPnSs下载2008.txt文件(这里是将2008.txt文件放在E盘中,跟Hadoop文件同处于一个盘)2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务3.准备输入、输出文件夹,在HDFS文件系统...
2018-01-20 12:54:00 313
原创 【python爬虫】爬取你想要的图片
这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中 需要用到的模块:re(正则表达式),request,random #!-*- coding:utf-8 -*- #FileName : img.py #Author : CSDN_fzs #Data : 2018/01/10 import re #导入正则...
2018-01-20 12:51:00 1091 1
原创 利用Hadoop运行第一个程序,计算文章中不同单词数量
今天通过Hadoop来运行第一个程序,来统计一篇文章中不同英文单词的个数。1.创建一个 t1.txt 文件夹,并将你要统计的文章粘贴进去。(这里是将txt文件创建在E盘中,跟Hadoop文件同处于一个盘)2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务3.准备输入、输出文件夹,在HDFS文件系...
2018-01-20 12:44:00 368 1
原创 什么是大数据?
1.什么是数据数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未加工的原始材料。数据经过加工之后就成为信息。2.大数据的定义麦肯锡给出的大数据定义是:大数据是指大小超过常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定的TB值的数据才能是大数据。亚马逊的大数据科学家John Rauser给出了一个简...
2018-01-20 12:34:00 739
原创 【Python】爬取你想要的图片
这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中需要用到的模块:re(正则表达式),request,random#!-*- coding:utf-8 -*-#FileName : img.py#Author : CSDN_fzs#Date : 2018/01/10import re #导入正则表达式模块import requests...
2018-01-10 21:46:51 19447 19
原创 【大数据】2008年美国每月最低气温Hadoop大数据分析
2008年美国每个月最低气温分析1.点击https://pan.baidu.com/s/1c1MPnSs下载2008.txt文件(这里是将2008.txt文件放在E盘中,跟Hadoop文件同处于一个盘)2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务3.准备输入、输出文件夹,在HDFS文件系统中创建。Hadoop中所有...
2018-01-08 11:48:50 1405
转载 大数据面前无隐私 到底谁才是老大哥
(原标题:大数据面前无隐私,到底谁才是老大哥)最近,几家大型的互联网企业,都因为数据隐私过得都不太安生。阿里系这边,旗下子公司支付宝被爆出在“年度账单”活动中,靠默认勾选套取用户数据;腾讯系也不消停,先是吉利控股董事长李书福公开质疑微信偷看用户聊天记录,几天后腾讯和广州市政度试推出的全国首张“微信身份证”又被指责“动机不纯”;撇开这两家,号称中国最大的内容平台的今日头条,被质疑利用
2018-01-08 08:53:05 2000
原创 【大数据】利用Hadoop运行第一个程序,计算文章中不同单词数量,WordCOunt词频统计
今天通过Hadoop来运行第一个程序,来统计一篇文章中不同英文单词的个数。1.创建一个 t1.txt 文件夹,并将你要统计的文章粘贴进去。(这里是将txt文件创建在E盘中,跟Hadoop文件同处于一个盘)2.在命令提示符下 Hadoop-2.7.3\sbin 中输入 start-all.cmd 开启Hadoop服务3.准备输入、输出文件夹,在HDFS文件系统中创建。Ha...
2018-01-07 12:05:38 1396 2
原创 【大数据】10分钟搞定Windows环境下hadoop安装和配置
Hadoop是大数据的核心武器,下面来介绍在Windows环境下Hadoop的安装和配置1.下载Hadoophttp://www.apache.org/dyn/closer.cgi/hadoop/common2.解压hadoop-2.7.3.tar.gz 点右键“解压到hadoop-2.7.3”文件夹路径 xxx/xxxx/hadoop-2.7.3复制hadoo...
2018-01-05 22:03:03 47138 33
原创 【大数据】最新大数据学习路线(完整详细版,含整套教程)
大数据学习路线java(Java se,javaweb)Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,mahout)Storm(Storm,kafka,redis)Spark(scala,spark,spark core,s...
2018-01-05 20:15:06 85542 43
原创 【大数据】什么是大数据
1.什么是数据数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未加工的原始材料。数据经过加工之后就成为信息。2.大数据的定义麦肯锡给出的大数据定义是:大数据是指大小超过常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定的TB值的数据才能是大数据。亚马逊的大数据科学家John Rauser给出了一个简单的定义:大数据是任...
2018-01-05 19:45:39 2139
原创 【大数据】为什么要学习大数据
近年来大数据越来越火爆,非常多的人转行做大数据或者开始学习大数据。现在我们看来大数据尤为重要,马云也说过现在是DT时代,也就是数据时代。“未来最大的能源不是石油,而是数据”。目前人工智能也是空前火热,而人工智能也是基于大数据的,所以现在看来,大数据的前景会非常好。在这里简单地介绍一下我们学习大数据的几点原因。1.国家对大数据的支持从国家层面到地方政府,出台了一系列促进大数据发展的纲要政策,...
2018-01-05 19:31:58 5519
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人