自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 centos7 安装mysql5.7

centos7 安装mysql5.7Mysql5.7repo源Mysql(这里选择的是Mysql5.7)repo源,后通过centos自带的yum安装下载的地址为https://dev.mysql.com/downloads/repo/yum/选择mysql57-community-release-el7-11.noarch.rpm安装用来配置mysql的yum源的rpm包r...

2019-11-07 11:04:33 533

原创 XPATH语法

XML 实例文档我们将在下面的例子中使用这个 XML 文档。<?xml version="1.0" encoding="ISO-8859-1"?><bookstore><book> <title lang="eng">Harry Potter</title> <price>29.99</price&g...

2019-09-15 15:32:55 229

原创 scrapy实战(一)--知乎问答

房价爬取使用scrapy mysql爬取网页 https://jingzhou.esf.fang.com/ 房屋数据创建项目创建项目虚拟环境mkvirtualenv fang --python=python3安装scrapypip install -i https://pypi.douban.com/simple/ scrapy由于此下载依赖包很多,如出现某个包下载...

2019-09-15 14:35:04 874

原创 MapReduce编程详解

编写MapReduce程序编写wordcount程序场景:有大量文件,里面存储了单词,且一个单词占一行任务:如何统计每个单词出现的次数类似应用场景:搜索引擎中,统计最流行的K个搜索词统计搜索词频率,帮助优化搜索词提示编辑pom.xml,添加jar包maven添加jar包可查询:https://mvnrepository.com/<!-- 添加仓库 -->&l...

2019-09-04 13:34:57 354

原创 HDFS API编程(二)

HDFS 常用API /** * 查看HDFS内容 */ @Test public void text()throws Exception { FSDataInputStream in = fileSystem.open(new Path("/cdh_version.properties")); IOUtils.copy...

2019-09-02 20:43:16 394

原创 hadoop命令操作详解

整体的hdfs命令行操作,类似于shell命令hadoop命令操作详解hadoop fs [generic options] [-appendToFile <localsrc> ... <dst>] # 添加本地文件到HDFS [-cat [-ignoreCrc] <src> ...] # 查看内容 [-chgrp [-R] GROUP ...

2019-09-02 20:41:29 402

原创 hadoop配置常见问题汇总

jps显示正确,但是浏览器http://hadoop:50070却打不开防火墙问题查看防火墙是否打开sudo firewall-cmd --state显示running关闭防火墙sudo systemctl stop firewalld.service检查是否关闭sudo firewall-cmd --state显示not running重新用浏览...

2019-09-02 20:34:49 402

原创 HDFS API编程(一)

使用HDFS API操作HDFS文件系统Intellij IDEA使用maven 管理项目创建项目点击Finish出现如下界面需等待右下角蓝条加载完成(下载时间较长,需耐心等待蓝条加载完成)...

2019-09-02 20:25:05 1720

原创 hadoop配置与应用(二)

实践6 – HBase Shell基本命令HBase搭建和配置下载并解压需先配置好zookeeper配置系统环境变量vi /etc/profile增加export HBASE_HOME=/path/of/your/hbase-1.2.0-cdh5.7.0export PATH=$HBASE_HOME/bin:$PATH配置HBasecd $HBASE_HOME/c...

2019-09-02 16:27:23 257

原创 hadoop配置与应用(一)

hadoop配置与应用实践1 – 单机配置hadoop单主机伪分布 —— 用于实验和开发环境环境要求单台主机 192.168.56.10操作系统 Centos7.2最小安装hadoop hadoop-2.6.0-cdh5.7.0环境准备主机名hostnamectl set-hostname master2. 配置hostsvi /etc/hosts添加192...

2019-09-01 23:38:37 2827

原创 数据采集和清洗(二)

实践6 – Scrapy安装和配置在Linux中安装Scrapy激活Python虚拟环境安装Twistedwget https://twistedmatrix.com/Releases/Twisted/17.1/Twisted-17.1.0.tar.bz2tar -jxvf Twisted-17.1.0.tar.bz2cd Twisted-17.1.0python3 setu...

2019-09-01 22:50:09 713

原创 数据采集和清洗(一)

实践1 – 搭建Python开发环境在Linux中安装配置Python3(多版本)在centos下编译安装python3前,建议先将yum源更改为国内的yum源安装编译所需的工具yum install -y gcc zlib zlib-devel libffi-devel openssl openssl-devel下载并编译安装Python3wget https://www...

2019-09-01 22:33:41 4930

原创 机器学习实战第一课之k近邻算法 KNN

KNN优点:精度高、对异常值不敏感,无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。算法思想:对未知类别属性的数据集中的每个点一次执行以下操作:1.计算已知类别数据集中的点和当前点之间的距离2.按照距离递增排序3.选取与当前点距离最小的k个点4.确定前k个点所在类别的出现频率5.返回前k个点出现频率最高的类别作

2017-02-25 15:25:24 357

原创 MAC下MYSQL5.7.17无法连接的问题

下载安装完SQLBench_community 6.3.9后新建MYSQL CONNECTIONS根本连接不上,提示为密码错误具体表现为:Access denied for user 'root'@'localhost' (using password: YES)Step1:      苹果->系统偏好设置->最下边点MySQL 在弹出页面中 关闭mysql服务

2017-02-25 09:30:42 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除