自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

转载 在mac中使用Docker搭建oracle

有个朋友老是吹Docker怎么怎么样,一直不以为然,后来有次需要自己mac电脑上搭建oracle,又不想装虚拟机,想起有Docker这个东西就研究了下怎么使用,记录下摸索的过程。1.在mac中使用Docker搭建oracle2.搭建环境的初期准备3.下载镜像4.启动容器5.导入数据搭建环境的初期准备先到阿里云镜像站https://mirrors.aliyun.com/dock...

2019-06-22 00:30:55 1475 2

转载 解决 ORA-21561: OID generation failed

昨天更新了macOS Sierra 后,发现用 Navicat 连接 Oracle 报 ORA-21561: OID generation failed 错误解决方法打开终端,查看 hostnamehostname发现是 local 而不是 localhost查看 hosts 文件cat /etc/hosts内容为### Host Database##...

2019-06-22 00:14:03 2155

转载 Pycharm打印结果省略的解决方法

        pandas是python提供的非常好用的数据分析模块,但是在使用pandas进行数据分析时,有时候需要查看打印的结果,当dataframe行数或者列数比较多的时候,打印结果总是有一些省略号,不能完整的看到数据的大致分布,比如最大值,最小值,等等,了解数据分布的区间有助于进行可视化和进一步分析。        查看pandas的文档,这个问题可以通过pandas内置的set...

2018-10-05 10:53:14 8783

原创 python使用webdriver启动chrome时, 报错Message: 'chromedriver'executable needs to be in PATH

1. 下载chromedriverhttp://npm.taobao.org/mirrors/chromedriver/2. 将chromedriver.exe放到py文件的目录下 3. 添加 executable_path='./chromedriver' 如下def start_chrome(): driver = webdriver.Chrome(execut...

2018-09-24 00:04:14 1932

原创 启动pyspark,报错socket.gaierror: [Errno -2] Name or service not known

启动pyspark报错,如下:[root@hadoop-senior spark-1.6.0-cdh5.13.0]# pysparkPython 2.6.6 (r266:84292, Aug 18 2016, 15:13:37) [GCC 4.4.7 20120313 (Red Hat 4.4.7-17)] on linux2Type "help", "copyright", "cre...

2018-09-17 10:49:15 3710

转载 学习爬虫的几篇文章

python爬虫设置代理IP的方法:https://www.jb51.net/article/135851.htm通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据:https://www.jb51.net/article/73780.htmPython动态网页爬虫技术:http://www.360doc.com/content/18/0122/22/5315_72427748...

2018-09-16 16:14:46 147

原创 爬取网页数据时,出现UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf'

UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf' in position 1235: illegal multibyte网页的数据应该是'utf-8'编码,这个可以在网页的head上面看得到,然后你爬网页的时候会把它转化成Unicode,出问题的是在print()这儿,对于print()这个函数,他需要把内容转化为'...

2018-09-16 14:37:44 639

转载 linux下改变文件的编码格式

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式:set fileencoding=utf-82. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下enconv -L zh_CN -x UTF-8 filename3. iconv 转换,iconv的命令格式如下:iconv -f encoding -t encoding inp...

2018-09-15 16:31:34 12345

原创 执行Sqoop时,SemanticException [Error 10072]: Database does not exist

[root@hadoop-senior ~]# sqoop create-hive-table --connect jdbc:mysql://hadoop-senior:3306/test --table my_user --username root --password 123456 --hive-table liantong0826.zhuyu_stud_info_sqoop 报错:...

2018-09-15 14:54:28 3889

原创 Python安装第三方库

 在Mac上安装第三方库:  在Windows上安装第三方库:  

2018-09-13 15:54:57 158

原创 使用python将多个文件合并成一个文件

import os#获取目标文件夹的路径filedir = '/Users/rise/Desktop/results'#获取当前文件夹中的文件名称列表 filenames=os.listdir(filedir)#打开当前目录下的result.json文件,如果没有则创建f=open('results.json','w')#先遍历文件名for filename in filena...

2018-09-09 10:12:51 5867 2

转载 使用sqoop将mysql数据导入hbase

下表: 1、通过hbase shell 打开hbase。2、创建一个hbase表create 'so','o'  3、将so表的数据导入到hbase中。opt文件:--connect:数据库--username :数据库用户名--password :数据库密码--table :需要sqoop的表--columns :表中的列...

2018-09-08 16:36:14 1199 1

原创 Mac下python3.0使用matplotlib中文乱码(方块)

方法一:1. 添加SimHei字体(simhei.ttf文件)     到/Users/rise/anaconda3/lib/python3.6/site-packages/matplotlib/mpl-data/fonts/ttf/(下载地址:黑体字体simhei.ttf)2. 删除~/.matplotlib/下的所有缓存文件     rm -rf ~/.matplotlib/*...

2018-09-06 20:03:57 1840 1

转载 Charles乱码问题

安装ssl证书3.10版本之前的需要去http://www.charlesproxy.com/ssl.zip 下载 CA 证书文件,然后双击 .crt 文件,选择‘总是信任’按钮,在钥匙串访问中即可看到添加成功的证书。我是4.02版本的,在3.10版本之后的,操作如下: 先点proxy中的macOS Proxy ,如果点击网页,Charles没有出现东西的话,把翻墙软件关了 ...

2018-09-04 16:55:55 1861

原创 Python连接mysql,在python解释器中进行创建表、插入数据时,在Python解释器中可以查看到数据,但是在mysql中查询不到数据

 解决方案:数据库没有开启事务自动提交( cursor.commit())时,在执行操作时,需要手动提交(cursor.autocommit(True))。

2018-09-01 09:27:46 739 1

转载 Unicode、UTF-8、UTF-16之间的区别

为啥需要Unicode       我们知道计算机其实挺笨的,它只认识0101这样的字符串,当然了我们看这样的01串时肯定会比较头晕的,所以很多时候为了描述简单都用十进制,十六进制,八进制表示.实际上都是等价的,没啥太多不一样.其他啥文字图片之类的其他东东计算机不认识.那为了在计算机上表示这些信息就必须转换成一些数字.你肯定不能想怎么转换就怎么转,必须得有定些规则.于是刚开始的时候就有AS...

2018-08-29 14:51:24 44046 8

转载 Python的字符编码

前言:中文编码问题一直是程序员头疼的问题,而Python2中的字符编码足矣令新手抓狂。本文将尽量用通俗的语言带大家彻底的了解字符编码以及Python2和3中的各种编码问题。一、什么是字符编码。要彻底解决字符编码的问题就不能不去了解到底什么是字符编码。计算机从本质上来说只认识二进制中的0和1,可以说任何数据在计算机中实际的物理表现形式也就是0和1,如果你将硬盘拆开,你是看不到所谓的数字0和1...

2018-08-29 14:47:36 152

原创 Navicat连接Linux中的mysql失败:需要开启远程访问

1.  进入mysql,给root用户开启远程访问mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION;Query OK, 0 rows affected, 1 warning (0.01 sec)2.  刷新权限mysql> flush privi...

2018-08-23 14:22:57 773

原创 apt-get update 域名无法解析

执行apt-get update出错:root@dbserver1:/etc/apt/sources.list.d# apt-get update错误:1 http://security.ubuntu.com/ubuntu xenial-security InRelease  暂时不能解析域名“security.ubuntu.com”错误:2 http://ppa.launchpad.n...

2018-08-23 01:07:07 12893 6

原创 Ubuntu中MySQL初始化失败,解决方法

root@dbserver1:/usr/local/mysql# bin/mysqld --initialize --user=mysql2018-08-22T09:37:02.595453Z 0 [Warning] TIMESTAMP with implicit DEFAULT value is deprecated. Please use --explicit_defaults_for_ti...

2018-08-22 17:39:39 1418

转载 Ubuntu网络设配置IP、网关、DNS

        在网上给的教程上面通常会有这样的一个误导思路,按照配置文件设置后会不生效的问题,甚至没有一点效果,经过排查发现Linux下设置IP这个话题的入口线索应该分为两种:1为Server版,2为Desktop版,这两种版本的设置方式有很大区别,主要在于软件的问题。Service版按常规版设置即可,但是Desktop版的有一个Network-manager的软件,这个软件是简化IP的设置,所...

2018-08-22 13:05:26 621

转载 克隆虚拟机及参数修改

克隆VM lunix虚拟机 修改unix系统参数通过上一步的克隆,得到多个unix系统环境,现在拿其中一个进行修改举例,其余部分大致相同,除了IP和主机名以外。第一步 修改mac地址在虚拟机还未启动之前,先修改该系统的mac地址,如下操作所示。  生成新的mac地址,并用记事本记录 修改完成后启动虚拟机 打开终端窗口并切换到root用户,键入命令vim /etc/u...

2018-08-22 11:38:38 264

转载 启动hadoop时报root@localhost's password: localhost: Permission denied, please try again.错误。

在装完hadoop及jdk之后,在执行start-all.sh的时候出现root@localhost's password:localhost:permission denied,please try again。 解决方案:1.修改root密码:#sudo passwd root2.辑配置文件,允许以 root 用户通过 ssh 登录:sudo vi /etc/ssh/sshd...

2018-08-22 10:53:31 8421 1

原创 Hadoop启动不起来NameNode

如果查看日志没有什么日常,且配置文件检查后没有问题:格式化namenode(bin/hdfs namenode -format),然后重新启动。

2018-08-22 09:17:07 1018

转载 Ubuntu安装Redis及测试

在 Ubuntu 系统安装 redis 可以使用以下命令:$ sudo apt-get update$ sudo apt-get install redis-server启动 redis$ redis-server查看 redis 的运行状态$ service redis-server status查看 redis 的是否启动$ redis-cli127.0...

2018-08-22 01:07:12 2145

转载 Ubuntu安装Mysql教程

Ubuntu 16.04安装MySQL 此篇为http://www.cnblogs.com/EasonJim/p/7139275.html的分支页。安装MySQL前需要做如下了解:1、MySQL各类型版本的区别,参考:http://www.cnblogs.com/EasonJim/p/6274344.html2、官方的下载地址一般指向最新的版本下载,如果要下载以前的版本,比如5...

2018-08-22 00:39:03 2061

转载 Ubuntu安装MongoDB教程

第一步:安装 #setp 1. Import the public key used by the package management system.sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 0C49F3730359A14518585931BC711F9BA15703C6 ...

2018-08-21 23:44:21 1435

转载 Ubuntu安装Python3.6教程

 首先拉取远程仓库sudo add-apt-repository ppa:jonathonf/python-3.6  这个过程可能会网络超时 这个时候…再来一遍,如果还有问题,参考https://mp.csdn.net/postlistOK之后,更新sudo apt-get updatesudo apt-get install python3.6tips: u...

2018-08-21 23:23:04 14268 3

转载 Ubuntu使用apt-get下载速度慢的解决方法

查看所用的源:$ sudo vim /etc/apt/sources.list 由于安装的Ubuntu Server 16.04.1 LTS是英文版的,软件源就默认都是 us.archive.ubuntu.com(英国) 的,所以很慢。# deb cdrom:[Ubuntu-Server 16.04.1 LTS _Xenial Xerus_ - Release amd64 (...

2018-08-21 23:08:03 38739 8

转载 SecureCRT连接Ubuntu,拒绝连接的解决方法

转自:https://blog.csdn.net/kan2281123066/article/details/56485404 操作环境:VMwareWorkstation10.0 + Ubuntu 16.10出现的问题 用secureCRT连接Ubuntu提示远程系统拒绝访问和提示登录账户和密码错误。解决办法 (1)开启ubuntu上的ssh功能,先安装,安装后就自动开启了。...

2018-08-20 17:03:10 4184 3

原创 任务调度框架Oozie学习笔记

目录1.  工作流调度框架Oozie功能初步认识2.  几种调度框架讲解3.  Oozie 功能架构及三大Server讲解4.  Oozie安装部署5.   Oozie案例运行MapReduce Wordflow讲解6.  如何定义OoozieWorkflow讲解7.  Oozie Workflow中MapReduce Action定义讲解8.  编写Oozie...

2018-07-16 21:28:50 7262

原创 文件收集框架Flume学习笔记

   1.Flume功能概述   Flume是一个分布式的,可靠的,可用的服务,用于高效地收集,汇总和移动大量的日志数据。它具有基于流式数据流的简单而灵活的架构。它具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错能力。它使用一个简单的可扩展的数据模型,允许在线分析应用程序。  flume的分布式如下图:  企业中的应用:    2.  Flume架构设计工作流程:source从服务器拿...

2018-07-16 09:35:59 243

原创 数据转换工具Sqoop学习笔记

(导入导出是相对于HDFS) 1.         大数据Hadoop2.x协作.框架的功能    2.          Sqoop 使用要点(核心)及企业版本讲解所以我们就使用CDH的发行版本,而不使用apache的。下载地址:http://archive.cloudera.com/cdh5/cdh/5/所有框架的cdh版本要相同。  3. 使用CDH 5.13.0版本快速搭建Hadoop 2...

2018-07-15 22:56:41 372

原创 HBase学习笔记 (三)

 一、HBase高级使用  1.HBase Shell创建表(多个列簇和设置属性)  创建命名空间:例如:Createa table with namespace=ns1 and table qualifier=t1  hbase> create 'ns1:t1', {NAME => 'f1',VERSIONS => 5} Createa table with namespace...

2018-07-14 23:33:53 527

原创 HBase学习笔记 (二)

说的

2018-07-13 16:38:30 567

原创 HBase学习笔记 (一)

2018-07-13 14:35:23 291

原创 Hive学习笔记 (三)

一、       Hive高级进阶   1.      HiveServer2、Beeline、JDBC的使用 hive是CLI,HiveServer2(HS2)是一种能使客户端执行Hive查询的服务。 HiveServer2是HiveServer1的改进版,需要和beeline结合使用。一个终端启动hiveserver2,另一个终端启动beeline。 启动hiveserver2并用beelin...

2018-07-12 16:50:44 513

原创 Hive学习笔记 (二)

说的

2018-07-11 23:03:34 246

原创 Hive学习笔记 (一)

一、       Hive初识入门 1.      Hive的背景及概念之前的程序员大多都使用sql,让他们写MapReduce需要培训,成本高。 ETL( Extract-Transform-Load)  2.      Hive的架构、优点及使用场景讲解     3.      Hive安装部署及简单测试(使用derby存储元数据) ① 修改配置文件:hive-env.sh(重命名hive-e...

2018-07-11 16:21:18 927

原创 Hadoop学习笔记 (四)

2018-07-09 22:58:49 225

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除