自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Just Do IT

但行好事,莫问前程!

  • 博客(321)
  • 资源 (3)
  • 收藏
  • 关注

原创 【Linux】Centos防火墙命令

查看防火墙状态:systemctl status firewalld.service临时关闭防火墙:systemctl stop firewalld.service永久关闭防火墙:systemctl disable firewalld.service 

2019-01-25 21:13:42 285

原创 【Postgresql】pg掉电后无法重启

机房断电后重启pg数据库,报如下错误:< 2019-01-01 22:42:59.240 EST >LOG: database system was interrupted while in recovery at 2019-01-01 22:00:58 EST< 2019-01-01 22:42:59.240 EST >HINT: This probably ...

2019-01-02 12:07:10 2523

原创 【Python】AxisError: axis 0 is out of bounds for array of dimension 0

报错代码:print(np.sort(zip(etr.feature_importances_, boston.feature_names), axis=0))原意是想把zip后的列表,使用sort按列(axis=0)排序。报错原因:zip 方法在 Python 2 和 Python 3 中的不同:在 Python 3.x 中为了减少内存,zip() 返回的是一个对象。如需展示列...

2018-12-26 18:46:29 7407

原创 【Python】AttributeError: 'Series' object has no attribute 'order'

新版本的pandas中的Series不再支持order(),用sort_values()替代。sort_values()文档查看这里

2018-12-19 15:18:32 1483

原创 【Python】检测字符串的方法

1. isalnum()语法: str.isalnum()返回值:如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 Falsestr1 = 'this2018'str2 = 'hello world!'print(str1.isalnum())print(str2.isalnum())实例输出结果为:TrueFalse...

2018-12-12 20:41:35 2781 1

原创 【Python】ix,loc,iloc的区别

ix:通过行标签或行号索引行数据;loc:通过行标签索引;iloc:通过行号索引;注意:pandas0.20.0版本开始,python不建议使用ix,而推荐使用更为精确的 iloc或者 loc。from pandas import Seriesimport numpy as npdata = Series(np.random.randn(10), ...

2018-12-12 11:19:08 586

原创 【Python】ModuleNotFoundError: No module named 'pandas.io.data'

pandas.io.data已经用不成了,得替换为pandas_datareader,pip3 install pandas_datareader 安装就可以了。

2018-11-28 18:32:12 3905

原创 【Python】安装IPython和IPthon Notebook

1. 安装相关包pip install IPythonpip install urllib3 (安装IPython Notebook的依赖)pip install jupyter (安装IPython Notebook)pip install numpypip install matplotlibpip install pandaspip install scipypip in...

2018-11-28 10:14:07 2060

原创 【SQL】SQL的执行顺序

FROM <left_table>ON <join_condition><join_type> JOIN <right_table>WHERE <where_condition>GROUP BY <group_by_list>HAVING <having_condition>SELECTDISTIN

2018-11-06 10:12:33 234

原创 【Python】pymysql.err.InternalError: (1236, 'Misconfigured master - server_id was not set')

使用python连接mysql报错:pymysql.err.InternalError: (1236, 'Misconfigured master - server_id was not set')报错原因:my.cnf文件中没有设置server_id查找文件命令:whereis my.cnf...

2018-10-19 14:31:36 2517

原创 【C】输出乘法口诀表

#include <stdio.h>int main(){ int i = 0; int j = 0; for (i=1;i<=9;i++){ for (j=1;j<=i;j++){ printf("%dx%d=%d\t",i,j,i*j); } printf("\n"...

2018-08-06 14:45:02 286

原创 【SQL】substr截取结果和想象中有差异?

今天在处理员工信息,其中身份证号需要截取后四位,于是,我使用了substr函数:substr(card_no,-1,4)心中默念:“从最后一位截取,负号代表从右向左,截取四位,对,没毛病!!”但结果,擦,却是只截取了最后一位!!!之前都是正序截取,没想到逆序截取还出这情况,网上搜了下,下面小哥写的很好:点击打开链接...

2018-07-05 17:30:28 1068

原创 【Python】BeautifulSoup导入lxml报错

报错的程序:content = bs4.BeautifulSoup(response.content.decode("utf-8"), "lxml")报错如下:bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser...

2018-06-28 14:25:50 3064 3

原创 【Python】Pycharm中plot绘图不能显示

《利用Python进行数据分析》书中例子都是用IPython作为开发环境,问我一直在用Pycharm,这导致了plot还不能显示绘图。出错的代码如下:import jsonimport pandas as pdfrom pandas import DataFrame,Seriespath = r'C:\Users\long\Desktop\python\pydata-book-2nd-ed...

2018-06-26 16:15:14 20106 4

原创 【SQL练习题】排序

原表如下:建表脚本:CREATE TABLE districtproducts ( district varchar(255), name varchar(255), price int(255));INSERT INTO districtproducts VALUES ('东北', '橘子', 100);INSERT INTO districtproducts VALUES ...

2018-06-21 18:28:10 511

原创 【Kettle】如何解决Excel输出卡死或太慢

当Excel输出大量数据时(10w+),此步骤可能会卡死导致真个转换报错。只需勾选如下即可解决:

2018-06-21 16:06:25 6210 5

原创 【SQL练习题】case when实现按要求排序

表中key列,数据如下:如何实现如下输出效果:建表语句:CREATE TABLE order1 ( key varchar(255)); INSERT INTO order1 VALUES ('A'); INSERT INTO order1 VALUES ('B'); INSERT INTO order1 VALUES ('C'); INSERT INTO orde...

2018-06-19 15:48:29 1716

原创 【SQL练习题】1. 多列数据求最大值

一列多行,很容易得出最大值,但多列多行如何取最大值呢?从下表中取得每行的最大值:最终实现如下效果:建表语句:CREATE TABLE greatests ( key varchar(255), x int(5), y int(5), z int(5));INSERT INTO greatests VALUES ('A', 1, 2, 3);INSERT INTO great...

2018-06-15 18:32:55 5157

原创 【Kettle】血统分析

在转换中,血统就是说你要知道一个数据是从哪里来的,在哪个步骤中,增加了或修改了这个数据,最后输出到哪个数据库表中。本篇通过job,先把资源库导出成xml文件,然后通过分析xml文件,把想要的信息输入到数据库表中进行保存。当要查询表来源时,只需要查询存储资源库的表即可。job:job中的转换:1. 导出资源库到XML文件2. Get data from XML(解析导出的资源库XML文件)输出的字段...

2018-06-12 17:27:12 5662

原创 【Kettle】如何输出固定格式报表

我的工作是为公司分析部门提供数据,其中一部分是固定时间点提取的报表,这些报表的格式固定,每次机械化的修改参数→提取数据→复制粘贴,实在是繁琐。下面介绍一个我工作中使用kettle输出固定格式报表的例子,希望能帮到有需要的小伙伴们。背景:固定格式报表如表1,其中还有excel公式嵌套在里面,分析部门提供的原始模板如表2(其中为0和#DIV/0!的单元格中嵌套了公式):                ...

2018-06-11 15:21:47 4331

原创 【Python】Python中文编码

如果Python程序中有中文字符,运行会报错:print "你好,世界!";SyntaxError: Non-ASCII character '\xe4' in file D:/tools/pycharm/untitled/hello.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263....

2018-06-05 16:44:13 555

原创 【SQL】正则表达式-校验数字,字符,特殊需求等

一、校验数字的表达式1 数字:^[0-9]*$ 2 n位的数字:^\d{n}$ 3 至少n位的数字:^\d{n,}$ 4 m-n位的数字:^\d{m,n}$ 5 零和非零开头的数字:^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$ 8 正...

2018-05-31 10:41:40 19724 1

原创 【Java】Exception in thread "main" java.lang.Error: Unresolved compilation problem

使用eclipse编译Java程序出现错误:Exception in thread "main" java.lang.Error: Unresolved compilation problem,是因为没有在程序开始位置指定包名称(指定包例子:package test; )。...

2018-05-31 10:10:49 4285

原创 【SQL】update中使用case when

1.创建测试表及数据CREATE TABLE graduates ( name varchar(255) , income int4(255) ); INSERT INTO graduates VALUES ('桑普森', '400000'); INSERT INTO graduates VALUES ('迈克', '30000'); INSERT INTO...

2018-05-25 16:46:37 58662 7

原创 【Python 2.7】xlrd读取Excel文件

这篇博文参考于《Python 数据处理》读取Excel文件需要用到xlrd模块,模块下载地址:xlrd下载地址本博文中Excel文件下载地址:SOWC 2014 Stat Tables_Table 9.xlsx下面我们使用xlrd模块提取Excel文件中的童工和童婚比例:"""这是用来分析童工和童婚数据的脚本。 本脚本中用到的Excel文件可以在以下链接中获取:https://github....

2018-05-15 16:50:28 3340 3

原创 【Kettle】创建资源库用户

在生产中,我们一般都会先连接资源库,然后再去编辑作业或者转换。连接之前会有用户名和密码的输入:这里的用户名和密码可以在kettle里面新建,(lll¬ω¬),之前我是不知道的,一直都在用admin用户操作。添加用户操作如下:使用admin用户(资源库创建后的默认用户admin和guest)登陆,密码默认是admin,登陆以后依次点击“工具”→“资源库”→“探索资源库”→“安全”然后点“+”添加用户...

2018-04-23 10:27:46 3663

原创 【Kettle】job中设置自动发送邮件

背景:业务每周六需要固定格式的数据,手工跑脚本太麻烦,为了偷懒,设计了job,定时启动job,并把数据自动发送到对方邮箱。一   kettle服务器定时任务如下:每周六上午九点执行脚本调度job0 9 * * 6 source /etc/profile;/opt/program_etl/weekly_jss_jingsuanshi_taibaorenewal_trace.pyweekly_jss_...

2018-04-19 14:18:25 3128

原创 【Kettle】date类型不能被excel输出

背景:kettle7.0,连接PG9.6数据库,我想把查询出来的结果excel输出到本地。结果其他字段都可正常导出,唯独日期类型导出为空。最终解决办法:查询结果在输出之前要转换成文本或字符串类型。如果使用SQL写的表输入步骤,可以在SQL里做字段类型转换。如我的修改为:...

2018-04-19 13:50:48 2909

原创 【Kettle】Kitchen和Pan的命令行参数

参数语法:[/-]name [[:=]value]参数以斜线(/)或者横线(-)开头,后面跟参数名称。大部分参数后面都要有参数值。参数和参数值之间用冒号(:)或者(=)连接,参数值里面如果有空格,参数值必须用单引号或双引号引起来。Kitchen和Pan共有的参数如下:参数名参数含义作用norep  rep资源库名称要连接的资源库名称user资源库用户要连接的资源库用户pass资源库用户密码要连接的...

2018-04-11 13:53:11 5530

原创 【Kettle】作业和转换中的内置变量

在作业和转换参数中使用Kettle内置变量,可以更方便的工作。下面是Kettle中常用的内置变量:变量描述Internal.Kettle.Version这是kettle的版本号,比如4.0.0Internal.Kettle.Build.Version这是kettle源代码的SVN的修订号Internal.Kettle.Build.Date这是kettle的build日期Internal.Job.F...

2018-04-11 11:42:36 3667 1

原创 【MySQL-5.7】日期与时间类型

MySQL中的日期与时间类型,主要包括:YEAR、TIME、DATE、DATETIME、TIMESTAMP,下表中列出了这几种类型的属性。类型名称日期格式日期范围占用空间YEARYYYY1901 ~ 21551字节TIMEHH:MM:SS-838:59:59 ~ 838:59:59 3字节DATEYYYY-MM-DD1000-01-01 ~ 9999-12-33字节DATETIMEYYYY-MM-...

2018-03-28 13:30:29 4514

原创 【Python-2.7】多种方式删除列表元素

1. pop():括号中不加参数表示删除列表最后一个元素,也可以加下标参数删除players = ['charles','martina','michael','florence','eli']players.pop()print players运行结果如下:['charles', 'martina', 'michael', 'florence']2. remove():按元素删除,括号中加入...

2018-03-27 16:12:33 3516

原创 【Python-2.7】如何判断对象是否为可迭代?

对于一个对象,如果可以通过for循环遍历它,那么就称这个对象为“可迭代”的。其实我们已经知道list和tuple类型是可迭代的,但是有没有一种方法可以直观的判断出来呢?这就用到了collenctions模块的Iterable类型。首先导入collections模块下的Iterable类型,然后通过isinstance返回boolean值。“可迭代”返回“True”,“不可迭代”返回“False”。...

2018-03-12 14:31:30 1280

原创 【Kettle】Win7启动Spoon.bat闪退

我遇到的情况:Win7系统安装完成Kettle7.1,安装了JDK1.8,启动spoon.bat文件出现一闪而过,不能正常启动Kettle。解决办法:打开spoon.bat文件,其中参数:if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=25...

2018-03-11 09:48:57 1645

原创 【PostgreSQL-9.6.8】序列

1. 创建序列语法:CREATE [ TEMPORARY | TEMP ] SEQUENCE name [ INCREMENT [ BY ] increment ] [ MINVALUE minvalue | NO MINVALUE ] [ MAXVALUE maxvalue | NO MAXVALUE ] [ START [ WITH ] start ] [ CACHE cach...

2018-03-09 18:12:27 602

原创 【PostgreSQL-9.3.17】CentOS-6.7安装PostgreSQL-9.3.17

安装CentOS-6.7过程略,完成安装后需要配置linux连接外网,因为需要yum安装缺少的安装包。Linux连接外网方法1. 下载源码包https://www.postgresql.org/ftp/source/v9.3.17/2. 创建postgres用户及dba组,创建soft目录,并修改soft的属主属组useradd -g dba postgresmkdir /softchown -R...

2018-03-08 22:06:20 339

原创 【Postgresql-9.6.8】触发器实例(记录增、删、改)

这个触发器的作用是:当对表中数据进行INSERT、DELETE、UPDATE时,同时更新另一张表中的相关字段。(此实例参考于PG官方文档)--主表 - 时间维度和销售事实。create table time_dimension(time_key integer not null,day_of_week integer not null,day_of_month integer...

2018-03-08 14:12:07 4227

原创 【Linux】虚拟机中linux系统连接外网

参考如下文章:点击打开链接

2018-03-03 20:20:12 1337

原创 【PL/SQL】测试函数时,日期参数的输入格式

如果在PL/SQL中测试,输入格式为xxxx/xx/xx;如果使用select function_name(xx,xx) from dual; 测试函数时,日期参数需要使用to_date('xxxx-xx-xx','YYYY-MM-DD') 或者date'xxxx-xx-xx' 进行类型转换。下面是一个函数例子,函数中V_QRP_RQ参数类型为date:--创建测试表,并插入数据CR

2018-01-31 11:25:43 5199

原创 【Kettle】crt中运行spoon.sh报错

安装完成kettle,启动spoon.sh时报错如下:[root@kettle data-integration]# ./spoon.sh org.eclipse.swt.SWTError: No more handles [gtk_init_check() failed] at org.eclipse.swt.SWT.error(Unknown

2018-01-27 21:17:27 3303

SOWC 2014 Stat Tables_Table 9.xlsx

《Python 数据处理》第四章Excel实验文件,用于测试童工和童婚数量分析。

2018-05-15

population_data.json

用Python练习做世界人口地图的文件。《Python编程:从入门到实践》,数据可视化经典案例所需文件。

2017-10-19

Python Indent插件

此插件用于解决python自动缩进问题。 1. 解压压缩包 2. 把Python Indent文件夹和Python Indent.dll放在notepad++安装目录的plugins文件夹下 3. 重启notepad++ 4. 依次点击 插件--Python Indent--Enable,将Enable打钩 5. 问题解决

2017-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除