自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(8)
  • 资源 (3)
  • 收藏
  • 关注

原创 kettle8.2 连接 cdh6.3.2 root directory access 问题记录

因业务需要,切换到cdh6.3.2平台,虽然用起来 不是很熟悉,但总体还是能快速入手spark、hive及sqoop等使用。但导数据时发现sqoop其实并不见得那么好用,反而不如使用可视化界面的kettle(有可能是数据体量限制,这点我至今没想明白sqoop与kettle之间的差异,欢迎指正)。 kettle8.2已经具备使用经验,对接过mysql mssql 等,并且输出到usdp平台的parquet文件,一切正常。之前思路是 业务平台数据--kettle8.2-parquet-hive外部表

2022-10-28 17:20:19 1550 1

原创 python+pandas 从 excel中地址批量获取经纬度后写入excel

python+pandas 从 excel中地址批量获取经纬度后写入excel

2022-10-10 15:16:33 919

原创 presto 查询hive facebook.presto.spi.PrestoException: ....hadoop.mapred.TextInputFormat

om.facebook.presto.spi.PrestoException: Unable to create input format org.apache.hadoop.mapred.TextInputFormat at com.facebook.presto.hive.HiveUtil.getInputFormat(HiveUtil.java:331) at com.facebook.presto.hive.StoragePartitionLoader.loadPartition(Storage

2022-06-15 16:15:48 1061

原创 pentaho bi server 登录出现 Your account has been locked because the number of consecutive log-in failure

Your account has been locked because the number of consecutive log-in failures exceed the maximum allowed.Please contact your administrator for assistance.

2022-05-16 14:27:48 1099

原创 kettle 9.2 在centos下运行时 org.pentaho.di.ui.util.EnvironmentUtils@2b0b7e5a - ERROR (version 9.2.0.0-290

错误如下:2022/05/07 16:25:38 - org.pentaho.di.ui.util.EnvironmentUtils@2b0b7e5a - ERROR (version 9.2.0.0-290, build 9.2.0.0-290 from 2021-06-02 06.36.08 by buildguy) : Could not execute command2022/05/07 16:25:38 - org.pentaho.di.ui.util.EnvironmentUtils@2b

2022-05-07 16:39:21 1644

原创 Hive select count(1) 报错问题困惑和解决

hive入门时,导数据后,执行:select count(1) from info_house_history;报错:hive (real_estate)> select count(1) from info_house_history;Query ID = root_20220427100959_bf6dedc3-acff-4467-812d-45c15226f385Total jobs = 1Launching Job 1 out of 1Number of reduce task

2022-04-27 10:25:30 1940

原创 python 连接hive 安装sasl 遇到的问题 Building wheel for sasl (setup.py) ... error

Building wheel for sasl (setup.py) ... errora\Local\Temp\pip-install-2scxm6jd\sasl_bdd59789a4b54e288cc48a38704a6ad4\sasl\saslwrapper.h(22): fatal error C1083: 无法打开包括文件: “sasl/sasl.h”: No such file or directory

2022-04-24 14:55:41 4903 1

原创 Hive端执行 select count(*) from cdprojectdetail; 出现如下错误:

好不容易搞出了hbase和hive的外链表组合应用。却在 hive端执行select count(*) from cdprojectdetail; 出现如下错误:Query ID = root_20220421173314_ade31c99-1ec5-4419-88c7-997bf8e82577Total jobs = 1Launching Job 1 out of 1Number of reduce tasks determined at compile time: 1In order t..

2022-04-21 17:47:56 2878 2

BI入门实例,SSIS入门实例,SSAS入门实例,SSRS入门实例微软BI,SSIS,SSAS,SSRS实战经验笔记

ssis,ssrs,ssas-6年使用笔记近期整理成册,适合新-初级BI技术和数据分析人员。全实战经验记录从技术选型到如何搭建企业数据平台bi。内容见目录: 开发方案选择 九大数据仓库方案特点 数据仓库方案选择 开发环境配置 安装配置前准备 软件准备 硬件准备 安装配置 数据库安装 VS安装 SSDT安装 开发工具介绍 SSIS开发工具介绍 常用控制流控件用法介绍 SSAS控件用法介绍 SSRS开发工具介绍 开发流程 数据库和表创建 ETL设计(SSIS) 建立连接管理器 SSIS包的创建和开发设计 多维数据模型搭建(SSAS) 新建项目Analysis Services 项目 新建数据源 新建数据源视图 新建维度 新建多维数据集(CUBE) 部署维度和多维数据集 向已有数据集中添加度量和维度 报表创建(SSRS) 新建 Reporting Services 项目和共享数据源 添加共享数据集 普通报表创建和发布 移动报表创建和发布 自动作业设置 数据抽取自动作业设置 多维数据模型部署自动作业 备份与还原 SSIS,SSAS,SSRS备份 报表数据库备份 还原 密钥还原

2022-04-24

好用的phpExcel(最新版1.7.5),提供给到官网下载慢的朋友。

下载一个这个资源,速度那是相当的慢,考虑到其他的朋友也会遇到这样的情况。因此提供出来,希望下载能快点。

2010-12-20

sql server 表数据转移,文件组,文件组数据文件建立

使用文件组解决sql数据文件大的问题。提高对数据文件的访问。

2009-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除