apache iotdb_Apache-IoTDB

IoTDB

简介

IoTDB (Internet of Things Database) 是一个时序数据的数据管理系统,可以为用户提供数据收集、存储和分析等特定的服务。IoTDB由于其轻量级的结构、高性能和可用的特性,以及与Hadoop和Spark生态的无缝集成,满足了工业IoTDB领域中海量数据存储、高吞吐量数据写入和复杂数据分析的需求。

主要特点

IoTDB的主要特点如下:

灵活的部署策略。IoTDB为用户提供了一个在云平台或终端设备上的一键安装工具,以及一个连接云平台和终端上的数据的数据同步工具。

硬件成本低。IoTDB可以达到很高的磁盘存储压缩比。

高效的目录结构。IoTDB支持智能网络设备对复杂时间序列数据结构的高效组织,同类设备对时间序列数据的组织,海量复杂时间序列数据目录的模糊搜索策略。

高吞吐量读写。IoTDB支持数以百万计的低功耗设备的强连接数据访问、高速数据读写,适用于上述智能网络设备和混合设备。

丰富的查询语义。IoTDB支持跨设备和测量的时间序列数据的时间对齐、时间序列字段的计算(频域转换)和时间维度的丰富聚合函数支持。

学习成本非常低。IoTDB支持类似sql的语言、JDBC标准API和易于使用的导入/导出工具。

与先进的开放源码生态系统的无缝集成。IoTDB支持分析生态系统,如Hadoop、Spark和可视化工具(如Grafana)。

目录

快速开始

环境准备

安装

从源码构建

配置

开始

启动 IoTDB

使用 IoTDB

使用 Cli 命令行

基本的 IoTDB 命令

停止 IoTDB

只编译 server

只编译 cli

使用 import-csv.sh

创建元数据

从 csv 文件导入数据的示例

运行 import shell

错误的数据文件

使用 export-csv.sh

运行 export shell

执行查询

快速开始

这篇简短的指南将带您了解使用IoTDB的基本过程。如需更详细的介绍,请访问我们的网站用户指南。

环境准备

要使用IoTDB,您需要:

Java >= 1.8 (目前 1.8、11和13 已经被验证可用。请确保环变量境路径已正确设置)。

Maven >= 3.1 (如果希望从源代码编译和安装IoTDB)。

设置 max open files 为 65535,以避免"too many open files"错误。

安装

IoTDB提供了三种安装方法,您可以参考以下建议,选择最适合您的一种:

从源代码安装。如果需要自己修改代码,可以使用此方法。

从二进制文件安装。推荐的方法是从官方网站下载二进制文件,您将获得一个开箱即用的二进制发布包。

在这篇《快速入门》中,我们简要介绍如何使用源代码安装IoTDB。如需进一步资料,请参阅《用户指南》第3章。

从源码构建

从 git 克隆源代码:

git clone https://github.com/apache/incubator-iotdb.git

默认的主分支是dev分支,如果你想使用某个发布版本x.x.x,请切换分支:

git checkout release/x.x.x

在 incubator-iotdb 根目录下执行 maven 编译:

> mvn clean package -DskipTests

执行完成之后,可以在distribution/target/apache-iotdb-{project.version}-incubating-bin.zip找到编译完成的二进制版本(包括服务器和客户端)

注意:"service-rpc/target/generated-sources/thrift" 和 "server/target/generated-sources/antlr4" 目录需要添加到源代码根中,以免在 IDE 中产生编译错误。

配置

配置文件在"conf"文件夹下

环境配置模块(iotdb-env.bat, iotdb-env.sh),

系统配置模块(iotdb-engine.properties)

日志配置模块(logback.xml)。

开始

您可以通过以下步骤来测试安装,如果执行后没有返回错误,安装就完成了。

启动 IoTDB

可以通过运行 sbin 文件夹下的 start-server 脚本启动 IoTDB。

# Unix/OS X

> sbin/start-server.sh -c -rpc_port

# Windows

> sbin\start-server.bat -c -rpc_port

"-c" and "-rpc_port" 都是可选的。

选项 "-c" 指定了配置文件所在的文件夹。

选项 "-rpc_port" 指定了启动的 rpc port。

如果两个选项同时指定,那么rpc_port将会覆盖conf_path下面的配置。

使用 IoTDB

使用 Cli 命令行

IoTDB提供了与服务器交互的不同方式,这里我们将介绍使用 Cli 工具插入和查询数据的基本步骤。

安装 IoTDB 后,有一个默认的用户root,它的默认密码也是root。用户可以使用这个

默认用户登录 Cli 并使用 IoTDB。Cli 的启动脚本是 sbin 文件夹中的 start-cli 脚本。

在执行脚本时,用户应该指定 IP,端口,USER_NAME 和 密码。默认参数为-h 127.0.0.1 -p 6667 -u root -pw root。

下面是启动 Cli 的命令:

# Unix/OS X

> sbin/start-cli.sh -h 127.0.0.1 -p 6667 -u root -pw root

# Windows

> sbin\start-cli.bat -h 127.0.0.1 -p 6667 -u root -pw root

命令行客户端是交互式的,所以如果一切就绪,您应该看到欢迎标志和声明:

_____ _________ ______ ______

|_ _| | _ _ ||_ _ `.|_ _ \

| | .--.|_/ | | \_| | | `. \ | |_) |

| | / .'`\ \ | | | | | | | __'.

_| |_| \__. | _| |_ _| |_.' /_| |__) |

|_____|'.__.' |_____| |______.'|_______/ version x.x.x

IoTDB> login successfully

IoTDB>

基本的 IoTDB 命令

现在,让我们介绍创建 timeseries、插入数据和查询数据的方法。

IoTDB中的数据组织为 timeseries。每个 timeseries 包含多个数据-时间对,由一个存储组拥有。

在定义 timeseries 之前,我们应该先使用SET storage group来定义一个存储组,下面是一个例子:

IoTDB> SET STORAGE GROUP TO root.ln

我们也可以使用SHOW STORAGE GROUP来检查正在创建的存储组:

IoTDB> SHOW STORAGE GROUP

+-----------------------------------+

| Storage Group|

+-----------------------------------+

| root.ln|

+-----------------------------------+

storage group number = 1

在设置存储组之后,我们可以使用CREATE TIMESERIES来创建一个新的TIMESERIES。

在创建 timeseries 时,我们应该定义它的数据类型和编码方案。这里我们创建两个 timeseries:

IoTDB> CREATE TIMESERIES root.ln.wf01.wt01.status WITH DATATYPE=BOOLEAN, ENCODING=PLAIN

IoTDB> CREATE TIMESERIES root.ln.wf01.wt01.temperature WITH DATATYPE=FLOAT, ENCODING=RLE

为了查询特定的timeseries,我们可以使用 SHOW TIMESERIES . 表示被查询的 timeseries 的路径. 默认值是null, 表示查询系统中所有的 timeseries (同SHOW TIMESERIES root).

以下是一些示例:

查询系统中所有 timeseries:

IoTDB> SHOW TIMESERIES

+-------------------------------+---------------+--------+--------+

| Timeseries| Storage Group|DataType|Encoding|

+-------------------------------+---------------+--------+--------+

| root.ln.wf01.wt01.status| root.ln| BOOLEAN| PLAIN|

| root.ln.wf01.wt01.temperature| root.ln| FLOAT| RLE|

+-------------------------------+---------------+--------+--------+

Total timeseries number = 2

查询指定的 timeseries(root.ln.wf01.wt01.status):

IoTDB> SHOW TIMESERIES root.ln.wf01.wt01.status

+------------------------------+--------------+--------+--------+

| Timeseries| Storage Group|DataType|Encoding|

+------------------------------+--------------+--------+--------+

| root.ln.wf01.wt01.status| root.ln| BOOLEAN| PLAIN|

+------------------------------+--------------+--------+--------+

Total timeseries number = 1

插入 timeseries 数据是IoTDB的一个基本操作,你可以使用INSERT 命令来完成这个操作。

在插入之前,您应该指定时间戳和后缀路径名:

IoTDB> INSERT INTO root.ln.wf01.wt01(timestamp,status) values(100,true);

IoTDB> INSERT INTO root.ln.wf01.wt01(timestamp,status,temperature) values(200,false,20.71)

你刚才插入的数据会显示如下:

IoTDB> SELECT status FROM root.ln.wf01.wt01

+-----------------------+------------------------+

| Time|root.ln.wf01.wt01.status|

+-----------------------+------------------------+

|1970-01-01T08:00:00.100| true|

|1970-01-01T08:00:00.200| false|

+-----------------------+------------------------+

Total line number = 2

您还可以使用一条SQL语句查询多个 timeseries 数据:

IoTDB> SELECT * FROM root.ln.wf01.wt01

+-----------------------+--------------------------+-----------------------------+

| Time| root.ln.wf01.wt01.status|root.ln.wf01.wt01.temperature|

+-----------------------+--------------------------+-----------------------------+

|1970-01-01T08:00:00.100| true| null|

|1970-01-01T08:00:00.200| false| 20.71|

+-----------------------+--------------------------+-----------------------------+

Total line number = 2

你可以使用如下命令退出:

IoTDB> quit

or

IoTDB> exit

有关IoTDB SQL支持的命令的更多信息,请参见Chapter 5: IoTDB SQL文档。

停止 IoTDB

server 可以使用 "ctrl-C" 或者执行下面的脚本:

# Unix/OS X

> sbin/stop-server.sh

# Windows

> sbin\stop-server.bat

只编译 server

在 incubator-iotdb 根目录下执行:

> mvn clean package -pl server -am -DskipTests

编译完成后, IoTDB server 将生成在: "server/target/iotdb-server-{project.version}".

只编译 cli

在 incubator-iotdb 根目录下执行:

> mvn clean package -pl cli -am -DskipTests

编译完成后, IoTDB cli 将生成在 "cli/target/iotdb-cli-{project.version}".

使用 import-csv.sh

创建元数据

SET STORAGE GROUP TO root.fit.d1;

SET STORAGE GROUP TO root.fit.d2;

SET STORAGE GROUP TO root.fit.p;

CREATE TIMESERIES root.fit.d1.s1 WITH DATATYPE=INT32,ENCODING=RLE;

CREATE TIMESERIES root.fit.d1.s2 WITH DATATYPE=TEXT,ENCODING=PLAIN;

CREATE TIMESERIES root.fit.d2.s1 WITH DATATYPE=INT32,ENCODING=RLE;

CREATE TIMESERIES root.fit.d2.s3 WITH DATATYPE=INT32,ENCODING=RLE;

CREATE TIMESERIES root.fit.p.s1 WITH DATATYPE=INT32,ENCODING=RLE;

从 csv 文件导入数据的示例

Time,root.fit.d1.s1,root.fit.d1.s2,root.fit.d2.s1,root.fit.d2.s3,root.fit.p.s1

1,100,'hello',200,300,400

2,500,'world',600,700,800

3,900,'IoTDB',1000,1100,1200

运行 import shell

# Unix/OS X

> tools/import-csv.sh -h -p -u -pw -f

# Windows

> tools\import-csv.bat -h -p -u -pw -f

错误的数据文件

csvInsertError.error

使用 export-csv.sh

运行 export shell

# Unix/OS X

> tools/export-csv.sh -h -p -u -pw -td [-tf ]

# Windows

> tools\export-csv.bat -h -p -u -pw -td [-tf ]

执行查询

select * from root.fit.d1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值