TSDBWriter 插件文档

1 快速介绍

TSDBWriter 插件实现了将数据点写入到阿里巴巴自研 TSDB 数据库中（后续简称 TSDB）。

时间序列数据库（Time Series Database , 简称 TSDB）是一种高性能，低成本，稳定可靠的在线时序数据库服务；提供高效读写，高压缩比存储、时序数据插值及聚合计算，广泛应用于物联网（IoT）设备监控系统，企业能源管理系统（EMS），生产安全监控系统，电力检测系统等行业场景。 TSDB 提供百万级时序数据秒级写入，高压缩比低成本存储、预降采样、插值、多维聚合计算，查询结果可视化功能；解决由于设备采集点数量巨大，数据采集频率高，造成的存储成本高，写入和查询分析效率低的问题。更多关于 TSDB 的介绍，详见阿里云 TSDB 官网。

2 实现原理

通过 HTTP 连接 TSDB 实例，并通过 /api/put 接口将数据点写入。关于写入接口详见 TSDB 的接口说明文档。

3 功能说明

3.1 配置样例

配置一个从 OpenTSDB 数据库同步抽取数据到 TSDB：

{
  "job": {
    "content": [
      {
        "reader": {
          "name": "opentsdbreader",
          "parameter": {
            "endpoint": "http://localhost:4242",
            "column": [
              "m"
            ],
            "startTime": "2019-01-01 00:00:00",
            "endTime": "2019-01-01 03:00:00"
          }
        },
        "writer": {
          "name": "tsdbhttpwriter",
          "parameter": {
            "endpoint": "http://localhost:8242"
          }
        }
      }
    ],
    "setting": {
      "speed": {
        "channel": 1
      }
    }
  }
}

3.2 参数说明

name
- 描述：本插件的名称
- 必选：是
- 默认值：tsdbhttpwriter
parameter
- endpoint
  - 描述：TSDB 的 HTTP 连接地址
  - 必选：是
  - 格式：http://IP:Port
  - 默认值：无
batchSize
- 描述：每次批量数据的条数
- 必选：否
- 格式：int，需要保证大于 0
- 默认值：100
maxRetryTime
- 描述：失败后重试的次数
- 必选：否
- 格式：int，需要保证大于 1
- 默认值：3
ignoreWriteError
- 描述：如果设置为 true，则忽略写入错误，继续写入；否则，多次重试后仍写入失败的话，则会终止写入任务
- 必选：否
- 格式：bool
- 默认值：false

3.3 类型转换

DataX 内部类型	TSDB 数据类型
String	TSDB 数据点序列化字符串，包括 timestamp、metric、tags 和 value

4 性能报告

4.1 环境准备

4.1.1 数据特征

从 Metric、时间线、Value 和采集周期四个方面来描述：

metric

固定指定一个 metric 为 m。

tagkv

前四个 tagkv 全排列，形成 10 * 20 * 100 * 100 = 2000000 条时间线，最后 IP 对应 2000000 条时间线从 1 开始自增。

tag_k	tag_v
zone	z1~z10
cluster	c1~c20
group	g1~100
app	a1~a100
ip	ip1~ip2000000

value

度量值为 [1, 100] 区间内的随机值

interval

采集周期为 10 秒，持续摄入 3 小时，总数据量为 3 * 60 * 60 / 10 * 2000000 = 2,160,000,000 个数据点。

4.1.2 机器参数

TSDB Writer 机型: 64C256G

HBase 机型： 8C16G * 5

4.1.3 DataX jvm 参数

“-Xms4096m -Xmx4096m”

4.2 测试报告

通道数	DataX 速度 (Rec/s)	DataX 流量 (MB/s)
1	129753	15.45
2	284953	33.70
3	385868	45.71

5 约束限制

5.1 目前只支持兼容 TSDB 2.4.x 及以上版本

其他版本暂不保证兼容