CassandraWriter 插件文档
1 快速介绍
CassandraWriter插件实现了向Cassandra写入数据。在底层实现上,CassandraWriter通过datastax的java driver连接Cassandra实例,并执行相应的cql语句将数据写入cassandra中。
2 实现原理
简而言之,CassandraWriter通过java driver连接到Cassandra实例,并根据用户配置的信息生成INSERT CQL语句,然后发送到Cassandra。
对于用户配置Table、Column的信息,CassandraReader将其拼接为CQL语句发送到Cassandra。
3 功能说明
3.1 配置样例
- 配置一个从内存产生到Cassandra导入的作业:
{
  "job": {
    "setting": {
      "speed": {
        "channel": 5
      }
    },
    "content": [
      {
        "reader": {
          "name": "streamreader",
          "parameter": {
            "column": [
              {"value":"name","type": "string"},
              {"value":"false","type":"bool"},
              {"value":"1988-08-08 08:08:08","type":"date"},
              {"value":"addr","type":"bytes"},
              {"value":1.234,"type":"double"},
              {"value":12345678,"type":"long"},
              {"value":2.345,"type":"double"},
              {"value":3456789,"type":"long"},
              {"value":"4a0ef8c0-4d97-11d0-db82-ebecdb03ffa5","type":"string"},
              {"value":"value","type":"bytes"},
              {"value":"-838383838,37377373,-383883838,27272772,393993939,-38383883,83883838,-1350403181,817650816,1630642337,251398784,-622020148","type":"string"},
            ],
           "sliceRecordCount": 10000000
          }
        },
        "writer": {
          "name": "cassandrawriter",
          "parameter": {
            "host": "localhost",
            "port": 9042,
            "useSSL": false,
            "keyspace": "stresscql",
            "table": "dst",
            "batchSize":10,
            "column": [
              "name",
              "choice",
              "date",
              "address",
              "dbl",
              "lval",
              "fval",
              "ival",
              "uid",
              "value",
              "listval"
            ]
          }
        }
      }
    ]
  }
}
3.2 参数说明
- 
host - 
描述:Cassandra连接点的域名或ip,多个node之间用逗号分隔。 
- 
必选:是 
- 
默认值:无 
 
- 
- 
port - 
描述:Cassandra端口。 
- 
必选:是 
- 
默认值:9042 
 
- 
- 
username - 
描述:数据源的用户名 
- 
必选:否 
- 
默认值:无 
 
- 
- 
password - 
描述:数据源指定用户名的密码 
- 
必选:否 
- 
默认值:无 
 
- 
- 
useSSL - 
描述:是否使用SSL连接。 
- 
必选:否 
- 
默认值:false 
 
- 
- 
connectionsPerHost - 
描述:客户端连接池配置:与服务器每个节点建多少个连接。 
- 
必选:否 
- 
默认值:8 
 
- 
- 
maxPendingPerConnection - 
描述:客户端连接池配置:每个连接最大请求数。 
- 
必选:否 
- 
默认值:128 
 
- 
- 
keyspace - 
描述:需要同步的表所在的keyspace。 
- 
必选:是 
- 
默认值:无 
 
- 
- 
table - 
描述:所选取的需要同步的表。 
- 
必选:是 
- 
默认值:无 
 
- 
- 
column - 
描述:所配置的表中需要同步的列集合。 内容可以是列的名称或"writetime()"。如果将列名配置为writetime(),会将这一列的内容作为时间戳。 
- 
必选:是 
- 
默认值:无 
 
- 
- 
consistancyLevel - 
描述:数据一致性级别。可选ONE|QUORUM|LOCAL_QUORUM|EACH_QUORUM|ALL|ANY|TWO|THREE|LOCAL_ONE 
- 
必选:否 
- 
默认值:LOCAL_QUORUM 
 
- 
- 
batchSize - 
描述:一次批量提交(UNLOGGED BATCH)的记录数大小(条数)。注意batch的大小有如下限制: (1)不能超过65535。 (2) batch中的内容大小受到服务器端batch_size_fail_threshold_in_kb的限制。 (3) 如果batch中的内容超过了batch_size_warn_threshold_in_kb的限制,会打出warn日志,但并不影响写入,忽略即可。 如果批量提交失败,会把这个批量的所有内容重新逐条写入一遍。 
- 
必选:否 
- 
默认值:1 
 
- 
3.3 类型转换
目前CassandraReader支持除counter和Custom类型之外的所有类型。
下面列出CassandraReader针对Cassandra类型转换列表:
| DataX 内部类型 | Cassandra 数据类型 | 
|---|---|
| Long | int, tinyint, smallint,varint,bigint,time | 
| Double | float, double, decimal | 
| String | ascii,varchar, text,uuid,timeuuid,duration,list,map,set,tuple,udt,inet | 
| Date | date, timestamp | 
| Boolean | bool | 
| Bytes | blob | 
请注意:
- 目前不支持counter类型和custom类型。
4 性能报告
略
5 约束限制
5.1 主备同步数据恢复问题
略