跳到主要内容
跳到主要内容

TPC-DS (2012)

类似于 Star Schema Benchmark (SSB),TPC-DS 基于 TPC-H,但采取了相反的路线,即通过存储在复杂的雪花模式中扩展所需的连接数(24 个表而不是 8 个表)。数据分布是不均匀的(例如,正态分布和泊松分布)。它包含 99 个带有随机替换的报告和即席查询。

参考文献

首先,检查 TPC-DS 存储库并编译数据生成器:

然后,生成数据。参数 -scale 指定了比例因子。

接下来,生成查询(使用相同的比例因子):

现在在 ClickHouse 中创建表。您可以使用 tools/tpcds.sql 中的原始表定义,或者使用经过“调优”的表定义,在适当的地方正确定义主键索引和 LowCardinality 类型的列类型。

数据可以如下导入:

然后运行生成的查询。

危险

TPC-DS 大量使用相关子查询,而在撰写本文时(2024 年 9 月),ClickHouse 不支持这些查询 (issue #6697)。因此,上述许多基准查询将因错误而失败。