TPC-DS (2012)
类似于 Star Schema Benchmark (SSB),TPC-DS 基于 TPC-H,但采取了相反的路线,即通过存储在复杂的雪花模式中扩展所需的连接数(24 个表而不是 8 个表)。数据分布是不均匀的(例如,正态分布和泊松分布)。它包含 99 个带有随机替换的报告和即席查询。
参考文献
- TPC-DS 的制作 (Nambiar), 2006
首先,检查 TPC-DS 存储库并编译数据生成器:
然后,生成数据。参数 -scale
指定了比例因子。
接下来,生成查询(使用相同的比例因子):
现在在 ClickHouse 中创建表。您可以使用 tools/tpcds.sql 中的原始表定义,或者使用经过“调优”的表定义,在适当的地方正确定义主键索引和 LowCardinality 类型的列类型。
数据可以如下导入:
然后运行生成的查询。
危险
TPC-DS 大量使用相关子查询,而在撰写本文时(2024 年 9 月),ClickHouse 不支持这些查询 (issue #6697)。因此,上述许多基准查询将因错误而失败。