1. 内容概述

本文针对各种数据集和数据模型的特点进行总结，并给出一些选型建议供您参考。

2. 推送型

瞬时数据分析，实时数据刷新。

通过驻留时间的设置实现对数据的流式处理，配合仪表板的实时刷新功能可达到实时刷新仪表板大屏的效果。

推送数据集一直累积历史数据，所以更适合分析历史感较强的长时间段的数据走势，当数据刷新时显示实时数据。

综上，对实时性要求不高的历史数据分析时，更推荐使用缓存数据集。

直连模型和抽取模型有很多相似之处：

都是使用现有数据构建数据模型。能够自动携带源数据库的关系，可以自动添加关联的表。
数据模型（直连模型&抽取模型）尤其适合多租户用户场景。因为多租户/多组织上下文的情况，使用数据集的话会生成不同租户/上下文下的数据集，存储数据的成本会较高。所以此种需求时，建议您使用数据模型，仅创建一个数据模型即可满足多租户/多组织上下文的情况。
另外，数据模型（直连模型&抽取模型）还有一个非常重要的应用场景。
当数据来源是以上几种数据模型可用的数据库之一时，如果需要在同一仪表板中展示同一个度量值在不同维度表中的表现，建议您使用数据模型。
因为如果使用数据集的话，需要分别创建2个不同的数据集才能实现正确结果的输出；而使用数据模型的话，只需创建一个数据模型即可，更加方便。

虽然都是数据模型，但由于一个是直连数据库，另一个是抽取缓存模式，所以两者的区别也非常明显，以下解析两者之间的区别，供您在选择时参考。

直连模型直连数据库，直接连接数据库实时查询数据库的数据并返回结果。
但数据模型仅支持部分数据库类型，如Oracle、SQL Server、Mysql、Postgres、TimeScale、AnalyticDB、MariaDB、BigQuery、DB2以及Web JSON 等。所以当您的数据来源是这些数据源之外时，则不能使用直连模型。
由于数据模型是基于直连模式，所以完全依赖数据库自身的能力，查询性能以及交互速度较数据集会稍弱一些。
但也正是因为它直连数据库，所以数据实时更新，数据结构更加灵活，常用于已有数据仓库和实时性要求较高的数据分析。

缓存模式中用户无需知道两个表的具体关联关系（如LEFT JOIN 或 RIGHT JOIN等）即可建立多表关联的数据模型；COT模式即缓存数据集中，用户需要自行选择是哪一种关联关系。
缓存模式在缓存数据库中建立多个表来缓存所需数据；COT模式即缓存数据集在缓存数据库建立一个宽表缓存所需数据，表中可以体现出源表之间的关系。
缓存模式与使用数据的场景（仪表板，报表）松耦合；COT模式即缓存数据集与使用数据的场景（仪表板，报表）高耦合。