打印

如何通过ETL把StarRocks中的数据同步到数仓

[复制链接]
312|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
ETLCloud|  楼主 | 2025-6-26 17:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
在数据驱动决策的时代,企业对于数据处理和分析的需求日益增加。ETL作为数据处理的核心环节,扮演着将原始数据转化为有价值信息的关键角色。而StarRocks作为一款极速全场景MPP(Massively Parallel Processing)企业级数据库产品,凭借其创新的架构设计与卓越的性能表现,正成为企业实现高效数据处理与实时分析的优选方案。那如何通过ETL工具把StarRocks中的数据同步到数仓呢?接下来我们通过实操演示下过程。
一、StarRocks数据同步到Doris演示
新建数据源创建StarRocks源数据库:
进入数据源管理选择新建数据源,在数据源中找到StarRocks进行创建。
填写StarRocks相关配置
新建数据源创建Doris源数据库:
Doris数据源创建步骤和上述相同
新建流程
新建流程,在流程中配置库表输入组件和doris输出组件,没有组件的需要前往官网购买。库表输入用于读取StarRocks数据,Doris输出用于往Doris中同步数据。
配置库表输入组件,只需选择刚才创建的数据源和数据源中表。当前表中有30万条数据。
选中表后会默认生成查询语句,也可以更具需要更改语句。后续的输入字段也会自动识别。
配置Doris快速输出组件,同样的Doris选择数据源和目标表。
同时使用了自动建表功能在目标端Doris数据库中自动创建表。
在路由线中开启5个并发线程优化同步速度
执行流程并查看结果

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

174

主题

174

帖子

0

粉丝