一 业务介绍
二 业务挑战
三 递四方实时数仓之路
1 实时数仓1.0

2 实时数仓2.0

第一条路径是:通过DTS把Binlog数据同步到DataHub,然后使用Flink从DataHub中消费数据,把计算结果存储在Hologres中,这条路径主要是用于计算一些访问频率高且数据量大的数据,比如待揽收单量、入库单量、待完成单量等。
第二条路径是:业务系统的Binlog数据通过DataWorks同步到Hologres中。Hologres中分了3层,ODS层用于存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。一般情况下,以增量的方式从业务系统导入到ODS层,数据模型和粒度都与业务系统保持一致。DWD层数据明细层,对ODS层数据进行清洗。DWS为汇总层,主要存放宽表。这里主要是考虑到粒度的不一样,在Hologres中多表连接查询能够发挥其最大的作用。整个架构的任务调度依赖于DataWorks。
四 递四方与实时数仓Hologres
1 为什么选择Hologres
第一是Hologres的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。
第二是Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统pangu中(类比开源HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时Hologres支持异构数据源交互分析以及离线数据和实时数据的联邦查询,Hologres已经和MaxCompute无缝打通,能够直接在Hologres中加速查询MaxCompute离线表。
第三是维护成本低、运行稳定,Hologres作为实时数仓存储成本大约是ADB的1/3。资源灵活性高,可以像MaxCompute一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。
2 Hologres应用场景


3 Hologres目前的不足
五 业务价值
Cassandra数据库入门与实战
为了更好地将阿里云的数据库技术能力回馈给开发者,和百万开发者共同成长。阿里云联合Cassandra商业公司DataStax打造了本课程,邀请中美知名数据库技术专家共同授课,带你上手Cassandra,训练营涵盖Cassandra分布式数据库、大数据分析、AI等多个前沿领域,让我们一起探索云计算与AI浪潮下的下一个职业风口,也让你在MySQL、PG、MongoDB等数据库基础上,加持海量扩展的分布式数据库技能。