2023年的金秋十月,不仅有着举国欢庆双节的热闹,同时也是偶数及其行业客户收获产品迭代成果的时节。10月13日, 偶数科技发布了最新的实时湖仓数据平台Skylab 5.4版本。其中,云原生分布式数据库OushuDB、数据分析与应用平台Kepler、数据资产管理平台Orbit、数据工厂Wasp、数据开发与调度平台Flow、系统管理软件Lava,在本次的新版本升级中都进行了迭代更新。
接下来让我们一起了解下Skylab 5.4各组件的更新情况。
云原生分布式数据库OushuDB 5.3更新
OushuDB 5.3支持Native ORC格式在线增量备份恢复。相较于全量备份恢复,增量备份恢复减少了备份和恢复时间,提供更快的数据恢复速度。同时,相对于传统的离线备份(需要停止数据库服务),在线备份减少了停机时间。这对于需要高可用性和7*24运行的业务至关重要。行业客户对数据平台的安全性愈发看中,在线增量备份恢复变得越来越必要,它在保障数据安全的同时,降低平台维护成本,减少业务干扰,提高系统可用性。
支持历史SQL监控功能。历史SQL监控可以跟踪和分析数据库中执行的SQL查询和事务的性能。通过监控历史查询的执行计划、响应时间和资源消耗等指标,DBA可以识别潜在的性能瓶颈,从而采取适当的优化措施,提高数据库性能。
新版本的默认权限功能可以为指定的用户和schema设置新建对象(表、视图、函数、序列)的默认权限。因此,指定用户或者在指定schema创建对象时,会自动添加权限信息,而无需再手动授权。尤其是进行大范围、多对象的权限管理时,默认权限这一功能有效降低用户权限管理的时间成本和操作代价。
OushuDB 5.3实现分区列DISTINCT性能优化,这意味着在执行DISTINCT查询时,不再需要扫描子表全部的数据,大幅减少数据扫描的数量,提高查询性能,实现毫秒级返回复杂查询结果。
Hive External Catalog新增对Description的支持。同时,在过往版本对Hive表只读的基础上,支持同时访问Hive中多个不同Database,实现多表关联计算,为用户提供更便捷的查询方式。
OushuDB的客户端工作簿Worksheet在本次升级中对性能、功能和交互体验都做了进一步优化。例如,查询结果列可拖拽、导出查询结果带表头、热键/别名、资源队列的切换等。
数据分析与应用平台Kepler 4.1更新
从4.0版本到4.1版本,Kepler报表开发、指标开发、可视化、平台服务等核心模块都进行了更新。
报表开发模块新增整体样式、撤销/重做、隐藏行/列、冻结滚动、参数跳转功能,提高了报表设计的灵活性和效率,让用户可以创建更吸引人的报表。
数据可视化模块新增多种图表类型和地图配置属性。通过增加了数据呈现的多样性,帮助用户更清晰地分析数据。
平台服务模块新增实时指标服务和数据服务详情页升级,提供了实时数据分析的能力,帮助用户更及时地做出业务决策。
指标开发模块新增SQL指标占位符、字段列表编辑、关联关系、空值过滤、自定义度量等功能,简化指标开发过程,加快数据分析流程,提高数据质量。
此外,Kepler增加了权限控制和血缘图节点数据下载功能,提供了更好的安全性和数据追溯功能。支持复杂限定条件操作符in/not in,提升了数据查询的灵活性,更容易筛选目标数据。
数据工厂Wasp 5.4更新
Wasp 5.4从容错、易用性角度做了更新和优化。
Kafka、文件类数据源支持忽略大小写,可以确保字段匹配和比对时不受大小写的影响,从而提高数据一致性避免了大小写差异导致的匹配错误;支持跳过脏数据,排除格式错误、无效或不完整的数据防止脏数据对后续处理和分析造成干扰,保持数据质量。
支持数据同步对象的重新映射,在数据源或者目标表结构有变化的情况下,允许将重新修改源与目标表的字段映射,降低运维复杂度。
此外,Wasp 5.4还支持任务、文件夹的移动;优化了指标监控;支持显示源表的主键信息。总体而言,新版 Wasp 的健壮性进一步提高,其新功能和易用性将帮助用户有效降低运维成本。