今年,在 re:Invent 2022 大会上,AWS 对其分析和数据管理功能进行了大量介绍。从主题演讲到整周的会议,Amazon Redshift、AWS Glue、Amazon QuickSight 和许多其他服务都发布了重要公告。我们在此简要总结了此次活动的亮点。
Amazon Redshift 公告
AWS 正在提供零 ETL Amazon Aurora 和 Amazon Redshift 集成,以支持近乎实时地访问这些交易数据。此功能目前处于有限预览阶段。
Amazon Redshift 正在扩展其 SQL 功能,支持 MERGE、ROLLUP、CUBE 和 GROUPING SETS,旨在促进数据仓库迁移。此功能目前处于预览阶段。
Amazon Kinesis Data Streams 和 Amazon Managed Streaming for Apache Kafka 的实时流式传输提取功能现已正式适用于 Redshift。
Amazon Redshift 的动态数据屏蔽支持目前处于预览阶段。
Apache Spark 的 Amazon Redshift 集成简化了在 Apache Spark 应用程序中使用 Redshift 的流程。
AWS Backup 现在支持 Amazon Redshift,允许您安排和恢复手动 Redshift 快照。
自动将 Amazon S3 数据复制到 Redshift 数据仓库中,以便持续加载数据。此功能目前处于预览阶段。
在多可用区部署中运行 Amazon Redshift RA3 集群,以扩展灾难 中国电报数据 恢复。此功能目前处于预览阶段。
AWS Glue 公告
AWS Glue 4.0 已推出,它增加了更多数据格式、更新的引擎、Ray 支持以及许多其他功能。
AWS Glue for Apache Spark增加了对多个开源数据湖存储框架的支持。其中包括 Linux Foundation Delta Lake、Apache Iceberg 和 Apache Hudi。
通过AWS Glue 自定义可视化转换定义、重用并与您的团队共享特定于业务的提取、转换、加载逻辑。
AWS Glue 数据质量可自动测数据管道的质量,并据此提供数据质量建议。此功能目前处于预览阶段。
Amazon QuickSight 公告
AWS扩展了 Amazon QuickSight API 功能,以支持 DevOps 自动化和迁移加速。此功能现已正式推出。
您现在可以在 Amazon QuickSight 中创建分页报告,这让您可以使用详细运营数据的自定义格式来创建多页报告。此功能已正式推出。
其他 AWS 数据管理和分析公告
Amazon DataZone是一项预览版的全新数据管理服务,它提供受管控的分析功能,可“跨组织边界大规模共享、搜索和发现数据”。
Amazon OpenSearch 现在提供名为Amazon OpenSearch Serverless的无服务器选项。此服务目前处于预览阶段。作为此版本的一部分,Amazon Kinesis Data Firehose 现在支持 OpenSearch Serverless 的数据流传输。
Amazon Athena 现已支持 Apache Spark。
随着我们进入 2023 年,AWS 上的数据管理看起来将非常令人兴奋。想讨论如何最好地利用这些新功能从数据中获取更多价值?请联系我们以与我们的 AWS 和数据管理专家联系。