Amazon Athena 是一種交互式查詢服務,可幫助分析在 Amazon S3、 本地或云中運行的關系、非關系、對象和自定義數據來源中存儲的非結構化、半結構化和結構化數據。數據格式包括,CSV、JSON 或Apache Parquet 和 Apache ORC 等列式數據格。
可以使用 ANSI SQL 通過 Athena 運行臨時查詢,而無需將數據聚合或加載到 Athena 中。只需在 AWS Management Console 中執行幾項操作,即可將 Athena 指向 Amazon S3 中存儲的數據,并開始使用標準 SQL 運行臨時查詢,然后在幾秒鐘內獲得結果。
使用 Amazon Athena 可以靈活輕松地分析包含它的 PB 級數據。
Amazon Athena 能夠輕松使用標準 SQL 直接分析 Amazon S3 中的數據。
Amazon Athena 還可使用 Apache Spark 以交互方式輕松運行數據分析,無需規劃、配置或管理資源。在 Athena 上運行 Apache Spark 應用程序時,您需要提交 Spark 代碼以進行處理并直接接收結果。使用 Amazon Athena 控制臺中簡化的筆記本體驗,以通過 Python 或 Athena 筆記本 API 開發 Apache Spark 應用程序。
Amazon Athena 是一項基于開源框架的無服務器交互式分析服務,支持開源表和文件格式。Athena 提供了一種簡化、靈活的方法來分析包含它的 PB 級數據。從 Amazon S3數據湖和超過 30 個數據來源(包括本地數據來源,或使用 SQL 或 Python 的其他云系統)分析數據或構建應用程序。Athena 基于開源 Trino 和 Presto 引擎以及 Apache Spark 框架構建,無需進行預配或配置。
