Amazon EMR是一個(gè)托管集群平臺(tái),可簡(jiǎn)化大數(shù)據(jù)框架的運(yùn)行。Amazon EMR 以前稱為 Amazon Elastic MapReduce,這是它的名稱的由來。
Amazon EMR 是一種 Web 服務(wù),可以輕松高效地處理大量數(shù)據(jù)。Amazon EMR支持多種開源工具,如Apache Spark、Apache Hadoop、Apache Hive、Apache HBase、Apache Flink、Apache Hudi和Presto,用于處理海量數(shù)據(jù)。
Amazon EMR使用這些開源框架和相關(guān)的開源項(xiàng)目,進(jìn)行 PB 級(jí)數(shù)據(jù)處理、交互分析和機(jī)器學(xué)習(xí)。可以處理用于分析目的的數(shù)據(jù)和業(yè)務(wù)情報(bào)工作負(fù)載。Amazon EMR 還允許轉(zhuǎn)換大量數(shù)據(jù)并移出/移入到其它 AWS 數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)庫中,例如 Amazon Simple Storage Service(Amazon S3)和 Amazon DynamoDB。
Amazon EMR 簡(jiǎn)化了大數(shù)據(jù)環(huán)境和應(yīng)用程序的構(gòu)建和操作。EMR 相關(guān)功能包括易于預(yù)置、托管擴(kuò)展和重新配置集群,以及用于協(xié)作開發(fā)的 EMR Studio。Amazon EMR 能夠快速、輕松地預(yù)配置所需的容量,以及自動(dòng)或手動(dòng)添加和移除容量。
