Wat is AWS MapReduce?
Wat is AWS MapReduce?

Video: Wat is AWS MapReduce?

Video: Wat is AWS MapReduce?
Video: Introduction to Amazon Elastic MapReduce 2024, Mei
Anonim

Amazon Elastic KaartVerminderen (EMR) is een Amazon Web Services ( AWS ) tool voor het verwerken en analyseren van big data. Amazon EMR verwerkt big data via een Hadoop-cluster van virtuele servers op Amazon Elastic Compute Cloud (EC2) en Amazon Simple Storage Service (S3).

Hoe werkt AWS EMR op deze manier?

De service start een door de klant gespecificeerd aantal Amazon EC2-instanties, bestaande uit één master en meerdere andere knooppunten. Amazone EMR draait Hadoop-software op deze instanties. Het hoofdknooppunt verdeelt invoergegevens in blokken en verdeelt de verwerking van de blokken naar de andere knooppunten.

Wat is naast het bovenstaande het verschil tussen ec2 en EMR? in tegenstelling tot EMR , EC2 categoriseert slave-knooppunten niet in kern- en taakknooppunten. Dit verhoogt het risico op verlies van HDFS-gegevens in het geval dat een knooppunt wordt verwijderd/verloren. EC2 gebruikt Apache-bibliotheken (s3a) om toegang te krijgen tot gegevens op s3. Anderzijds, EMR gebruikt AWS-eigen code om sneller toegang te krijgen tot s3.

Trouwens, wordt AWS EMR volledig beheerd?

Amazone Elastische kaartVerminderen ( EMR ) is een volledig beheerd Hadoop en Spark platform van Amazone Webservice ( AWS ). Met EMR , AWS klanten kunnen snel Hadoop-clusters met meerdere knooppunten opstarten om big data-workloads te verwerken.

Gebruikt AWS Hadoop?

Amazone Webservices toepassingen de open source Apache Hadoop gedistribueerde computertechnologie om het gemakkelijker te maken om toegang te krijgen tot grote hoeveelheden rekenkracht om gegevensintensieve taken uit te voeren. Hadoop , de open-sourceversie van Google's MapReduce, wordt al gebruikt door bedrijven als Yahoo en Facebook.

Aanbevolen: