Hoe wordt datalokalisatie bereikt in Hadoop?
Hoe wordt datalokalisatie bereikt in Hadoop?

Video: Hoe wordt datalokalisatie bereikt in Hadoop?

Video: Hoe wordt datalokalisatie bereikt in Hadoop?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, Mei
Anonim

Gegevenslokalisatie in Hadoop . Neem het voorbeeld van Wordcount, waarbij de meeste woorden 5 Lacs of meer keer zijn herhaald. In dat geval zal elke mapper-uitvoer na de Mapper-fase woorden hebben in het bereik van 5 Lacs. Dit complete proces van het opslaan van Mapper-uitvoer naar LFS wordt genoemd als Gegevenslokalisatie.

Met dit in het achterhoofd, wat is datalokalisatie in Hadoop?

Het concept van Gegevens plaats in Hadoop-gegevens plaats in KaartVerminderen verwijst naar de mogelijkheid om de berekening te verplaatsen naar waar de werkelijke gegevens bevindt zich op het knooppunt, in plaats van groot te verplaatsen gegevens te rekenen. Dit minimaliseert netwerkcongestie en verhoogt de algehele doorvoer van het systeem.

En hoe worden big data opgeslagen? De meeste mensen associëren HDFS, of Hadoop Distributed File System, automatisch met Hadoop gegevens magazijnen. HDFS slaat informatie op in clusters die zijn opgebouwd uit kleinere blokken. Deze blokken zijn opgeslagen fysiek op locatie opslag eenheden, zoals interne schijfstations.

Hoe worden gegevens opgeslagen in Hadoop?

Op een Hadoop cluster, de gegevens binnen HDFS en het MapReduce-systeem zijn ondergebracht op elke machine in het cluster. Gegevens is opgeslagen in gegevens blokken op de DataNodes. HDFS repliceert die gegevens blokken, meestal 128 MB groot, en distribueert ze zodat ze worden gerepliceerd binnen meerdere knooppunten in het cluster.

Hoe worden bestanden opgeslagen in HDFS?

HDFS onthult een het dossier systeemnaamruimte en staat toe dat gebruikersgegevens opgeslagen in bestanden . intern, een het dossier is opgesplitst in een of meer blokken en deze blokken zijn opgeslagen in een set DataNodes. De NameNode wordt uitgevoerd het dossier systeemnaamruimtebewerkingen zoals openen, sluiten en hernoemen bestanden en mappen.

Aanbevolen: