Wat is DistCp in Hadoop?
Wat is DistCp in Hadoop?

Video: Wat is DistCp in Hadoop?

Video: Wat is DistCp in Hadoop?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, Mei
Anonim

DistCp (gedistribueerde kopie) is een tool die wordt gebruikt voor grote inter/intra-cluster kopiëren. Het gebruikt KaartVerminderen om de distributie, foutafhandeling en herstel, en rapportage te bewerkstelligen. Het breidt een lijst met bestanden en mappen uit naar invoer om taken toe te wijzen, die elk een partitie van de bestanden die in de bronlijst zijn gespecificeerd, kopiëren.

Evenzo kan men zich afvragen, overschrijft Distcp?

Ik zou ook wat moeten uitwerken en dat uitleggen distcp - overschrijven zullen overschrijven het bestand, ongeacht of de grootte overeenkomt of niet. Hiermee worden alle bestanden in hdfs-nn2 bijgewerkt die qua grootte niet overeenkomen met hdfs-nn1, en worden alle externe bestanden verwijderd.

Evenzo, wat is het Hadoop FS-commando? Het bestandssysteem ( FS ) shell bevat verschillende shell-achtige commando's die rechtstreeks in wisselwerking staan met de Hadoop Gedistribueerd bestandssysteem ( HDFS ) evenals andere bestandssystemen die Hadoop ondersteunt, zoals Local FS , HFTP FS , S3 FS , en anderen.

Hoe breng ik op deze manier gegevens over van de ene Hdfs naar de andere Hdfs?

Hadoop fs cp – Gemakkelijkste manier om gegevens van een te kopiëren bronmap naar een ander . Gebruik de hadoop fs -cp [bron] [bestemming]. Hadoop fs copyFromLocal – Noodzaak om gegevens kopiëren van lokaal bestandssysteem naar HDFS ? Gebruik de hadoop fs -copyFromLocal [bron] [bestemming].

Hoe kopieer ik een cluster van het ene cluster naar het andere?

Bestanden kopiëren tussen clusters . Jij kan bestanden kopiëren of mappen tussen verschillende clusters door de opdracht hadoop distcp te gebruiken. U moet een inloggegevens toevoegen het dossier in uw kopiëren verzoek dus de bron TROS kan valideren dat u bent geauthenticeerd bij de bron TROS en het doelwit TROS.

Aanbevolen: