Inhoudsopgave:

Hoe plan ik een bijenkorf in oozie?
Hoe plan ik een bijenkorf in oozie?

Video: Hoe plan ik een bijenkorf in oozie?

Video: Hoe plan ik een bijenkorf in oozie?
Video: CloudxLab - Oozie workflow for Hive 2024, November
Anonim

Tot schema Hive-taak gebruik makend van Oozie , je moet een schrijven Bijenkorf -actie.

hql) erin.

  1. Maak een map in HDFS door het onderstaande commando af te vuren.
  2. hadoop fs -mkdir -p /gebruiker/ oozie /werkstromen/
  3. Werkstroom zetten. xml, Bijenkorf script (create_table. hql) en bijenkorf -plaats. xml in de map die in stap 2 is gemaakt. U kunt de onderstaande opdracht gebruiken.

Zo ja, hoe voer ik het Hive-script in oozie uit?

Voer Hive-taken uit met Oozie

  1. Specificeer de bijenkorf. xml in de job-xml parameter.
  2. Geef de naam op van het script (bijvoorbeeld script.q) dat de component-query bevat in de scriptparameter.
  3. Voeg optioneel eigenschappen toe die worden gebruikt door de Oozie launcher-taak. Voeg het voorvoegsel oozie toe. launcher naar de eigenschapsnamen.

Bovendien, hoe voer ik de oozie-workflow uit? Oozie Workflow uitvoeren vanaf de opdrachtregel

  1. Log in op de webconsole.
  2. Kopieer oozie-voorbeelden naar uw homedirectory in de webconsole: cp /usr/hdp/current/oozie-client/doc/oozie-examples. teer. gz.
  3. Pak bestanden uit tar tar -zxvf oozie-examples.tar.gz.
  4. Kopieer de map met voorbeelden naar HDFS hadoop fs -copyFromLocal-voorbeelden.

Hoe plan ik in dit verband een Hadoop-taak?

Hoe banen plannen in hadoop - Quora. De eenvoudigste manier is om je code in een shellscript te verpakken en schema het als een cron functie op het randknooppunt (het knooppunt waar u gewoonlijk uw indient) banen ). Maar meestal wordt de code in een script verpakt en uitgevoerd als a functie is moeilijk te debuggen. testen en onderhouden.

Wat is de oozie-workflow?

Oozie is een werkstroom plannersysteem om Apache Hadoop-taken te beheren. Oozie-workflow banen zijn Directed Acyclical Graphs (DAG's) van acties. Oozie Coördinator banen zijn terugkerende Oozie-workflow taken getriggerd door tijd (frequentie) en beschikbaarheid van gegevens. Oozie is een schaalbaar, betrouwbaar en uitbreidbaar systeem.

Aanbevolen: