Actividad


Objetivo

El participante aprenderá a utilizar los comandos más utilizados de HDFS.

Instrucciones:

Para cada uno de los siguientes ejercicios realiza una impresión de la pantalla como evidencia de los comandos utilizados.

  1. Crea un clúster de HDInsight en el portal de Azure desde https://portal.azure.com/#home
  2. Con el uso de la terminal (cmd) conéctate al clúster de HDInsight utilizando SSH.
  3. Crea los directorios datay lookups en el HDFS.
  4. Crea el directorio tecmilenio y dentro de este directorio crea los directorios sudoku y wordcount.
  5. Despliega el contenido de los directorios tecmilenio y example/data.
  6. Descarga el archivo fruits.txt que se encuentra en el directorio /example/data del HDFS, con el uso del comando get y ponlo en el directorio local /tmp.
  7. Copia el archivo people.json que se encuentra en el directorio /example/data del HDFS, con el uso del comando copyToLocal y ponlo en el directorio local /tmp.
  8. Sube los archivos que acabas de descargar al directorio /data en el HDFS con el uso del comando put.
  9. Sube el archivo fruits.txt que descargaste en el paso 6 y súbelo al directorio /tecmilenio/wordcount en el HDFS con el uso del comando copyFromLocal.
  10. Despliega el contenido del archivo fruits.txt que se encuentra en el directorio /data del HDFS.
  11. Mueve el archivo fruits.txt del directorio /tecmilenio/wordcountal directorio /lookups en el HDFS.
  12. Copia el archivo people.json del directorio /dataal directorio /tecmilenio/wordcount.
  13. Remueve el archivo people.json del directorio /tecmilenio/wordcount y remueve el directorio / tecmilenio

Checklist