Configuration minimale d' Hadoop sur Ubuntu

Je suis en train de me mettre à Hadoop. J' essaye de l'installer via une vm ubuntu. Voici la configuration minimale que j'ai appliqué. Celle-ci est décrite sur le site d'hadoop et sur le site de yahoo hadoop-logo.jpg

Voici la configuration que j'ai appliqué spécifiquement sur un serveur ubuntu:

Préparatifs

Création d'un utilisateur hadoop-user

$ adduser hadoop-user

Dans le répertoire home de l'utilisateur ( ou ailleurs ), décompresser l'archive Hadoop

Créer les répertoire suivants

$ mkdir -p /hadoop/hadoop-${USER}
$ chmod -R 777 /hadoop/

Configuration SSH

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

Configurer la variable d'environnement JAVA_HOME

Configuration Hadoop

Fichier hadoo-env.sh

Renseigner la variable JAVA_HOME

export JAVA_HOME=/usr/jre16

Dans le fichier conf/core-site.xml

Pour information, j'ai spécifié l'adresse IP de ma machine virtuelle 192.168.85.128 dans les fichiers de configuration. Pensez à modifier cette adresse pour l'adapter à votre conifguration

  1. <configuration>
  2. <property>
  3. <name>fs.default.name</name>
  4. <value>hdfs://192.168.85.128:9000</value>
  5. </property>
  6. <property>
  7. <name>hadoop.tmp.dir</name>
  8. <value>/hadoop/hadoop-$[user.name}</value>
  9. </property>
  10. </configuration>

conf/hdfs-site.xml

  1. <configuration>
  2. <property>
  3. <name>dfs.replication</name>
  4. <value>1</value>
  5. </property>
  6. </configuration>

conf/mapred-site.xml

  1. <configuration>
  2. <property>
  3. <name>mapred.job.tracker</name>
  4. <value>192.168.85.128:9001</value>
  5. </property>
  6. <property>
  7. <name>mapred.child.java.opts</name>
  8. <value>-Xmx256m</value>
  9. </property>
  10. <property>
  11. <name>mapred.system.dir</name>
  12. <value>/hadoop/mapred/system</value>
  13. </property>
  14. </configuration>

Formatage de l'espace de stockage hadoop

$ bin/hadoop namenode -format

Démarrage et vérification

Démarrage

lancer la commande suivante :

$ bin/start-all.sh

Vérification

Se connecter via un navigateur sur les sites suivants

Vous pouvez également exécuter le test fourni dans le jar d'exemples

bin/hadoop jar hadoop-examples-1.0.3.jar pi 10 10000

Pour ceux qui ne veulent pas trop se prendre la tête...

Cloudera fournit une vm toute configurée sur son site

Vus : 1315
Publié par Littlewing : 368