前提は、Win の Eclipse でコードを書き、ローカルモードで動作確認。
分散環境での動作確認は別途VMを作成して、そこで行う。
やることはとりあえず、大きく2つ。
- Hadoop(0.20系)をWindowsXP上で起動(ローカルモード)できるようにする
- EclipseでHadoopの開発ができるようにする →Eclipse(3.7)は既にインストール済み
----------------------------------------------------------------
1. Hadoop(0.20系)をWindowsXP上で起動できるようにする 参考にしたサイト
Hadoop/Windows上での実行(0.20.2) - Yoshimopedia
大まかな手順
- JAVA_HOMEの設定
- Cygwinのインストール
- Hadoopの導入
- bin/hadoopを編集
- 設定ファイルを編集
1. JAVA_HOMEの設定
ユーザー環境変数「JAVA_HOME」にJREのインストール先を設定する
2. Cygwinのインストールインストール先の指定特にないようなので、C:\直下にインストール。
システム環境変数「Path」に C:\cygwin\bin;C:\cygwin\usr\bin を追加。
3. Hadoopの導入
hadoop-0.20.2.tar.gz をダウンロードして、任意(※)の場所に展開。
※:Program Filesは避けたほうがいいみたい。
なので、C:\直下に展開。
4. bin/hadoopを編集
JAVA_PLATFORM=`CLASSPATH=${CLASSPATH} ${JAVA} -Xmx32m org.apache.hadoop.util.PlatformName sed -e "s/ /_/g"`の${CLASSPATH}、${JAVA}にダブルクォートを追加し、
JAVA_PLATFORM=`CLASSPATH="${CLASSPATH}" "${JAVA}" -Xmx32m org.apache.hadoop.util.PlatformName sed -e "s/ /_/g"`と修正。
5. 設定ファイルを編集
conf/core-site.xml
<configuration>※ value の値は作業環境に合わせる。
<property>
<name>hadoop.tmp.dir</name>
<value>C:\tmp\hadoop</value>
</property>
</configuration>
conf/mapred-site.xml
<configuration>これで、ローカルモードで MapReduce アプリケーションを動作させることができる。
<property>
<name>mapred.job.tracker</name>
<value>local</value>
</property>
</configuration>
2. EclipseでHadoopの開発ができるようにする
参考にしたサイト
2009-01-20 - きしだのはてな
Hadoop開発準備のためのEclipseインストール - osacaz4の日記
hadoop にプラグインを追加。
${HADOOP_HOME}/contrib/eclipse-plugin/hadoop-0.20.2-eclipse-plugin.jar
を Eclipse の pluginsフォルダにコピーするだけ。
※:「0.20.2」の部分は先に導入したHadoopのバージョンによって異なる。
=====
今日の環境
OS:WindowsXP sp3
Hadoop 0.20.2
0 件のコメント:
コメントを投稿