aaron-han 发表于 2013-2-7 07:42:10

Ubuntu下搭建单节点Hadoop环境及WordCount示例的运行

基于前两篇的基础,在ubuntu下搭建hadoop环境及运行wordcount示例的过程比较顺利,现做一下简单记录。
环境:ubuntu10.04 hadoop0.20.2 jdk1.6.0_29
步骤如下:
1.安装JDK并配置环境变量
一些文章里说用sudo apt-get install sun-java6-jdk之类的命令,我对ubuntu比较小白,半天也没折腾出来,然后就直接去oralce的官网下了linux版本的jdk。http://www.agoit.com/images/smiles/icon_redface.gif

配置环境变量:
    sudo gedit /etc/profile
在最后边追加:
    #set java environmentexport JAVA_HOME=/usr/java/jdk1.6.0_29export PATH=$JAVA_HOME/bin:$PATHexport CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:$CLASSPATH
别忘了用echo和java -version验证以下。http://www.agoit.com/images/smiles/icon_arrow.gif

2.添加用户组和用户,都取名hadoop,新用户hadoop不能执行sudo命令。
    sudo addgroup hadoopsudo adduser --ingroup hadoop hadoop

3.配置ssh
    sudo apt-get install openssh-server //安装openssh-serversu - hadoop                         //切换到hadoop用户ssh-keygen -t rsa -P ""             //生成ssh keycat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys//设置允许ssh访问
设置完成后通过ssh localhost测试一下。

4.关掉ipv6
修改hadoop根目录下conf/hadoop-env.sh文件(还没下载hadoop的下载解压先~)
    export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true

5.将hadoop目录所有者更改为用户hadoop
    sudo chown -R hadoop:hadoop /usr/hadoop-0.20.2

6.安装hadoop
过程同windows下基本一致,详见之前的文章。还是要注意两点:a.设置core-site.xml中hadoop.tmp.dir的值,我设为/home/hadoop/tmp。b.把hadoop-env.sh中JAVA_HOME前边的#去掉。http://www.agoit.com/images/smiles/icon_evil.gif

7.格式化namenode
    ./hadoop namenode -format

8.启动hadoop
    ./start-all.sh

9.启动成功后,用jps查看下。

http://dl.iteye.com/upload/attachment/0065/8598/2f0845ba-1db3-32e4-9a62-0019b24e87c4.png

10.运行WordCount吧!少年!
   wordcount示例运行详见前边的文章,但是并没有出现在windows下出现的那两个问题。

参考博客:
http://www.cnblogs.com/end/archive/2011/04/19/2021536.html
http://www.hadoopor.com/thread-2674-1-1.html
页: [1]
查看完整版本: Ubuntu下搭建单节点Hadoop环境及WordCount示例的运行