hadoop1.1.2 安裝 (1)

在這一篇文章中, 我們將開始介紹如何安裝 hadoop,
我們以1.1.2版本為基礎, 介紹 hadoop 的安裝流程,

hadoop 是一個叢集運算與儲存的計算框架,
在 hadoop 1.x 版本中, 可以分成兩個部分:
HDFS (hadoop distributed file system) 以及 MapReduce,
HDFS 是 hadoop 中的儲存架構, 提供分散式的資料儲存,
而 MapReduce 是計算的框架, 提供分散式的運算框架,
有關 hadoop 更詳細的介紹, 可以參考之前的文章.

在安裝hadoop之前, 必須先確定環境已經設定正確,
包括了: java JDK安裝(1.6版以上), 共通的使用者權限(帳戶以及SSH),
以及網路的對應(/etc/hostname, /etc/hosts, 關閉IPV6),
這一部分的設定與說明, 我們可以參考網路上的資源, 或是之前的文章,

在完成上述設定後, 我們已經建立了一個叢集:
master.hbase.mbwcl.nctu.edu.tw 192.168.2.59
slave01.hbase.mbwcl.nctu.edu.tw 192.168.2.60
slave02.hbase.mbwcl.nctu.edu.tw 192.168.2.61

接著, 我們就進行hadoop 1.1.2的安裝,
在hadoop的架構中, 所有的程式都以java程式執行,
因此, 我們只需要下載hadoop的執行程式,
分布在每個節點上, 透過SSH的方式在節點上執行,
並透過網路資料交換(socket), 確認節點的任務進行.

在linux的環境下, 我們先將/opt資料夾更改存取權限,
以及擁有者(user:hadoop), 使/opt成為hadoop的根目錄:

$ sudo chown -R user:hadoop /opt
$ sudo chmod -R 777 /opt

接著, 在/opt目錄下, 用wget的方式, 獲取hadoop的壓縮檔,

$ wget https://archive.apache.org/dist/hadoop/core/hadoop-1.1.2/hadoop-1.1.2.tar.gz

在這邊, 可以到apache網站找尋各版本的hadoop:
https://archive.apache.org/dist/hadoop/core/

下載完成後, 解壓縮並更改目錄名稱為hadoop,
指令如下:

$ tar -zvf hadoop-1.1.2.tar.gz
$ mv hadoop-1.1.2 hadoop

完成以上步驟後, 我們在下一篇文章將說明,
如何設定hadoop的環境變數.

留言

熱門文章

LTE筆記: RSRP, RSSI and RSRQ

[WiFi] WiFi 網路的識別: BSS, ESS, SSID, ESSID, BSSID

LTE筆記: 5G NR Measurement Events