2019年6月3日 星期一

8-1-4 從集叢中刪除其中一台主機(Remove a cluster node)

Proxmox VE 4.x 中文初階學習手冊

8-1-4 從集叢中刪除其中一台主機(Remove a cluster node)

請仔細閱讀該程序,然後再繼續,因為它可能不是你想要或需要。
最重要的一件事就在本篇的最後面,一定要注意看,不然,會造成無法挽回的嚴重後果。
  1. 集叢主機群:
    pve
    pve2
    pve3 ---> 這一台是要移除的主機 (node), 因為常常會當機,但找不出原因。  
    pve4

     
  2. 以 proxmox VE 的網頁管理介面將
    node pve3 上所有的 VMs 及 LXC 全部移除或遷移至其它的主機上。
    (其實只要把 /etc/pve/lxc/*.conf 及 /etc/pve/qemu-server/*.conf 全搬移到其他位置,
    待完成後再把設定檔搬回原來的位置即可)

    並確認您已經把重要的虛擬機完成備份保留。
    也就是 pve3 上,不存在任何的虛擬機,現在,完完全全是一台「空機」。

    其實也不用這麼「搞工」,我們的 pve3 主機,是以一顆 80G 的硬碟作為開機碟,另外一棵 500G 的硬碟作為 存放虛擬機的資料碟,所以,只要做以下幾個動作,就可以把 pve3 變成「空機」,而且,再次重新安裝後再加入原來的集叢時可以快速的恢復原狀。
    1. 備份 /etc/fstab 檔案  (以後要再掛載存放虛擬機的資料碟會用的到,能節省很多時間)

    2. /etc/pve/lxc/*.conf (存放 LXC 虛擬機的設定檔) 及
      /etc/pve/qemu-server/*.conf (KVM 虛擬機的設定檔)
      搬移到其它備份的地方(既然是搬移,當然原來位置的檔案就--->不見了。)
      這樣,只要把設定檔移出, pve3 馬上成為乾淨的「空機」。

       
  3. 以 ssh 登入到集叢中的一個節點(node ,也就是集叢中的一台主機)。
    # ssh root@pve2
  4. 查看 集叢狀態
    # pvecm status
  5. 在此刻必須先關閉要刪除的節點,並確保它不會再開機(在同一個網段中)。
    所以,先把 pve3 主機永遠 關機。(沒錯,繼續看下去,您就會瞭解了)
    把 pve3 關完機後 (我是把電源線拔掉啦! 本來是想把硬碟拆下來的說)
    再回到 剛剛登入的 pve2 查詢現在的情況:
    # pvecm nodes
    Membership information
    ----------------------
        Nodeid      Votes Name
             1          1 pve
             2          1 pve2 (local)
             4          1 pve4 
    現在可以確定 pve3 已經不見了(失去聯絡)
  6. 再其中一台主機上下指令(目前是在 pve2) 刪除 pve3 這一個 node
    # pvecm delnode pve3
    如果,操作成功的話,不會有任何的回應。

     
  7. 再次檢查節點列表(node),確認已經不存在 pve3 這個節點。
    # pvecm status

    # pvecm nodes
​​
注意:
  1. 如上面所說的,
    在 刪除 pve3 節點 之前,
    關閉 pve3 的電源 ,並確保它不會在這個網路中再次開機出現 是非常重要的。

    如果 pve3 在這個網路結構中再次開機出現在同一個網路裡,那麼,因為 pve3 還記錄著原來集叢的設定,且 ssh 金鑰等都還存在,所以,pve3 會再次去改寫原來集叢裡的設定……所以,原來集叢將會被 pve3 給搞砸,而且是難以挽回的嚴重問題。
  2. 如果,因為某種原因,您想把 pve3 再次重新加入原來的集叢,其實很簡單,
    只要重新安裝,但名稱可以使用 pve5 ,然後再重新加入原來的集叢就可以了。
  3. 原來 pve3 的設定仍然保留在 原來集叢的主機裡。