Ansible是一個簡單高效、無Agent架構(gòu)的自動化編排、部署及配置管理工具,通過SSH協(xié)議實現(xiàn)遠程節(jié)點和管理節(jié)點之間的通信。UCloud內(nèi)部也大量使用到了Ansible。比如,UCloud機房產(chǎn)品部署系統(tǒng),通過Ansible實現(xiàn)了部署效率的極大提升,目前已經(jīng)成為UCloud機房部署的重要工具,本文將詳細介紹Ansible在UCloud機房產(chǎn)品部署系統(tǒng)中的使用,相信對有多機房部署需求的讀者會有幫助。
什么是Ansible
Ansible是一個簡單高效、無Agent架構(gòu)的自動化編排、部署及配置管理工具,通過SSH協(xié)議實現(xiàn)遠程節(jié)點和管理節(jié)點之間的通信。
Ansible的目的是簡化大量復雜重復的運維工作, 以精簡的技術(shù)思路建立公司內(nèi)統(tǒng)一的自動化文化。無Agent的架構(gòu)使其比其他工具更顯簡單,基于SSH可以做到的事Ansible都可以做的更好,超高的易用度使其可以簡單集成到現(xiàn)有體系之中,因而被廣泛使用。
UCloud Ansible使用場景
UCloud內(nèi)部也大量使用到了Ansible。比如,機房產(chǎn)品部署系統(tǒng),通過Ansible實現(xiàn)了部署效率的極大提升,目前已經(jīng)成為UCloud機房部署的重要工具。又如,現(xiàn)網(wǎng)大規(guī)?;叶劝l(fā)布系統(tǒng),通過集成Ansible的基礎(chǔ)API和Callback功能,很好的解決了灰度發(fā)布、回滾、控制等難題,該系統(tǒng)已經(jīng)在線上穩(wěn)定運行3年以上,完成相關(guān)灰度發(fā)布任務(wù)上萬個。
下面將詳細介紹Ansible在機房產(chǎn)品部署系統(tǒng)中的使用,相信對有多機房部署需求的讀者會有幫助。
海外多機房部署
我們基于Ansible集中式地批量部署和管理服務(wù),集中式管理中心位于北京/上海機房。當海外節(jié)點(如拉各斯、胡志明等)需要建設(shè)時,通過Ansible來遠程部署云產(chǎn)品及內(nèi)部服務(wù)。部分云產(chǎn)品是基于UCloud云主機作為IaaS層搭建的,所以也是通過SSH連到對應(yīng)的海外云主機進行操作。
這和一般用戶的使用場景有很多相似之處,無論其是自建IDC或用了公有云,甚至多云部署來同時管理不同云上的服務(wù)器,都有類似批量部署的需要。
海外部署有個額外的痛點,就是部署效率的問題。Ansible使用SSH協(xié)議進行通信,SSH通道的創(chuàng)建和通信速度都較慢。當需要通過外網(wǎng)管理,而網(wǎng)絡(luò)環(huán)境較差或帶寬不足的情況下,執(zhí)行時間基本上無法忍耐,體現(xiàn)在用Ansible部署時,經(jīng)常會出現(xiàn)卡頓、連接失敗、傳輸速度較慢等現(xiàn)象,使用Copy模塊傳輸稍大的代碼包/鏡像文件時基本上要等到花兒都謝了。
我們的解決方法,是把UCloud的 PaaS產(chǎn)品GlobalSSH,集成進Ansible,用于提高跨國遠程管理服務(wù)器效率。
GlobalSSH
GlobalSSH為了保障海外數(shù)據(jù)中心的運維而推出,采用了UCloud眾多IaaS產(chǎn)品如ULB4(四層負載均衡)、UDPN(洲際內(nèi)網(wǎng)互聯(lián)、0丟包)及高包量云主機,引入智能DNS服務(wù)以提供就近接入的能力。網(wǎng)絡(luò)轉(zhuǎn)發(fā)基于成熟穩(wěn)定的GRE、NAT技術(shù),支持TCP端口(除80、443)四層轉(zhuǎn)發(fā)。
Ansible Playbook方式部署
我們將GlobalSSH集成到Ansible,做一個簡單的軟件包拷貝及安裝,步驟如下所示。
1) 首先,我們通過UCloud API或控制臺在北京二和拉各斯(尼日利亞)各創(chuàng)建一臺云主機,帶寬為1Mb,其中拉各斯機房會自動開啟GlobalSSH功能(所有UCloud海外機房均會自動開啟),如下圖所示:
2)準備一個簡單的Ansible Playbook,分別完成3個步驟:gather facts、copy代碼包以及yum安裝代碼。相關(guān)的playbook如下所示:
--- - hosts: all tasks: - name: copy test copy: src=/data/MySQL-devel-5.6.41-1.el6.x86_64.rpm dest=/data/test - name: install mysql-devel yum: name=/data/MySQL-devel-5.6.41-1.el6.x86_64.rpm state=present
3)準備一個hosts文件,用于配置GlobalSSH所生成的域名。Ansible在對GlobalSSH的支持上非常簡單,只要在主機變量里面添加 ansible_ssh_host=xxx.xxx.xxx.xxx.ipssh.net即可。我們的機房部署系統(tǒng)會結(jié)合Ansible的Dynamic Inventory功能,直接在生成的inventory中將GlobalSSH的加速域名加到ansible_ssh_host變量中了,使用起來也是非常容易的,如下所示。
[root@10-10-83-122 ~]# cat hosts_nrly [all] 152.32.140.39 ansible_ssh_pass=example [root@10-10-83-122 ~]# cat hosts_nrly_1 [all] 152.32.140.39 ansible_ssh_pass=example ansible_ssh_host=152.32.140.39.ipssh.net
4)使用ansible-playbook命令執(zhí)行該playbook,任務(wù)完成。
測試對比
前面提到,GlobalSSH大幅提高了我們海外部署的效率??梢酝ㄟ^另寫一個無GlobalSSH加速的Playbook,來測試一下具體的加速效果。
無GlobalSSH的Playbook寫起來比較簡單,和上文基本類似,區(qū)別在第三步的hosts文件里不使用加速域名,而是直接填寫原有的外網(wǎng)IP地址。
為防止單次測試結(jié)果的不準確,這里測試了10次,取平均值進行比較。
測試命令:
time for i in `seq 1 10`; do ansible-playbook -i hosts_nrly test_playbook.yml; done time for i in `seq 1 10`; do ansible-playbook -i hosts_nrly_1 test_playbook.yml; done
最終的結(jié)果如下所示,可以看到在簡單的Ansible Playbook部署中, 經(jīng)過GlobalSSH加速后的效果提升了32.23%。
Ansible Ad-hoc方式
GlobalSSH在低速的帶寬下可以提升整個網(wǎng)絡(luò)傳輸?shù)姆€(wěn)定性和速度,尤其是對RTT (Round-Trip Time)往返延遲的提升,更是有著外網(wǎng)彈性IP所不具備的速度優(yōu)勢。 因此我們認為它對Ansible Ad-hoc方式也有很大幫助。
運維人員經(jīng)常會用Ad-hoc方式,它類似pssh,卻支持Ansible所有的module語法,通常的使用場景是批量執(zhí)行命令并查看回顯結(jié)果。為了驗證假設(shè),我們對Ad-hoc方式也做了類似測試,發(fā)現(xiàn)GlobalSSH后的優(yōu)化效果更明顯,優(yōu)化速度超過50%,詳細結(jié)果如下所示。
測試命令:
time for i in `seq 1 10`; do ansible -i hosts_nrly all -m shell -a "cat /var/log/messages"; done time for i in `seq 1 10`; do ansible -i hosts_nrly_1 all -m shell -a "cat /var/log/messages"; done
測試結(jié)果:
總結(jié)
Ansible是被大量使用的DevOps工具,我們在使用中根據(jù)需要,將GlobalSSH很容易地集成其中,避免了服務(wù)器部署中SSH卡頓造成的不良影響。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!