[baremetal] Containerize MaaS
[fuel.git] / mcp / scripts / lib_jump_deploy.sh
1 #!/bin/bash -e
2 # shellcheck disable=SC2155,SC1001,SC2015,SC2128
3 ##############################################################################
4 # Copyright (c) 2018 Mirantis Inc., Enea AB and others.
5 # All rights reserved. This program and the accompanying materials
6 # are made available under the terms of the Apache License, Version 2.0
7 # which accompanies this distribution, and is available at
8 # http://www.apache.org/licenses/LICENSE-2.0
9 ##############################################################################
10 #
11 # Library of shell functions used by deploy script on jumpserver:
12 # - base cloud image (used by FN VMs and VCP VMs) processing:
13 #   * download;
14 #   * tooling for offline image modification (without libguestfs);
15 #   * package pre-installation (requires nbd, loop krn mods);
16 # - virtualized hosts processing:
17 #   * virsh-managed VMs boilerplate;
18 #   * salt master container tooling;
19 #   * virsh & docker network plumbing;
20 # etc.
21
22 ##############################################################################
23 # private helper functions
24 ##############################################################################
25
26 function __get_base_image {
27   local base_image=$1
28   local image_dir=$2
29
30   mkdir -p "${image_dir}"
31   wget --progress=dot:giga -P "${image_dir}" -N "${base_image}"
32 }
33
34 function __kernel_modules {
35   # Load mandatory kernel modules: loop, nbd
36   local image_dir=$1
37   test -e /dev/loop-control || sudo modprobe loop
38   if sudo modprobe nbd max_part=8 || sudo modprobe -f nbd max_part=8; then
39     return 0
40   fi
41   if [ -e /dev/nbd0 ]; then return 0; fi  # nbd might be inbuilt
42   # CentOS (or RHEL family in general) do not provide 'nbd' out of the box
43   echo "[WARN] 'nbd' kernel module cannot be loaded!"
44   if [ ! -e /etc/redhat-release ]; then
45     echo "[ERROR] Non-RHEL system detected, aborting!"
46     echo "[ERROR] Try building 'nbd' manually or install it from a 3rd party."
47     exit 1
48   fi
49
50   # Best-effort attempt at building a non-maintaned kernel module
51   local __baseurl='http://vault.centos.org/centos'
52   local __subdir='Source/SPackages'
53   local __uname_r=$(uname -r)
54   local __uname_m=$(uname -m)
55   if [ "${__uname_m}" = 'x86_64' ]; then
56     __srpm="kernel-${__uname_r%.${__uname_m}}.src.rpm"
57   else
58     # NOTE: fmt varies across releases (e.g. kernel-alt-4.11.0-44.el7a.src.rpm)
59     __srpm="kernel-alt-${__uname_r%.${__uname_m}}.src.rpm"
60   fi
61
62   local __found='n'
63   local __versions=$(curl -s "${__baseurl}/" | grep -Po 'href="\K7\.[\d\.]+')
64   for ver in ${__versions}; do
65     for comp in os updates; do
66       local url="${__baseurl}/${ver}/${comp}/${__subdir}/${__srpm}"
67       if wget "${url}" -O "${image_dir}/${__srpm}" > /dev/null 2>&1; then
68         __found='y'; break 2
69       fi
70     done
71   done
72
73   if [ "${__found}" = 'n' ]; then
74     echo "[ERROR] Can't find the linux kernel SRPM for: ${__uname_r}"
75     echo "[ERROR] 'nbd' module cannot be built, aborting!"
76     echo "[ERROR] Try 'yum upgrade' or building 'nbd' krn module manually ..."
77     exit 1
78   fi
79
80   rpm -ivh "${image_dir}/${__srpm}" 2> /dev/null
81   mkdir -p ~/rpmbuild/{BUILD,BUILDROOT,RPMS,SOURCES,SPECS,SRPMS}
82   # shellcheck disable=SC2016
83   echo '%_topdir %(echo $HOME)/rpmbuild' > ~/.rpmmacros
84   (
85     cd ~/rpmbuild/SPECS
86     rpmbuild -bp --nodeps --target="${__uname_m}" kernel*.spec
87     cd ~/rpmbuild/BUILD/"${__srpm%.src.rpm}"/linux-*
88     sed -i 's/^.*\(CONFIG_BLK_DEV_NBD\).*$/\1=m/g' .config
89     # http://centosfaq.org/centos/nbd-does-not-compile-for-3100-514262el7x86_64
90     if grep -Rq 'REQ_TYPE_DRV_PRIV' drivers/block; then
91       sed -i 's/REQ_TYPE_SPECIAL/REQ_TYPE_DRV_PRIV/g' drivers/block/nbd.c
92     fi
93     gunzip -c "/boot/symvers-${__uname_r}.gz" > Module.symvers
94     make prepare modules_prepare
95     make M=drivers/block -j
96     modinfo drivers/block/nbd.ko
97     sudo mkdir -p "/lib/modules/${__uname_r}/extra/"
98     sudo cp drivers/block/nbd.ko "/lib/modules/${__uname_r}/extra/"
99   )
100   sudo depmod -a
101   sudo modprobe nbd max_part=8 || sudo modprobe -f nbd max_part=8
102 }
103
104 function __mount_image {
105   local image=$1
106   local image_dir=$2
107   OPNFV_MNT_DIR="${image_dir}/ubuntu"
108
109   # Find free nbd, loop devices
110   for dev in '/sys/class/block/nbd'*; do
111     if [ "$(cat "${dev}/size")" = '0' ]; then
112       OPNFV_NBD_DEV=/dev/$(basename "${dev}")
113       break
114     fi
115   done
116   OPNFV_LOOP_DEV=$(sudo losetup -f)
117   OPNFV_MAP_DEV=/dev/mapper/$(basename "${OPNFV_NBD_DEV}")p1
118   export OPNFV_MNT_DIR OPNFV_LOOP_DEV
119   [ -n "${OPNFV_NBD_DEV}" ] && [ -n "${OPNFV_LOOP_DEV}" ] || exit 1
120   qemu-img resize "${image_dir}/${image}" 3G
121   sudo qemu-nbd --connect="${OPNFV_NBD_DEV}" --aio=native --cache=none \
122     "${image_dir}/${image}"
123   sudo kpartx -av "${OPNFV_NBD_DEV}"
124   sleep 5 # /dev/nbdNp1 takes some time to come up
125   # Hardcode partition index to 1, unlikely to change for Ubuntu UCA image
126   if sudo growpart "${OPNFV_NBD_DEV}" 1; then
127     sudo kpartx -u "${OPNFV_NBD_DEV}"
128     sudo e2fsck -pf "${OPNFV_MAP_DEV}"
129     sudo resize2fs "${OPNFV_MAP_DEV}"
130   fi
131   # grub-update does not like /dev/nbd*, so use a loop device to work around it
132   sudo losetup "${OPNFV_LOOP_DEV}" "${OPNFV_MAP_DEV}"
133   mkdir -p "${OPNFV_MNT_DIR}"
134   sudo mount "${OPNFV_LOOP_DEV}" "${OPNFV_MNT_DIR}"
135   sudo mount -t proc proc "${OPNFV_MNT_DIR}/proc"
136   sudo mount -t sysfs sys "${OPNFV_MNT_DIR}/sys"
137   sudo mount -o bind /dev "${OPNFV_MNT_DIR}/dev"
138   sudo mkdir -p "${OPNFV_MNT_DIR}/run/resolvconf"
139   sudo cp /etc/resolv.conf "${OPNFV_MNT_DIR}/run/resolvconf"
140   echo "GRUB_DISABLE_OS_PROBER=true" | \
141     sudo tee -a "${OPNFV_MNT_DIR}/etc/default/grub"
142   sudo sed -i -e 's/^\(GRUB_TIMEOUT\)=.*$/\1=1/g' -e 's/^GRUB_HIDDEN.*$//g' \
143     "${OPNFV_MNT_DIR}/etc/default/grub"
144 }
145
146 function __apt_repos_pkgs_image {
147   local apt_key_urls=(${1//,/ })
148   local all_repos=(${2//,/ })
149   local pkgs_i=(${3//,/ })
150   local pkgs_r=(${4//,/ })
151   [ -n "${OPNFV_MNT_DIR}" ] || exit 1
152
153   # APT keys
154   if [ "${#apt_key_urls[@]}" -gt 0 ]; then
155     for apt_key in "${apt_key_urls[@]}"; do
156       sudo chroot "${OPNFV_MNT_DIR}" /bin/bash -c \
157         "wget -qO - '${apt_key}' | apt-key add -"
158     done
159   fi
160   # Additional repositories
161   for repo_line in "${all_repos[@]}"; do
162     # <repo_name>|<repo prio>|deb|[arch=<arch>]|<repo url>|<dist>|<repo comp>
163     local repo=(${repo_line//|/ })
164     [ "${#repo[@]}" -gt 5 ] || continue
165     # NOTE: Names and formatting are compatible with Salt linux.system.repo
166     cat <<-EOF | sudo tee "${OPNFV_MNT_DIR}/etc/apt/preferences.d/${repo[0]}"
167
168                 Package: *
169                 Pin: release a=${repo[-2]}
170                 Pin-Priority: ${repo[1]}
171
172                 EOF
173     echo "${repo[@]:2}" | sudo tee \
174       "${OPNFV_MNT_DIR}/etc/apt/sources.list.d/${repo[0]}.list"
175   done
176   # Install packages
177   if [ "${#pkgs_i[@]}" -gt 0 ]; then
178     sudo DEBIAN_FRONTEND="noninteractive" \
179       chroot "${OPNFV_MNT_DIR}" apt-get update
180     sudo DEBIAN_FRONTEND="noninteractive" FLASH_KERNEL_SKIP="true" \
181       chroot "${OPNFV_MNT_DIR}" apt-get install -y "${pkgs_i[@]}"
182   fi
183   # Remove packages
184   if [ "${#pkgs_r[@]}" -gt 0 ]; then
185     sudo DEBIAN_FRONTEND="noninteractive" FLASH_KERNEL_SKIP="true" \
186       chroot "${OPNFV_MNT_DIR}" apt-get purge -y "${pkgs_r[@]}"
187   fi
188   # Disable cloud-init metadata service datasource
189   sudo mkdir -p "${OPNFV_MNT_DIR}/etc/cloud/cloud.cfg.d"
190   echo "datasource_list: [ NoCloud, None ]" | sudo tee \
191     "${OPNFV_MNT_DIR}/etc/cloud/cloud.cfg.d/95_real_datasources.cfg"
192 }
193
194 function __cleanup_vms {
195   # clean up existing nodes
196   for node in $(${VIRSH} list --name | grep -P '\w{3}\d{2}'); do
197     ${VIRSH} destroy "${node}" 2>/dev/null || true
198   done
199   for node in $(${VIRSH} list --name --all | grep -P '\w{3}\d{2}'); do
200     ${VIRSH} domblklist "${node}" | awk '/^.da/ {print $2}' | \
201       xargs --no-run-if-empty -I{} sudo rm -f {}
202     ${VIRSH} undefine "${node}" --remove-all-storage --nvram || \
203       ${VIRSH} undefine "${node}" --remove-all-storage
204   done
205 }
206
207 ##############################################################################
208 # public functions
209 ##############################################################################
210
211 function prepare_vms {
212   local base_image=$1; shift
213   local image_dir=$1; shift
214   local repos_pkgs_str=$1; shift # ^-sep list of repos, pkgs to install/rm
215   local vnodes=("$@")
216   local image=base_image_opnfv_fuel.img
217   local vcp_image=${image%.*}_vcp.img
218   local _o=${base_image/*\/}
219   [ -n "${image_dir}" ] || exit 1
220
221   cleanup_uefi
222   __cleanup_vms
223   __get_base_image "${base_image}" "${image_dir}"
224   IFS='^' read -r -a repos_pkgs <<< "${repos_pkgs_str}"
225
226   local _h=$(echo "${repos_pkgs_str}.$(md5sum "${image_dir}/${_o}")" | \
227              md5sum | cut -c -8)
228   local _tmp="${image%.*}.${_h}.img"
229   echo "[INFO] Lookup cache / build patched base image for fingerprint: ${_h}"
230   if [ "${image_dir}/${_tmp}" -ef "${image_dir}/${image}" ]; then
231     echo "[INFO] Patched base image found"
232   else
233     # shellcheck disable=SC2115
234     rm -rf "${image_dir}/${image%.*}"*
235     if [[ ! "${repos_pkgs_str}" =~ ^\^+$ ]]; then
236       echo "[INFO] Patching base image ..."
237       cp "${image_dir}/${_o}" "${image_dir}/${_tmp}"
238       __kernel_modules "${image_dir}"
239       __mount_image "${_tmp}" "${image_dir}"
240       __apt_repos_pkgs_image "${repos_pkgs[@]:0:4}"
241       cleanup_mounts
242     else
243       echo "[INFO] No patching required, using vanilla base image"
244       ln -sf "${image_dir}/${_o}" "${image_dir}/${_tmp}"
245     fi
246     ln -sf "${image_dir}/${_tmp}" "${image_dir}/${image}"
247   fi
248
249   # Create config ISO and resize OS disk image for each foundation node VM
250   for node in "${vnodes[@]}"; do
251     ./create-config-drive.sh -k "$(basename "${SSH_KEY}").pub" \
252        -u 'user-data.sh' -h "${node}" "${image_dir}/mcp_${node}.iso"
253     cp "${image_dir}/${image}" "${image_dir}/mcp_${node}.qcow2"
254     qemu-img resize "${image_dir}/mcp_${node}.qcow2" 100G
255     # Prepare dedicated drive for cinder on cmp nodes
256     if [[ "${node}" =~ ^(cmp) ]]; then
257       qemu-img create "${image_dir}/mcp_${node}_storage.qcow2" 100G
258     fi
259   done
260
261   # VCP VMs base image specific changes
262   if [[ ! "${repos_pkgs_str}" =~ \^{3}$ ]] && [ -n "${repos_pkgs[*]:4}" ]; then
263     echo "[INFO] Lookup cache / build patched VCP image for md5sum: ${_h}"
264     _tmp="${vcp_image%.*}.${_h}.img"
265     if [ "${image_dir}/${_tmp}" -ef "${image_dir}/${vcp_image}" ]; then
266       echo "[INFO] Patched VCP image found"
267     else
268       echo "[INFO] Patching VCP image ..."
269       cp "${image_dir}/${image}" "${image_dir}/${_tmp}"
270       __kernel_modules "${image_dir}"
271       __mount_image "${_tmp}" "${image_dir}"
272       __apt_repos_pkgs_image "${repos_pkgs[@]:4:4}"
273       cleanup_mounts
274       ln -sf "${image_dir}/${_tmp}" "${image_dir}/${vcp_image}"
275     fi
276   fi
277 }
278
279 function create_networks {
280   local all_vnode_networks=("$@")
281   # create required networks
282   for net in "mcpcontrol" "${all_vnode_networks[@]}"; do
283     if ${VIRSH} net-info "${net}" >/dev/null 2>&1; then
284       ${VIRSH} net-destroy "${net}" || true
285       ${VIRSH} net-undefine "${net}"
286     fi
287     # in case of custom network, host should already have the bridge in place
288     if [ -f "virsh_net/net_${net}.xml" ] && \
289      [ ! -d "/sys/class/net/${net}/bridge" ]; then
290       ${VIRSH} net-define "virsh_net/net_${net}.xml"
291       ${VIRSH} net-autostart "${net}"
292       ${VIRSH} net-start "${net}"
293     fi
294   done
295   # create veth pairs for relevant networks (pxebr, mgmt)
296   for i in $(seq 0 2 2); do
297     sudo ip link del "veth_mcp$i" || true
298     sudo ip link add "veth_mcp$i" type veth peer name "veth_mcp$((i+1))"
299     sudo ip link set "veth_mcp$i" up mtu 9000
300     sudo ip link set "veth_mcp$((i+1))" up mtu 9000
301     sudo brctl addif "${all_vnode_networks[$((i/2))]}" "veth_mcp$i"
302   done
303 }
304
305 function create_vms {
306   local image_dir=$1; shift
307   # vnode data should be serialized with the following format:
308   #   <name0>,<ram0>,<vcpu0>[,<sockets0>,<cores0>,<threads0>[,<cell0name0>,<cell0memory0>,
309   #   <cell0cpus0>,<cell1name0>,<cell1memory0>,<cell1cpus0>]]|<name1>,...'
310   IFS='|' read -r -a vnodes <<< "$1"; shift
311
312   # AArch64: prepare arch specific arguments
313   local virt_extra_args=""
314   if [ "$(uname -i)" = "aarch64" ]; then
315     # No Cirrus VGA on AArch64, use virtio instead
316     virt_extra_args="$virt_extra_args --video=virtio"
317   fi
318
319   # create vms with specified options
320   for serialized_vnode_data in "${vnodes[@]}"; do
321     if [ -z "${serialized_vnode_data}" ]; then continue; fi
322     IFS=',' read -r -a vnode_data <<< "${serialized_vnode_data}"
323
324     # prepare VM CPU model, count, topology (optional), NUMA cells (optional, requires topo)
325     local virt_cpu_args=' --cpu host-passthrough'
326     local idx=6  # cell0.name index in serialized data
327     while [ -n "${vnode_data[${idx}]}" ]; do
328       virt_cpu_args+=",${vnode_data[${idx}]}.memory=${vnode_data[$((idx + 1))]}"
329       virt_cpu_args+=",${vnode_data[${idx}]}.cpus=${vnode_data[$((idx + 2))]}"
330       idx=$((idx + 3))
331     done
332     virt_cpu_args+=" --vcpus vcpus=${vnode_data[2]}"
333     if [ -n "${vnode_data[5]}" ]; then
334       virt_cpu_args+=",sockets=${vnode_data[3]},cores=${vnode_data[4]},threads=${vnode_data[5]}"
335     fi
336
337     # prepare network args
338     local vnode_networks=("$@")
339     local net_args=
340     for net in "${vnode_networks[@]}"; do
341       net_args="${net_args} --network bridge=${net},model=virtio"
342     done
343
344     # dedicated storage drive for cinder on cmp nodes
345     virt_extra_storage=
346     if [[ "${vnode_data[0]}" =~ ^(cmp) ]]; then
347       virt_extra_storage="--disk path=${image_dir}/mcp_${vnode_data[0]}_storage.qcow2,format=qcow2,bus=virtio,cache=none,io=native"
348     fi
349
350     [ ! -e "${image_dir}/virt-manager" ] || VIRT_PREFIX="${image_dir}/virt-manager/"
351     # shellcheck disable=SC2086
352     ${VIRT_PREFIX}${VIRSH/virsh/virt-install} --name "${vnode_data[0]}" \
353     ${virt_cpu_args} --accelerate \
354     ${net_args} \
355     --ram "${vnode_data[1]}" \
356     --disk path="${image_dir}/mcp_${vnode_data[0]}.qcow2",format=qcow2,bus=virtio,cache=none,io=native \
357     ${virt_extra_storage} \
358     --os-type linux --os-variant none \
359     --boot hd --vnc --console pty --autostart --noreboot \
360     --disk path="${image_dir}/mcp_${vnode_data[0]}.iso",device=cdrom \
361     --noautoconsole \
362     ${virt_extra_args}
363   done
364 }
365
366 function reset_vms {
367   local vnodes=("$@")
368   local cmd_str="ssh ${SSH_OPTS} ${SSH_SALT}"
369
370   # reset non-infrastructure vms, wait for them to come back online
371   for node in "${vnodes[@]}"; do
372     ${VIRSH} reset "${node}"
373   done
374   for node in "${vnodes[@]}"; do
375     wait_for 20.0 "${cmd_str} sudo salt -C '${node}*' saltutil.sync_all"
376   done
377 }
378
379 function start_vms {
380   local vnodes=("$@")
381
382   # start vms
383   for node in "${vnodes[@]}"; do
384     ${VIRSH} start "${node}"
385     sleep $((RANDOM%5+1))
386   done
387 }
388
389 function prepare_containers {
390   local image_dir=$1
391   [ -n "${image_dir}" ] || exit 1
392   [ -n "${MCP_REPO_ROOT_PATH}" ] || exit 1
393   [ ! -e "${image_dir}/docker-compose" ] || COMPOSE_PREFIX="${image_dir}/"
394
395   "${COMPOSE_PREFIX}docker-compose" -f docker-compose/docker-compose.yaml down
396   if [[ ! "${MCP_DOCKER_TAG}" =~ 'verify' ]]; then
397     "${COMPOSE_PREFIX}docker-compose" -f docker-compose/docker-compose.yaml pull
398   fi
399   # overwrite hosts only on first container up, to preserve cluster nodes
400   sudo cp docker-compose/files/hosts "${image_dir}/hosts"
401   sudo rm -rf "${image_dir}/"{salt,pki,mas01/etc} "${image_dir}/nodes/"*
402   find "${image_dir}/mas01/var/lib/" \
403     -mindepth 2 -maxdepth 2 -not -name boot-resources \
404     -exec sudo rm -rf {} \; || true
405   mkdir -p "${image_dir}/"{salt/master.d,salt/minion.d}
406
407   if grep -q -e 'maas' 'docker-compose/docker-compose.yaml'; then
408     chmod +x docker-compose/files/entrypoint*.sh
409     # Apparmor workaround for bind9 inside Docker containers using AUFS
410     for profile in 'usr.sbin.ntpd' 'usr.sbin.named' \
411                    'usr.sbin.dhcpd' 'usr.bin.tcpdump'; do
412       if [ -e "/etc/apparmor.d/${profile}" ] && \
413        [ ! -e "/etc/apparmor.d/disable/${profile}" ]; then
414         sudo ln -sf "/etc/apparmor.d/${profile}" "/etc/apparmor.d/disable/"
415         sudo apparmor_parser -R "/etc/apparmor.d/${profile}" || true
416       fi
417     done
418   fi
419 }
420
421 function start_containers {
422   local image_dir=$1
423   [ -n "${image_dir}" ] || exit 1
424   [ ! -e "${image_dir}/docker-compose" ] || COMPOSE_PREFIX="${image_dir}/"
425   "${COMPOSE_PREFIX}docker-compose" -f docker-compose/docker-compose.yaml up -d
426 }
427
428 function check_connection {
429   local total_attempts=60
430   local sleep_time=5
431
432   set +e
433   echo '[INFO] Attempting to get into Salt master ...'
434
435   # wait until ssh on Salt master is available
436   # shellcheck disable=SC2034
437   for attempt in $(seq "${total_attempts}"); do
438     # shellcheck disable=SC2086
439     ssh ${SSH_OPTS} "ubuntu@${SALT_MASTER}" uptime
440     case $? in
441       0) echo "${attempt}> Success"; break ;;
442       *) echo "${attempt}/${total_attempts}> ssh server ain't ready yet, waiting for ${sleep_time} seconds ..." ;;
443     esac
444     sleep $sleep_time
445   done
446   set -e
447 }
448
449 function cleanup_mounts {
450   # Remove any mounts, loop and/or nbd devs created while patching base image
451   if [ -n "${OPNFV_MNT_DIR}" ] && [ -d "${OPNFV_MNT_DIR}" ]; then
452     if [ -f "${OPNFV_MNT_DIR}/boot/grub/grub.cfg" ]; then
453       # Grub thinks it's running from a live CD
454       sudo sed -i -e 's/^\s*set root=.*$//g' -e 's/^\s*loopback.*$//g' \
455         "${OPNFV_MNT_DIR}/boot/grub/grub.cfg"
456     fi
457     sudo rm -f "${OPNFV_MNT_DIR}/run/resolvconf/resolv.conf"
458     sync
459     if mountpoint -q "${OPNFV_MNT_DIR}"; then
460       sudo umount -l "${OPNFV_MNT_DIR}" || true
461     fi
462   fi
463   if [ -n "${OPNFV_LOOP_DEV}" ] && \
464     sudo losetup "${OPNFV_LOOP_DEV}" 1>&2 > /dev/null; then
465       sudo losetup -d "${OPNFV_LOOP_DEV}"
466   fi
467   if [ -n "${OPNFV_NBD_DEV}" ]; then
468     sudo kpartx -d "${OPNFV_NBD_DEV}" || true
469     sudo qemu-nbd -d "${OPNFV_NBD_DEV}" || true
470   fi
471 }