hcoop-backup: Throttle at 2.6Mbps.
[clinton/scripts.git] / hcoop-backup
index 916bf1a..2f5c794 100755 (executable)
@@ -1,22 +1,67 @@
 #!/bin/bash -e
 
 #
-# run this script as root, on deleuze, in a directory that WILL NOT be
-# part of the backup (/tmp is a good choice).
+# it is dangerous to remove the "-e" above; please don't do that.
 #
 
-# FIXME:
-# postgres dumps
-# mysql dumps
+#
+# run this script as root, on deleuze
+#
+
+exec >& /var/log/backup-to-megacz.com-log
+
+PATH=$PATH:/bin:/usr/bin:/sbin:/usr/sbin
+#COMPRESS_EXT=.bz2
+#COMPRESS_PROG=bzip2
+COMPRESS_EXT=.gz
+COMPRESS_PROG=gzip
+# units for BWLIMIT are KB/s
+BWLIMIT=325
+
+IFS=$'\n'
 
-#KEYFILE=$1
 KEYFILE=/etc/backup-encryption-key
+BACKUPDIR=/afs/megacz.com/private/hcoop-backup
+BACKUPTMP=/var/backups/hcoop-backup
+SUBDIR=`date +%Y.%m.%d`
+
+#SYNC_CMD="rsync --bwlimit=$BWLIMIT --remove-source-files"
+
+function copy_over () {
+    # Move file to its offsite destination
+    # $1: file, $2: relative directory (optional)
+    if test -z "$1" || test -n "$3"; then
+        echo "Bad programming"
+        exit 1
+    fi
+    local FILE=$1
+    local DEST=$BACKUPDIR/$SUBDIR
+    if test -n "$2"; then
+        DEST=$DEST/$2
+    fi
+    < $FILE catsync -b $BWLIMIT $DEST/$FILE
+    rm -f $FILE
+}
+
+cd $BACKUPDIR
+find . -mindepth 1 -maxdepth 1 -type d -ctime +3 -delete || true
+
+rm -rf $SUBDIR
+mkdir -p $SUBDIR
+mkdir -p $BACKUPTMP
+cd $BACKUPTMP
+
+groups
+echo 'I am in:'
+pwd
+echo
 
 echo building package lists...
-dpkg -W -f='${Package}\n' > packages
-find / /usr/ /usr/local/ /var/ -xdev            | sort | uniq > allfiles
-dpkg-query -W -f='${Package}\n' | xargs dpkg -L | sort | uniq > debfiles
-dpkg-query -W -f='${Conffiles}\n'      | grep / | sort | uniq > conffiles
+dpkg-query -W -f='${Package}\n' > packages
+(cd /; find / /usr/ /usr/local/ /var/ -xdev)   | sort | uniq > allfiles
+dpkg-query -W -f='${Package}\n'      | xargs dpkg -L | sort | uniq > debfiles
+dpkg-query -W -f='${Conffiles}\n'           | grep / | cut -b2- | \
+  sed 's_ .*__' | sort | uniq > conffiles
 
 diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v ^/var/cache | \
@@ -24,6 +69,7 @@ diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v ^/var/lib/dpkg | \
  grep -v ^/var/backups | \
  grep -v ^/var/lib/changetrack | \
+ grep -v ^/var/local/lib/spamd | \
  grep -v ^/var/run | \
  grep -v ^/var/lock | \
  grep -v ^/var/lib/ucf | \
@@ -34,7 +80,22 @@ diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v '^/$' | \
  grep -v '^/usr/$' | \
  grep -v ^/usr/src | \
- cat > backupfiles
+ grep -v '^/usr/.*\.pyc' | \
+ grep -v '^/usr/.*\.elc' | \
+ grep -v '^/usr/bin/perldoc\.stub$' | \
+ grep -v '^/usr/bin/.*\.notslocate$' | \
+ grep -v '^/usr/lib/courier/.*\.rand$' | \
+ grep -v '^/usr/lib/gconv/gconv-modules\.cache$' | \
+ grep -v '^/usr/lib/graphviz/config$' | \
+ grep -v '^/usr/lib/locale/locale-archive$' | \
+ grep -v '^/usr/share/info/dir$' | \
+ grep -v '^/usr/share/info/dir\.old$' | \
+ grep -v '^/usr/share/emacs21/site-lisp/' | \
+ grep -v '^/usr/share/emacs22/site-lisp/' | \
+ grep -v '^/usr/share/vim/addons/doc/tags$' \
+ > backupfiles
+
+cat conffiles >> backupfiles
 
 cat backupfiles | \
  grep -v ^/home | \
@@ -43,21 +104,16 @@ cat backupfiles | \
  grep -v ^/var/log | \
  grep -v ^/usr/lib/python2.4/ | \
  grep -v ^/var/lib/python-support | \
+ grep -v ^/usr/share/jed/lib | \
  grep -v ^/usr/share/man | \
+ grep -v ^/usr/share/perl5/IkiWiki/Plugin | \
  grep -v ^/media | \
  grep -v ^/vmlinuz | \
  grep -v ^/vmlinuz.old | \
- grep -v '^/sbin/[a-z\-]*.modutils$' | \
- cat > annoyingfiles-
-
-for A in `cat annoyingfiles-`
-do \
-  test -L "$A" || echo "$A"
-done > annoyingfiles
-
-cat annoyingfiles | \
+ grep -v '^/sbin/[a-z\-]*\.modutils$' | \
  grep -v ^/opt/dell/srvadmin/ | \
  grep -v ^/boot/ | \
+ grep -v ^/dev/ | \
  grep -v ^/etc/ | \
  grep -v ^/root/ | \
  grep -v ^/var/ | \
@@ -66,18 +122,73 @@ cat annoyingfiles | \
  grep -v ^/var/lib/mysql/ | \
  grep -v ^/var/lib/postgres/ | \
  grep -v ^/var/lib/postgresql/ | \
- cat > complain
-
-mail -a 'From: Adam Megacz <megacz@hcoop.net>' \
-     -s "annoying files found on deleuze (please do something about them)" admins@hcoop.net \
-     < complain
+ xargs -I{} -d\\n -- bash -c "test -L '{}' || echo '{}'" > complain
 
-tar cvlpjf - -C / -T backupfiles | bzip2 | ccrypt -k $KEYFILE -e > hcoop.backup.tar.bz2.aescrypt
-du -chs hcoop.backup.tar.bz2.aescrypt
+F=hcoop.backup.tar$COMPRESS_EXT.aescrypt
+tar clpf - --ignore-failed-read --no-recursion -C / -T backupfiles | \
+  $COMPRESS_PROG | \
+  ccrypt -k $KEYFILE -e > $F
+copy_over $F
 
-vos listvol deleuze | tail -n +2 | head -n -3 | cut -b1-34 | grep -v "\.backup .*$" | grep -v "\.readonly .*$" > volumes
-for A in `cat volumes`
-do \
-  echo "dumping afs volume $A..."
-  time vos dump -id $A -localauth -clone | bzip2 | ccrypt -k $KEYFILE -e > $A.dump.bz2.aescrypt
+# Acquire lock before messing with spamd
+COUNT=0
+LOCK=/var/local/lib/spamd/.lock
+while test -f $LOCK; do
+    sleep 2m
+    COUNT=$(expr $COUNT + 1)
+    if test $COUNT -eq 10; then
+        # Enough waiting.  Kill the process.
+        P=$(cat $LOCK) || :
+        test -n "$P" && kill $P || :
+        rm -f $LOCK
+        break
+    fi
 done
+touch $LOCK
+
+F=common.spamd.tar$COMPRESS_EXT.aescrypt
+tar clpf - --ignore-failed-read -C / /var/local/lib/spamd | \
+  $COMPRESS_PROG | \
+  ccrypt -k $KEYFILE -e > $F.new
+rm -f $LOCK
+copy_over $F.new ..
+
+test -s $BACKUPDIR/$F.new && \
+    mv $BACKUPDIR/$F.new $BACKUPDIR/$F
+
+vos listvol deleuze | \
+  tail -n +2 | \
+  head -n -3 | \
+  cut -b1-34 | \
+  grep -v "\.backup .*$" | \
+  grep -v "\.readonly .*$" | \
+  sed 's_^ .*__' | \
+  sed 's_ .*$__' | \
+  grep '[A-Za-z]' \
+  > volumes
+
+cat volumes | \
+  grep -v not-backed-up | \
+  xargs -I{} -d\\n -- \
+  bash -c \
+    "F={}.dump$COMPRESS_EXT.aescrypt ;
+     vos dump -id {} -localauth -clone |
+       $COMPRESS_PROG | ccrypt -k $KEYFILE -e > \$F ;
+     < \$F catsync -b $BWLIMIT $BACKUPDIR/$SUBDIR/\$F ;
+     rm -f \$F"
+
+echo backing up databases
+F=databases.tar$COMPRESS_EXT.aescrypt
+tar -C /var/backups/databases/ -cf - . | \
+  $COMPRESS_PROG | \
+  ccrypt -k $KEYFILE -e > $F
+copy_over $F
+
+grep '[a-z/]' complain && \
+  mail -a 'From: The Backup Program <backups@deleuze.hcoop.net>' \
+       -s "automated message: annoying files found on deleuze (please do something about them)" admins@hcoop.net \
+       < complain \
+  || true
+
+echo done
+