hcoop-backup: Take file from stdin and split it.
[hcoop/scripts.git] / hcoop-backup
index 5f499b8..39fb266 100755 (executable)
@@ -1,44 +1,43 @@
 #!/bin/bash -e
 
 #
-# run this script as root, on deleuze, in a directory that WILL NOT be
-# part of the backup (/tmp is a good choice).
+# it is dangerous to remove the "-e" above; please don't do that.
 #
 
-# FIXME:
-# postgres dumps
-# mysql dumps
+#
+# run this script as root, on deleuze
+#
 
-#umask 0644
+exec >& /var/log/backup-to-s3-log
 
-# for catsync
-#PATH=$PATH:/home/megacz_admin/
+PATH=$PATH:/bin:/usr/bin:/sbin:/usr/sbin
 #COMPRESS_EXT=.bz2
 #COMPRESS_PROG=bzip2
 COMPRESS_EXT=.gz
 COMPRESS_PROG=gzip
-
-#KEYFILE=$1
 KEYFILE=/etc/backup-encryption-key
-BACKUPDIR=/afs/megacz.com/hcoop-backup/
+BACKUPTMP=/var/backups/hcoop-backup-testing
+
+MOVE_OVER=$(dirname $0)/s3-move
+
+IFS=$'\n'
 
-cd $BACKUPDIR
-find * -prune -ctime +2 -exec rm -rf {} \;
+#prune_old_backups
 
-SUBDIR=`date +%Y.%m.%d`
-rm -rf $SUBDIR
-mkdir -p $SUBDIR
-cd $SUBDIR
+mkdir -p $BACKUPTMP
+cd $BACKUPTMP
 
+groups
 echo 'I am in:'
 pwd
 echo
 
 echo building package lists...
 dpkg-query -W -f='${Package}\n' > packages
-(cd /; sudo find / /usr/ /usr/local/ /var/ -xdev)   | sort | uniq > allfiles
+(cd /; find / /usr/ /usr/local/ /var/ -xdev)   | sort | uniq > allfiles
 dpkg-query -W -f='${Package}\n'      | xargs dpkg -L | sort | uniq > debfiles
-dpkg-query -W -f='${Conffiles}\n'           | grep / | cut -b2- | sed 's_ .*__' | sort | uniq > conffiles
+dpkg-query -W -f='${Conffiles}\n'           | grep / | cut -b2- | \
+  sed 's_ .*__' | sort | uniq > conffiles
 
 diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v ^/var/cache | \
@@ -46,6 +45,7 @@ diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v ^/var/lib/dpkg | \
  grep -v ^/var/backups | \
  grep -v ^/var/lib/changetrack | \
+ grep -v ^/var/local/lib/spamd | \
  grep -v ^/var/run | \
  grep -v ^/var/lock | \
  grep -v ^/var/lib/ucf | \
@@ -59,6 +59,7 @@ diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v '^/usr/.*\.pyc' | \
  grep -v '^/usr/.*\.elc' | \
  grep -v '^/usr/bin/perldoc\.stub$' | \
+ grep -v '^/usr/bin/.*\.notslocate$' | \
  grep -v '^/usr/lib/courier/.*\.rand$' | \
  grep -v '^/usr/lib/gconv/gconv-modules\.cache$' | \
  grep -v '^/usr/lib/graphviz/config$' | \
@@ -67,8 +68,9 @@ diff allfiles debfiles | grep '^<' | cut -b 3- | \
  grep -v '^/usr/share/info/dir\.old$' | \
  grep -v '^/usr/share/emacs21/site-lisp/' | \
  grep -v '^/usr/share/emacs22/site-lisp/' | \
- grep -v '^/usr/share/vim/addons/doc/tags$' | \
- cat > backupfiles
+ grep -v '^/usr/share/snmp/mibs/\.index$' | \
+ grep -v '^/usr/share/vim/addons/doc/tags$' \
+ > backupfiles
 
 cat conffiles >> backupfiles
 
@@ -79,26 +81,13 @@ cat backupfiles | \
  grep -v ^/var/log | \
  grep -v ^/usr/lib/python2.4/ | \
  grep -v ^/var/lib/python-support | \
+ grep -v ^/usr/share/jed/lib | \
  grep -v ^/usr/share/man | \
  grep -v ^/usr/share/perl5/IkiWiki/Plugin | \
  grep -v ^/media | \
  grep -v ^/vmlinuz | \
  grep -v ^/vmlinuz.old | \
  grep -v '^/sbin/[a-z\-]*\.modutils$' | \
- cat > annoyingfiles-
-
-OLDIFS=$IFS
-IFS="
-"
-
-for A in `cat annoyingfiles-`
-do \
-  test -L "$A" || echo "$A"
-done > annoyingfiles
-
-IFS=$OLDIFS
-
-cat annoyingfiles | \
  grep -v ^/opt/dell/srvadmin/ | \
  grep -v ^/boot/ | \
  grep -v ^/dev/ | \
@@ -110,19 +99,37 @@ cat annoyingfiles | \
  grep -v ^/var/lib/mysql/ | \
  grep -v ^/var/lib/postgres/ | \
  grep -v ^/var/lib/postgresql/ | \
- cat > complain
-
-grep '[a-z/]' complain && \
-  mail -a 'From: Adam Megacz <megacz@hcoop.net>' \
-       -s "automated message: annoying files found on deleuze (please do something about them)" admins@hcoop.net \
-       < complain
+ xargs -I{} -d\\n -- bash -c "test -L '{}' || echo '{}'" > complain
 
-cp backupfiles /tmp/backupfiles
-(cd /; sudo tar cvlpf - --ignore-failed-read --no-recursion -C / -T /tmp/backupfiles) | \
+F=hcoop.backup.tar$COMPRESS_EXT.aescrypt
+tar clpf - --ignore-failed-read --no-recursion -C / -T backupfiles | \
   $COMPRESS_PROG | \
   ccrypt -k $KEYFILE -e | \
-  catsync hcoop.backup.tar$COMPRESS_EXT.aescrypt
-du -chs hcoop.backup.tar$COMPRESS_EXT.aescrypt
+  $MOVE_OVER $F
+
+# Acquire lock before messing with spamd
+COUNT=0
+LOCK=/var/local/lib/spamd/.lock
+while test -f $LOCK; do
+    sleep 2m
+    COUNT=$(expr $COUNT + 1)
+    if test $COUNT -eq 10; then
+        # Enough waiting.  Kill the process.
+        P=$(cat $LOCK) || :
+        test -n "$P" && kill $P || :
+        rm -f $LOCK
+        break
+    fi
+done
+touch $LOCK
+
+F=common.spamd.tar$COMPRESS_EXT.aescrypt
+tar clpf - --ignore-failed-read -C / /var/local/lib/spamd | \
+  $COMPRESS_PROG | \
+  ccrypt -k $KEYFILE -e > $F
+rm -f $LOCK
+< $F $MOVE_OVER $F
+rm -f $F
 
 vos listvol deleuze | \
   tail -n +2 | \
@@ -130,30 +137,32 @@ vos listvol deleuze | \
   cut -b1-34 | \
   grep -v "\.backup .*$" | \
   grep -v "\.readonly .*$" | \
-  cat > volumes
-
-echo volume list:
-cat volumes | grep -v not-backed-up
-
-IFS="
-"
-
-for A in `cat volumes | grep -v not-backed-up`
-do \
-  echo "dumping afs volume $A..."
-  vos dump -id $A -localauth -clone | \
-       $COMPRESS_PROG | \
-       ccrypt -k $KEYFILE -e | \
-       catsync $A.dump$COMPRESS_EXT.aescrypt
-  echo "  finished dumping afs volume $A."
-done
+  sed 's_^ .*__' | \
+  sed 's_ .*$__' | \
+  grep '[A-Za-z]' \
+  > volumes
+
+cat volumes | \
+  grep -v not-backed-up | \
+  xargs -I{} -d\\n -- \
+  bash -c \
+    "F={}.dump$COMPRESS_EXT.aescrypt ;
+     vos dump -id {} -localauth -clone |
+       $COMPRESS_PROG | ccrypt -k $KEYFILE -e |
+       $MOVE_OVER \$F"
+
+echo backing up databases
+F=databases.tar$COMPRESS_EXT.aescrypt
+tar -C /var/backups/databases/ -cf - . | \
+  $COMPRESS_PROG | \
+  ccrypt -k $KEYFILE -e | \
+  $MOVE_OVER $F
 
-# for some reason this has been causing the backups to abort...
-#echo backing up databases
-#tar -C /var/backups/databases/ -cf - . | \
-#  $COMPRESS_PROG | \
-#  ccrypt -k $KEYFILE -e \
-#  | catsync databases.tar$COMPRESS_EXT.aescrypt
+grep '[a-z/]' complain && \
+  mail -a 'From: The Backup Program <backups@deleuze.hcoop.net>' \
+       -s "automated message: annoying files found on deleuze (please do something about them)" admins@hcoop.net \
+       < complain \
+  || true
 
 echo done