(waiting_for_input): Remove unnecessary prototype.
[bpt/emacs.git] / src / casefiddle.c
index 7780b29..c449547 100644 (file)
@@ -1,5 +1,5 @@
 /* GNU Emacs case conversion functions.
-   Copyright (C) 1985, 1994 Free Software Foundation, Inc.
+   Copyright (C) 1985, 1994, 1997 Free Software Foundation, Inc.
 
 This file is part of GNU Emacs.
 
@@ -25,6 +25,8 @@ Boston, MA 02111-1307, USA.  */
 #include "charset.h"
 #include "commands.h"
 #include "syntax.h"
+#include "composite.h"
+#include "keymap.h"
 
 enum case_action {CASE_UP, CASE_DOWN, CASE_CAPITALIZE, CASE_CAPITALIZE_UP};
 
@@ -37,7 +39,6 @@ casify_object (flag, obj)
 {
   register int i, c, len;
   register int inword = flag == CASE_DOWN;
-  Lisp_Object tem;
 
   /* If the case table is flagged as modified, rescan it.  */
   if (NILP (XCHAR_TABLE (current_buffer->downcase_table)->extras[1]))
@@ -47,34 +48,84 @@ casify_object (flag, obj)
     {
       if (INTEGERP (obj))
        {
-         tem = Faref (current_buffer->downcase_table, obj);
-         if (EQ (tem, Qidentity))
-           tem = obj;
+         int flagbits = (CHAR_ALT | CHAR_SUPER | CHAR_HYPER
+                         | CHAR_SHIFT | CHAR_CTL | CHAR_META);
+         int flags = XINT (obj) & flagbits;
+
+         c = DOWNCASE (XFASTINT (obj) & ~flagbits);
          if (inword)
-           obj = tem;
-         else if (EQ (tem, obj))
+           XSETFASTINT (obj, c | flags);
+         else if (c == (XFASTINT (obj) & ~flagbits))
            {
-             tem = Faref (current_buffer->upcase_table, obj);
-             if (!EQ (tem, Qidentity))
-               obj = tem;
+             c = UPCASE1 ((XFASTINT (obj) & ~flagbits));
+             XSETFASTINT (obj, c | flags);
            }
          return obj;
        }
+
       if (STRINGP (obj))
        {
+         int multibyte = STRING_MULTIBYTE (obj);
+
          obj = Fcopy_sequence (obj);
-         len = XSTRING (obj)->size;
-         for (i = 0; i < len; i++)
+         len = STRING_BYTES (XSTRING (obj));
+
+         /* Scan all single-byte characters from start of string.  */
+         for (i = 0; i < len;)
            {
              c = XSTRING (obj)->data[i];
+
+             if (multibyte && c >= 0x80)
+               /* A multibyte character can't be handled in this
+                   simple loop.  */
+               break;
              if (inword && flag != CASE_CAPITALIZE_UP)
                c = DOWNCASE (c);
              else if (!UPPERCASEP (c)
                       && (!inword || flag != CASE_CAPITALIZE_UP))
                c = UPCASE1 (c);
+             /* If this char won't fit in a single-byte string.
+                fall out to the multibyte case.  */
+             if (multibyte ? ! ASCII_BYTE_P (c)
+                 : ! SINGLE_BYTE_CHAR_P (c))
+               break;
+
              XSTRING (obj)->data[i] = c;
              if ((int) flag >= (int) CASE_CAPITALIZE)
                inword = SYNTAX (c) == Sword;
+             i++;
+           }
+
+         /* If we didn't do the whole string as single-byte,
+            scan the rest in a more complex way.  */
+         if (i < len)
+           {
+             /* The work is not yet finished because of a multibyte
+                character just encountered.  */
+             int fromlen, j_byte = i;
+             char *buf
+               = (char *) alloca ((len - i) * MAX_MULTIBYTE_LENGTH + i);
+
+             /* Copy data already handled.  */
+             bcopy (XSTRING (obj)->data, buf, i);
+
+             /* From now on, I counts bytes.  */
+             while (i < len)
+               {
+                 c = STRING_CHAR_AND_LENGTH (XSTRING (obj)->data + i,
+                                             len - i, fromlen);
+                 if (inword && flag != CASE_CAPITALIZE_UP)
+                   c = DOWNCASE (c);
+                 else if (!UPPERCASEP (c)
+                          && (!inword || flag != CASE_CAPITALIZE_UP))
+                   c = UPCASE1 (c);
+                 i += fromlen;
+                 j_byte += CHAR_STRING (c, buf + j_byte);
+                 if ((int) flag >= (int) CASE_CAPITALIZE)
+                   inword = SYNTAX (c) == Sword;
+               }
+             obj = make_multibyte_string (buf, XSTRING (obj)->size,
+                                          j_byte);
            }
          return obj;
        }
@@ -83,33 +134,33 @@ casify_object (flag, obj)
 }
 
 DEFUN ("upcase", Fupcase, Supcase, 1, 1, 0,
-  "Convert argument to upper case and return that.\n\
-The argument may be a character or string.  The result has the same type.\n\
-The argument object is not altered--the value is a copy.\n\
-See also `capitalize', `downcase' and `upcase-initials'.")
-  (obj)
+       doc: /* Convert argument to upper case and return that.
+The argument may be a character or string.  The result has the same type.
+The argument object is not altered--the value is a copy.
+See also `capitalize', `downcase' and `upcase-initials'.  */)
+     (obj)
      Lisp_Object obj;
 {
   return casify_object (CASE_UP, obj);
 }
 
 DEFUN ("downcase", Fdowncase, Sdowncase, 1, 1, 0,
-  "Convert argument to lower case and return that.\n\
-The argument may be a character or string.  The result has the same type.\n\
-The argument object is not altered--the value is a copy.")
-  (obj)
+       doc: /* Convert argument to lower case and return that.
+The argument may be a character or string.  The result has the same type.
+The argument object is not altered--the value is a copy.  */)
+     (obj)
      Lisp_Object obj;
 {
   return casify_object (CASE_DOWN, obj);
 }
 
 DEFUN ("capitalize", Fcapitalize, Scapitalize, 1, 1, 0,
-  "Convert argument to capitalized form and return that.\n\
-This means that each word's first character is upper case\n\
-and the rest is lower case.\n\
-The argument may be a character or string.  The result has the same type.\n\
-The argument object is not altered--the value is a copy.")
-  (obj)
+       doc: /* Convert argument to capitalized form and return that.
+This means that each word's first character is upper case
+and the rest is lower case.
+The argument may be a character or string.  The result has the same type.
+The argument object is not altered--the value is a copy.  */)
+     (obj)
      Lisp_Object obj;
 {
   return casify_object (CASE_CAPITALIZE, obj);
@@ -118,11 +169,11 @@ The argument object is not altered--the value is a copy.")
 /* Like Fcapitalize but change only the initials.  */
 
 DEFUN ("upcase-initials", Fupcase_initials, Supcase_initials, 1, 1, 0,
-  "Convert the initial of each word in the argument to upper case.\n\
-Do not change the other letters of each word.\n\
-The argument may be a character or string.  The result has the same type.\n\
-The argument object is not altered--the value is a copy.")
-  (obj)
+       doc: /* Convert the initial of each word in the argument to upper case.
+Do not change the other letters of each word.
+The argument may be a character or string.  The result has the same type.
+The argument object is not altered--the value is a copy.  */)
+     (obj)
      Lisp_Object obj;
 {
   return casify_object (CASE_CAPITALIZE_UP, obj);
@@ -131,6 +182,7 @@ The argument object is not altered--the value is a copy.")
 /* flag is CASE_UP, CASE_DOWN or CASE_CAPITALIZE or CASE_CAPITALIZE_UP.
    b and e specify range of buffer to operate on. */
 
+void
 casify_region (flag, b, e)
      enum case_action flag;
      Lisp_Object b, e;
@@ -138,8 +190,10 @@ casify_region (flag, b, e)
   register int i;
   register int c;
   register int inword = flag == CASE_DOWN;
+  register int multibyte = !NILP (current_buffer->enable_multibyte_characters);
   int start, end;
-  Lisp_Object ch, downch, val;
+  int start_byte, end_byte;
+  int changed = 0;
 
   if (EQ (b, e))
     /* Not modifying because nothing marked */
@@ -154,59 +208,56 @@ casify_region (flag, b, e)
   end = XFASTINT (e);
   modify_region (current_buffer, start, end);
   record_change (start, end - start);
+  start_byte = CHAR_TO_BYTE (start);
+  end_byte = CHAR_TO_BYTE (end);
 
-  if (NILP (current_buffer->enable_multibyte_characters))
+  for (i = start_byte; i < end_byte; i++, start++)
     {
-      for (i = start; i < end; i++)
-       {
-         c = FETCH_BYTE (i);
-         if (inword && flag != CASE_CAPITALIZE_UP)
-           c = DOWNCASE (c);
-         else if (!UPPERCASEP (c)
-                  && (!inword || flag != CASE_CAPITALIZE_UP))
-           c = UPCASE1 (c);
-         FETCH_BYTE (i) = c;
-         if ((int) flag >= (int) CASE_CAPITALIZE)
-           inword = SYNTAX (c) == Sword;
-       }
+      int c2;
+      c = c2 = FETCH_BYTE (i);
+      if (multibyte && c >= 0x80)
+       /* A multibyte character can't be handled in this simple loop.  */
+       break;
+      if (inword && flag != CASE_CAPITALIZE_UP)
+       c = DOWNCASE (c);
+      else if (!UPPERCASEP (c)
+              && (!inword || flag != CASE_CAPITALIZE_UP))
+       c = UPCASE1 (c);
+      FETCH_BYTE (i) = c;
+      if (c != c2)
+       changed = 1;
+      if ((int) flag >= (int) CASE_CAPITALIZE)
+       inword = SYNTAX (c) == Sword;
     }
-  else
+  if (i < end_byte)
     {
-      Lisp_Object down, up;
+      /* The work is not yet finished because of a multibyte character
+        just encountered.  */
       int opoint = PT;
+      int opoint_byte = PT_BYTE;
+      int c2;
 
-      down = current_buffer->downcase_table;
-      up = current_buffer->upcase_table;
-      for (i = start; i < end;)
+      while (i < end_byte)
        {
-         c = FETCH_MULTIBYTE_CHAR (i);
-         XSETFASTINT (ch, c);
-         downch = Faref (down, ch);
-         if (EQ (downch, Qidentity))
-           downch = ch;
+         if ((c = FETCH_BYTE (i)) >= 0x80)
+           c = FETCH_MULTIBYTE_CHAR (i);
+         c2 = c;
          if (inword && flag != CASE_CAPITALIZE_UP)
-           val = downch;
-         else if (EQ (downch, ch)
+           c2 = DOWNCASE (c);
+         else if (!UPPERCASEP (c)
                   && (!inword || flag != CASE_CAPITALIZE_UP))
-           {
-             val = Faref (up, ch);
-             if (EQ (val, Qidentity))
-               val = ch;
-           }
-         else
-           val = ch;
-         if (!EQ (val, ch))
+           c2 = UPCASE1 (c);
+         if (c != c2)
            {
              int fromlen, tolen, j;
-             char workbuf[4], *str;
+             unsigned char str[MAX_MULTIBYTE_LENGTH];
 
-             if (!NATNUMP (val))
-               error ("Inappropriate value found in case table");
+             changed = 1;
              /* Handle the most likely case */
-             if (c < 0400 && XFASTINT (val) < 0400)
-               FETCH_BYTE (i) = XFASTINT (val);
-             else if (fromlen = CHAR_STRING (c, workbuf, str),
-                      tolen = CHAR_STRING (XFASTINT (val), workbuf, str),
+             if (c < 0400 && c2 < 0400)
+               FETCH_BYTE (i) = c2;
+             else if (fromlen = CHAR_STRING (c, str),
+                      tolen = CHAR_STRING (c2, str),
                       fromlen == tolen)
                {
                  for (j = 0; j < tolen; ++j)
@@ -217,32 +268,37 @@ casify_region (flag, b, e)
                  error ("Can't casify letters that change length");
 #if 0 /* This is approximately what we'd like to be able to do here */
                  if (tolen < fromlen)
-                   del_range_1 (i + tolen, i + fromlen, 0);
+                   del_range_1 (i + tolen, i + fromlen, 0, 0);
                  else if (tolen > fromlen)
                    {
                      TEMP_SET_PT (i + fromlen);
-                     insert_1 (str + fromlen, tolen - fromlen, 1, 0);
+                     insert_1 (str + fromlen, tolen - fromlen, 1, 0, 0);
                    }
 #endif
                }
            }
          if ((int) flag >= (int) CASE_CAPITALIZE)
-           inword = SYNTAX (XFASTINT (val)) == Sword;
-         INC_POS (i);
+           inword = SYNTAX (c2) == Sword;
+         INC_BOTH (start, i);
        }
-      TEMP_SET_PT (opoint);
+      TEMP_SET_PT_BOTH (opoint, opoint_byte);
     }
 
-  signal_after_change (start, end - start, end - start);
+  start = XFASTINT (b);
+  if (changed)
+    {
+      signal_after_change (start, end - start, end - start);
+      update_compositions (start, end, CHECK_ALL);
+    }
 }
 
 DEFUN ("upcase-region", Fupcase_region, Supcase_region, 2, 2, "r",
-  "Convert the region to upper case.  In programs, wants two arguments.\n\
-These arguments specify the starting and ending character numbers of\n\
-the region to operate on.  When used as a command, the text between\n\
-point and the mark is operated on.\n\
-See also `capitalize-region'.")
-  (beg, end)
+       doc: /* Convert the region to upper case.  In programs, wants two arguments.
+These arguments specify the starting and ending character numbers of
+the region to operate on.  When used as a command, the text between
+point and the mark is operated on.
+See also `capitalize-region'.  */)
+     (beg, end)
      Lisp_Object beg, end;
 {
   casify_region (CASE_UP, beg, end);
@@ -250,11 +306,11 @@ See also `capitalize-region'.")
 }
 
 DEFUN ("downcase-region", Fdowncase_region, Sdowncase_region, 2, 2, "r",
-  "Convert the region to lower case.  In programs, wants two arguments.\n\
-These arguments specify the starting and ending character numbers of\n\
-the region to operate on.  When used as a command, the text between\n\
-point and the mark is operated on.")
-  (beg, end)
+       doc: /* Convert the region to lower case.  In programs, wants two arguments.
+These arguments specify the starting and ending character numbers of
+the region to operate on.  When used as a command, the text between
+point and the mark is operated on.  */)
+     (beg, end)
      Lisp_Object beg, end;
 {
   casify_region (CASE_DOWN, beg, end);
@@ -262,12 +318,12 @@ point and the mark is operated on.")
 }
 
 DEFUN ("capitalize-region", Fcapitalize_region, Scapitalize_region, 2, 2, "r",
-  "Convert the region to capitalized form.\n\
-Capitalized form means each word's first character is upper case\n\
-and the rest of it is lower case.\n\
-In programs, give two arguments, the starting and ending\n\
-character positions to operate on.")
-  (beg, end)
+       doc: /* Convert the region to capitalized form.
+Capitalized form means each word's first character is upper case
+and the rest of it is lower case.
+In programs, give two arguments, the starting and ending
+character positions to operate on.  */)
+     (beg, end)
      Lisp_Object beg, end;
 {
   casify_region (CASE_CAPITALIZE, beg, end);
@@ -278,11 +334,11 @@ character positions to operate on.")
 
 DEFUN ("upcase-initials-region", Fupcase_initials_region,
        Supcase_initials_region, 2, 2, "r",
-  "Upcase the initial of each word in the region.\n\
-Subsequent letters of each word are not changed.\n\
-In programs, give two arguments, the starting and ending\n\
-character positions to operate on.")
-  (beg, end)
+       doc: /* Upcase the initial of each word in the region.
+Subsequent letters of each word are not changed.
+In programs, give two arguments, the starting and ending
+character positions to operate on.  */)
+     (beg, end)
      Lisp_Object beg, end;
 {
   casify_region (CASE_CAPITALIZE_UP, beg, end);
@@ -298,7 +354,7 @@ operate_on_word (arg, newpoint)
   int farend;
   int iarg;
 
-  CHECK_NUMBER (arg, 0);
+  CHECK_NUMBER (arg);
   iarg = XINT (arg);
   farend = scan_words (PT, iarg);
   if (!farend)
@@ -311,10 +367,10 @@ operate_on_word (arg, newpoint)
 }
 
 DEFUN ("upcase-word", Fupcase_word, Supcase_word, 1, 1, "p",
-  "Convert following word (or ARG words) to upper case, moving over.\n\
-With negative argument, convert previous words but do not move.\n\
-See also `capitalize-word'.")
-  (arg)
+       doc: /* Convert following word (or ARG words) to upper case, moving over.
+With negative argument, convert previous words but do not move.
+See also `capitalize-word'.  */)
+     (arg)
      Lisp_Object arg;
 {
   Lisp_Object beg, end;
@@ -327,9 +383,9 @@ See also `capitalize-word'.")
 }
 
 DEFUN ("downcase-word", Fdowncase_word, Sdowncase_word, 1, 1, "p",
-  "Convert following word (or ARG words) to lower case, moving over.\n\
-With negative argument, convert previous words but do not move.")
-  (arg)
+       doc: /* Convert following word (or ARG words) to lower case, moving over.
+With negative argument, convert previous words but do not move.  */)
+     (arg)
      Lisp_Object arg;
 {
   Lisp_Object beg, end;
@@ -342,11 +398,11 @@ With negative argument, convert previous words but do not move.")
 }
 
 DEFUN ("capitalize-word", Fcapitalize_word, Scapitalize_word, 1, 1, "p",
-  "Capitalize the following word (or ARG words), moving over.\n\
-This gives the word(s) a first character in upper case\n\
-and the rest lower case.\n\
-With negative argument, capitalize previous words but do not move.")
-  (arg)
+       doc: /* Capitalize the following word (or ARG words), moving over.
+This gives the word(s) a first character in upper case
+and the rest lower case.
+With negative argument, capitalize previous words but do not move.  */)
+     (arg)
      Lisp_Object arg;
 {
   Lisp_Object beg, end;
@@ -358,6 +414,7 @@ With negative argument, capitalize previous words but do not move.")
   return Qnil;
 }
 \f
+void
 syms_of_casefiddle ()
 {
   Qidentity = intern ("identity");
@@ -375,6 +432,7 @@ syms_of_casefiddle ()
   defsubr (&Scapitalize_word);
 }
 
+void
 keys_of_casefiddle ()
 {
   initial_define_key (control_x_map, Ctl('U'), "upcase-region");