* threads.c (create_thread): Clear parent field in root state in
[bpt/guile.git] / libguile / read.c
index 578e353..6046023 100644 (file)
@@ -1,4 +1,4 @@
-/*     Copyright (C) 1995,1996,1997, 1999, 2000 Free Software Foundation, Inc.
+/* Copyright (C) 1995,1996,1997,1999,2000,2001 Free Software Foundation, Inc.
  * 
  * This program is free software; you can redistribute it and/or modify
  * it under the terms of the GNU General Public License as published by
@@ -39,8 +39,6 @@
  * whether to permit this exception to apply to your modifications.
  * If you do not wish that, delete this exception notice.  */
 
-/* Software engineering face-lift by Greg J. Badros, 11-Dec-1999,
-   gjb@cs.washington.edu, http://www.cs.washington.edu/homes/gjb */
 
 \f
 
 #include "libguile/ports.h"
 #include "libguile/root.h"
 #include "libguile/strings.h"
+#include "libguile/strports.h"
 #include "libguile/vectors.h"
-
 #include "libguile/validate.h"
+
 #include "libguile/read.h"
 
 \f
 
 SCM_SYMBOL (scm_keyword_prefix, "prefix");
 
-scm_option scm_read_opts[] = {
+scm_t_option scm_read_opts[] = {
   { SCM_OPTION_BOOLEAN, "copy", 0,
     "Copy source code expressions." },
   { SCM_OPTION_BOOLEAN, "positions", 0,
@@ -74,14 +73,56 @@ scm_option scm_read_opts[] = {
   { SCM_OPTION_BOOLEAN, "case-insensitive", 0,
     "Convert symbols to lower case."},
   { SCM_OPTION_SCM, "keywords", SCM_UNPACK (SCM_BOOL_F),
-    "Style of keyword recognition: #f or 'prefix"}
+    "Style of keyword recognition: #f or 'prefix."}
 };
 
+/*
+  Give meaningful error messages for errors
+
+  We use the format
+
+  FILE:LINE:COL: MESSAGE
+  This happened in ....
+
+  This is not standard GNU format, but the test-suite likes the real
+  message to be in front.
+
+ */
+
+
+static void
+scm_input_error(char const * function,
+               SCM port, const char * message, SCM arg)
+{
+  char *fn = SCM_STRINGP (SCM_FILENAME(port))
+    ? SCM_STRING_CHARS(SCM_FILENAME(port))
+    : "#<unknown port>";
+
+  SCM string_port =  scm_open_output_string ();
+  SCM string = SCM_EOL;
+  scm_simple_format (string_port,
+                    scm_makfrom0str ("~A:~S:~S: ~A"),
+                    scm_list_4 (scm_makfrom0str (fn),
+                                scm_int2num (SCM_LINUM (port) + 1),
+                                scm_int2num (SCM_COL (port) + 1),
+                                scm_makfrom0str (message)));
+
+    
+  string = scm_get_output_string (string_port);
+  scm_close_output_port (string_port);
+  scm_error_scm (scm_str2symbol ("read-error"),
+                scm_makfrom0str (function),
+                string,
+                SCM_EOL,
+                SCM_BOOL_F);
+}
+
+
 SCM_DEFINE (scm_read_options, "read-options-interface", 0, 1, 0, 
             (SCM setting),
            "Option interface for the read options. Instead of using\n"
            "this procedure directly, use the procedures @code{read-enable},\n"
-           "@code{read-disable}, @code{read-set!} and @var{read-options}.")
+           "@code{read-disable}, @code{read-set!} and @code{read-options}.")
 #define FUNC_NAME s_scm_read_options
 {
   SCM ans = scm_options (setting,
@@ -109,14 +150,14 @@ SCM_DEFINE (scm_read, "read", 0, 1, 0,
 
   if (SCM_UNBNDP (port))
     port = scm_cur_inp;
-  SCM_VALIDATE_OPINPORT (1,port);
+  SCM_VALIDATE_OPINPORT (1, port);
 
   c = scm_flush_ws (port, (char *) NULL);
   if (EOF == c)
     return SCM_EOF_VAL;
   scm_ungetc (c, port);
 
-  tok_buf = scm_makstr (30L, 0);
+  tok_buf = scm_allocate_string (30);
   return scm_lreadr (&tok_buf, port, &copy);
 }
 #undef FUNC_NAME
@@ -126,9 +167,9 @@ SCM_DEFINE (scm_read, "read", 0, 1, 0,
 char *
 scm_grow_tok_buf (SCM *tok_buf)
 {
-  unsigned long int oldlen = SCM_STRING_LENGTH (*tok_buf);
-  SCM newstr = scm_makstr (2 * oldlen, 0);
-  unsigned long int i;
+  size_t oldlen = SCM_STRING_LENGTH (*tok_buf);
+  SCM newstr = scm_allocate_string (2 * oldlen);
+  size_t i;
 
   for (i = 0; i != oldlen; ++i)
     SCM_STRING_CHARS (newstr) [i] = SCM_STRING_CHARS (*tok_buf) [i];
@@ -150,12 +191,10 @@ scm_flush_ws (SCM port, const char *eoferr)
       goteof:
        if (eoferr)
          {
-           if (!SCM_FALSEP (SCM_FILENAME (port)))
-             scm_misc_error (eoferr,
-                             "end of file in ~A",
-                             SCM_LIST1 (SCM_FILENAME (port)));
-           else
-             scm_misc_error (eoferr, "end of file", SCM_EOL);
+           scm_input_error (eoferr,
+                            port,
+                            "end of file",
+                            SCM_EOL);
          }
        return c;
       case ';':
@@ -203,7 +242,7 @@ scm_casei_streq (char *s1, char *s2)
 #define recsexpr(obj, line, column, filename) (obj)
 #else
 static SCM
-recsexpr (SCM obj,int line,int column,SCM filename)
+recsexpr (SCM obj, long line, int column, SCM filename)
 {
   if (!SCM_CONSP(obj)) {
     return obj;
@@ -282,16 +321,16 @@ static SCM scm_get_hash_procedure(int c);
 static char s_list[]="list";
 
 SCM 
-scm_lreadr (SCM *tok_buf,SCM port,SCM *copy)
+scm_lreadr (SCM *tok_buf, SCM port, SCM *copy)
 #define FUNC_NAME "scm_lreadr"
 {
   int c;
-  scm_sizet j;
+  size_t j;
   SCM p;
                                  
-tryagain:
+ tryagain:
   c = scm_flush_ws (port, s_scm_read);
-tryagain_no_flush_ws:
+ tryagain_no_flush_ws:
   switch (c)
     {
     case EOF:
@@ -299,10 +338,10 @@ tryagain_no_flush_ws:
 
     case '(':
       return SCM_RECORD_POSITIONS_P
-            ? scm_lreadrecparen (tok_buf, port, s_list, copy)
-            : scm_lreadparen (tok_buf, port, s_list, copy);
+       ? scm_lreadrecparen (tok_buf, port, s_list, copy)
+       : scm_lreadparen (tok_buf, port, s_list, copy);
     case ')':
-      SCM_MISC_ERROR ("unexpected \")\"", SCM_EOL);
+      scm_input_error (FUNC_NAME, port,"unexpected \")\"", SCM_EOL);
       goto tryagain;
     
     case '\'':
@@ -339,6 +378,28 @@ tryagain_no_flush_ws:
       return p;
     case '#':
       c = scm_getc (port);
+
+      {
+       /* Check for user-defined hash procedure first, to allow
+          overriding of builtin hash read syntaxes.  */
+       SCM sharp = scm_get_hash_procedure (c);
+       if (!SCM_FALSEP (sharp))
+         {
+           int line = SCM_LINUM (port);
+           int column = SCM_COL (port) - 2;
+           SCM got;
+
+           got = scm_call_2 (sharp, SCM_MAKE_CHAR (c), port);
+           if (SCM_EQ_P (got, SCM_UNSPECIFIED))
+             goto handle_sharp;
+           if (SCM_RECORD_POSITIONS_P)
+             return *copy = recsexpr (got, line, column,
+                                      SCM_FILENAME (port));
+           else
+             return got;
+         }
+      }
+    handle_sharp:
       switch (c)
        {
        case '(':
@@ -380,7 +441,7 @@ tryagain_no_flush_ws:
        case '*':
          j = scm_read_token (c, tok_buf, port, 0);
          p = scm_istr2bve (SCM_STRING_CHARS (*tok_buf) + 1, (long) (j - 1));
-         if (SCM_NFALSEP (p))
+         if (!SCM_FALSEP (p))
            return p;
          else
            goto unkshrp;
@@ -397,15 +458,20 @@ tryagain_no_flush_ws:
            return SCM_MAKE_CHAR (c);
          if (c >= '0' && c < '8')
            {
-             p = scm_istr2int (SCM_STRING_CHARS (*tok_buf), (long) j, 8);
-             if (SCM_NFALSEP (p))
+             /* Dirk:FIXME::  This type of character syntax is not R5RS
+              * compliant.  Further, it should be verified that the constant
+              * does only consist of octal digits.  Finally, it should be
+              * checked whether the resulting fixnum is in the range of
+              * characters.  */
+             p = scm_i_mem2number (SCM_STRING_CHARS (*tok_buf), j, 8);
+             if (SCM_INUMP (p))
                return SCM_MAKE_CHAR (SCM_INUM (p));
            }
          for (c = 0; c < scm_n_charnames; c++)
            if (scm_charnames[c]
                && (scm_casei_streq (scm_charnames[c], SCM_STRING_CHARS (*tok_buf))))
              return SCM_MAKE_CHAR (scm_charnums[c]);
-         SCM_MISC_ERROR ("unknown # object", SCM_EOL);
+         scm_input_error (FUNC_NAME, port, "unknown # object", SCM_EOL);
 
          /* #:SYMBOL is a syntax for keywords supported in all contexts.  */
        case ':':
@@ -418,15 +484,13 @@ tryagain_no_flush_ws:
          {
            SCM sharp = scm_get_hash_procedure (c);
 
-           if (SCM_NIMP (sharp))
+           if (!SCM_FALSEP (sharp))
              {
                int line = SCM_LINUM (port);
                int column = SCM_COL (port) - 2;
                SCM got;
 
-               got = scm_apply (sharp,
-                                SCM_MAKE_CHAR (c),
-                                scm_acons (port, SCM_EOL, SCM_EOL));
+               got = scm_call_2 (sharp, SCM_MAKE_CHAR (c), port);
                if (SCM_EQ_P (got, SCM_UNSPECIFIED))
                  goto unkshrp;
                if (SCM_RECORD_POSITIONS_P)
@@ -437,8 +501,8 @@ tryagain_no_flush_ws:
              }
          }
        unkshrp:
-         scm_misc_error (s_scm_read, "Unknown # object: ~S",
-                         SCM_LIST1 (SCM_MAKE_CHAR (c)));
+       scm_input_error (FUNC_NAME, port, "Unknown # object: ~S",
+                    scm_list_1 (SCM_MAKE_CHAR (c)));
        }
 
     case '"':
@@ -446,7 +510,7 @@ tryagain_no_flush_ws:
       while ('"' != (c = scm_getc (port)))
        {
          if (c == EOF)
-           SCM_MISC_ERROR ("end of file in string constant", SCM_EOL);
+           scm_input_error (FUNC_NAME, port, "end of file in string constant", SCM_EOL);
 
          while (j + 2 >= SCM_STRING_LENGTH (*tok_buf))
            scm_grow_tok_buf (tok_buf);
@@ -484,21 +548,21 @@ tryagain_no_flush_ws:
       if (j == 0)
        return scm_nullstr;
       SCM_STRING_CHARS (*tok_buf)[j] = 0;
-      {
-       SCM str;
-       str = scm_makfromstr (SCM_STRING_CHARS (*tok_buf), j, 0);
-       return str;
-      }
+      return scm_mem2string (SCM_STRING_CHARS (*tok_buf), j);
 
-    case'0':case '1':case '2':case '3':case '4':
-    case '5':case '6':case '7':case '8':case '9':
+    case '0': case '1': case '2': case '3': case '4':
+    case '5': case '6': case '7': case '8': case '9':
     case '.':
     case '-':
     case '+':
     num:
       j = scm_read_token (c, tok_buf, port, 0);
-      p = scm_istring2number (SCM_STRING_CHARS (*tok_buf), (long) j, 10L);
-      if (SCM_NFALSEP (p))
+      if (j == 1 && (c == '+' || c == '-'))
+       /* Shortcut:  Detected symbol '+ or '- */
+       goto tok;
+
+      p = scm_i_mem2number (SCM_STRING_CHARS (*tok_buf), j, 10);
+      if (!SCM_FALSEP (p))
        return p;
       if (c == '#')
        {
@@ -508,7 +572,7 @@ tryagain_no_flush_ws:
              c = SCM_STRING_CHARS (*tok_buf)[1];
              goto callshrp;
            }
-         SCM_MISC_ERROR ("unknown # object", SCM_EOL);
+         scm_input_error (FUNC_NAME, port, "unknown # object", SCM_EOL);
        }
       goto tok;
 
@@ -535,10 +599,10 @@ tryagain_no_flush_ws:
 _Pragma ("noopt");             /* # pragma _CRI noopt */
 #endif
 
-scm_size
+size_
 scm_read_token (int ic, SCM *tok_buf, SCM port, int weird)
 {
-  register scm_sizet j;
+  register size_t j;
   register int c;
   register char *p;
 
@@ -639,7 +703,7 @@ scm_lreadparen (SCM *tok_buf, SCM port, char *name, SCM *copy)
       ans = scm_lreadr (tok_buf, port, copy);
     closeit:
       if (')' != (c = scm_flush_ws (port, name)))
-       SCM_MISC_ERROR ("missing close paren", SCM_EOL);
+       scm_input_error (FUNC_NAME, port, "missing close paren", SCM_EOL);
       return ans;
     }
   ans = tl = scm_cons (tmp, SCM_EOL);
@@ -679,7 +743,7 @@ scm_lreadrecparen (SCM *tok_buf, SCM port, char *name, SCM *copy)
     {
       ans = scm_lreadr (tok_buf, port, copy);
       if (')' != (c = scm_flush_ws (port, name)))
-       SCM_MISC_ERROR ("missing close paren", SCM_EOL);
+       scm_input_error (FUNC_NAME, port, "missing close paren", SCM_EOL);
       return ans;
     }
   /* Build the head of the list structure. */
@@ -703,7 +767,7 @@ scm_lreadrecparen (SCM *tok_buf, SCM port, char *name, SCM *copy)
                                       : tmp,
                                       SCM_EOL));
          if (')' != (c = scm_flush_ws (port, name)))
-           SCM_MISC_ERROR ("missing close paren", SCM_EOL);
+           scm_input_error (FUNC_NAME, port, "missing close paren", SCM_EOL);
          goto exit;
        }
 
@@ -749,9 +813,10 @@ SCM_DEFINE (scm_read_hash_extend, "read-hash-extend", 2, 0, 0,
   SCM this;
   SCM prev;
 
-  SCM_VALIDATE_CHAR (1,chr);
-  SCM_ASSERT (SCM_FALSEP (proc) || SCM_NIMP(proc), proc, SCM_ARG2,
-             FUNC_NAME);
+  SCM_VALIDATE_CHAR (1, chr);
+  SCM_ASSERT (SCM_FALSEP (proc)
+             || SCM_EQ_P (scm_procedure_p (proc), SCM_BOOL_T),
+             proc, SCM_ARG2, FUNC_NAME);
 
   /* Check if chr is already in the alist.  */
   this = *scm_read_hash_procedures;
@@ -761,7 +826,7 @@ SCM_DEFINE (scm_read_hash_extend, "read-hash-extend", 2, 0, 0,
       if (SCM_NULLP (this))
        {
          /* not found, so add it to the beginning.  */
-         if (SCM_NFALSEP (proc))
+         if (!SCM_FALSEP (proc))
            {
              *scm_read_hash_procedures = 
                scm_cons (scm_cons (chr, proc), *scm_read_hash_procedures);
@@ -819,12 +884,10 @@ void
 scm_init_read ()
 {
   scm_read_hash_procedures =
-    SCM_CDRLOC (scm_sysintern ("read-hash-procedures", SCM_EOL));
+    SCM_VARIABLE_LOC (scm_c_define ("read-hash-procedures", SCM_EOL));
 
   scm_init_opts (scm_read_options, scm_read_opts, SCM_N_READ_OPTIONS);
-#ifndef SCM_MAGIC_SNARFER
 #include "libguile/read.x"
-#endif
 }
 
 /*