r8580: add tests/improvements to ensure-keyword-*
[kmrcl.git] / strings.lisp
index 4d999544d0983c9023b54cddac9e1f7136a5781a..8eb08f74e9faa7ac1b243ee78988db6b2a239444 100644 (file)
@@ -7,7 +7,7 @@
 ;;;; Programmer:    Kevin M. Rosenberg
 ;;;; Date Started:  Apr 2000
 ;;;;
-;;;; $Id: strings.lisp,v 1.51 2003/08/09 21:42:43 kevin Exp $
+;;;; $Id$
 ;;;;
 ;;;; This file, part of KMRCL, is Copyright (c) 2002 by Kevin M. Rosenberg
 ;;;;
       (setq hash (+ hash (char-code (char str i)))))
     (logand hash bitmask)))
 
-(defun string-not-null? (str)
-  (and str (not (zerop (length str)))))
-  
-(defun whitespace? (c) 
-  (declare (character c))
-  (locally (declare (optimize (speed 3) (safety 0)))
-    (or (char= c #\Space) (char= c #\Tab) (char= c #\Return)
-       (char= c #\Linefeed))))
+(defun is-string-empty (str)
+  (zerop (length str)))
+
+(defvar *whitespace-chars* '(#\space #\tab #\return #\linefeed
+                            #+allegro #\%space
+                            #+lispworks #\No-Break-Space))
 
-(defun not-whitespace? (c)
-  (not (whitespace? c)))
+(defun is-char-whitespace (c) 
+  (declare (character c) (optimize (speed 3) (safety 0)))
+  (or (char= c #\Space) (char= c #\Tab) (char= c #\Return)
+      (char= c #\Linefeed)
+      #+allegro (char= c #\%space)
+      #+lispworks (char= c #\No-Break-Space)))
 
-(defun string-ws? (str)
+(defun is-string-whitespace (str)
   "Return t if string is all whitespace"
-  (when (stringp str)
-    (null (find-if #'not-whitespace? str))))
+  (every #'is-char-whitespace str))
+
+(defun string-right-trim-whitespace (str)
+  (string-right-trim *whitespace-chars* str))
+
+(defun string-left-trim-whitespace (str)
+  (string-left-trim *whitespace-chars* str))
+
+(defun string-trim-whitespace (str)
+  (string-trim *whitespace-chars* str))
 
 (defun replaced-string-length (str repl-alist)
   (declare (simple-string str)
@@ -417,7 +427,7 @@ for characters in a string"
        (+ 10 (- code +char-code-upper-a+))
        (- code +char-code-0+))))
 
-(defun uriencode-string (query)
+(defun encode-uri-string (query)
   "Escape non-alphanumeric characters for URI fields"
   (declare (simple-string query)
           (optimize (speed 3) (safety 0) (space 0)))
@@ -440,7 +450,7 @@ for characters in a string"
            (setf (schar str dpos) (hexchar (logand c 15))))
        (setf (schar str dpos) ch)))))
 
-(defun uridecode-string (query)
+(defun decode-uri-string (query)
   "Unescape non-alphanumeric characters for URI fields"
   (declare (simple-string query)
           (optimize (speed 3) (safety 0) (space 0)))
@@ -565,34 +575,62 @@ for characters in a string"
 
 (defun lex-string (string &key (whitespace '(#\space #\newline)))
   "Separates a string at whitespace and returns a list of strings"
-  (flet ((whitespace? (char) (member char whitespace :test #'char=)))
+  (flet ((is-sep (char) (member char whitespace :test #'char=)))
     (let ((tokens nil))
       (do* ((token-start
-             (position-if-not #'whitespace? string) 
+             (position-if-not #'is-sep string) 
              (when token-end
-               (position-if-not #'whitespace? string :start (1+ token-end))))
+               (position-if-not #'is-sep string :start (1+ token-end))))
             (token-end
              (when token-start
-               (position-if #'whitespace? string :start token-start))
+               (position-if #'is-sep string :start token-start))
              (when token-start
-               (position-if #'whitespace? string :start token-start))))
+               (position-if #'is-sep string :start token-start))))
            ((null token-start) (nreverse tokens))
         (push (subseq string token-start token-end) tokens)))))
 
 (defun split-alphanumeric-string (string)
   "Separates a string at any non-alphanumeric chararacter"
-  (flet ((whitespace? (char) (non-alphanumericp char)))
+  (flet ((is-sep (char) (non-alphanumericp char)))
     (let ((tokens nil))
       (do* ((token-start
-             (position-if-not #'whitespace? string) 
+             (position-if-not #'is-sep string) 
              (when token-end
-               (position-if-not #'whitespace? string :start (1+ token-end))))
+               (position-if-not #'is-sep string :start (1+ token-end))))
             (token-end
              (when token-start
-               (position-if #'whitespace? string :start token-start))
+               (position-if #'is-sep string :start token-start))
              (when token-start
-               (position-if #'whitespace? string :start token-start))))
+               (position-if #'is-sep string :start token-start))))
            ((null token-start) (nreverse tokens))
         (push (subseq string token-start token-end) tokens)))))
 
 
+
+(defun collapse-whitespace (s)
+  "Convert multiple whitespace characters to a single space character."
+  (declare (simple-string s)
+          (optimize (speed 3) (safety 0)))
+  (with-output-to-string (stream)
+    (do ((pos 0 (1+ pos))
+        (in-white nil)
+        (len (length s)))
+       ((= pos len))
+      (declare (fixnum pos len))
+      (let ((c (schar s pos)))
+       (declare (character c))
+       (cond
+        ((kl:is-char-whitespace c)
+         (unless in-white
+           (write-char #\space stream))
+         (setq in-white t))
+        (t
+         (setq in-white nil)
+         (write-char c stream)))))))
+
+(defun string->list (string)
+  (let ((eof (list nil)))
+    (with-input-from-string (stream string)
+      (do ((x (read stream nil eof) (read stream nil eof))
+           (l nil (cons x l)))
+          ((eq x eof) (nreverse l))))))