r5246: *** empty log message ***
[kmrcl.git] / strings.lisp
index 6c3eb448881c0d2c235cd5df3b0adffaeef33780..9c031164a11b1adede58e4811314baf0d46addc0 100644 (file)
@@ -7,7 +7,7 @@
 ;;;; Programmer:    Kevin M. Rosenberg
 ;;;; Date Started:  Apr 2000
 ;;;;
-;;;; $Id: strings.lisp,v 1.39 2003/06/12 17:58:45 kevin Exp $
+;;;; $Id: strings.lisp,v 1.46 2003/07/08 00:12:51 kevin Exp $
 ;;;;
 ;;;; This file, part of KMRCL, is Copyright (c) 2002 by Kevin M. Rosenberg
 ;;;;
 
 (defun replaced-string-length (str repl-alist)
   (declare (simple-string str)
-          (fixnum orig-len new-len)
           (optimize (speed 3) (safety 0) (space 0)))
     (do* ((i 0 (1+ i))
          (orig-len (length str))
             (match (assoc c repl-alist :test #'char=)))
        (declare (character c))
        (when match
-         (incf new-len (1- (length (cdr match))))))))
+         (incf new-len (1- (length
+                            (the simple-string (cdr match)))))))))
 
 (defun substitute-chars-strings (str repl-alist)
   "Replace all instances of a chars with a string. repl-alist is an assoc
@@ -274,7 +274,8 @@ Leading zeros are present."
   (do* ((zero-code (char-code #\0))
        (result (make-string len :initial-element #\0))
        (minus? (minusp num))
-       (val (if minus? (- 0 num) num) (floor (/ val 10)))
+       (val (if minus? (- num) num)
+            (nth-value 0 (floor val 10)))
        (pos (1- len) (1- pos))
        (mod (mod val 10) (mod val 10)))
       ((or (zerop val) (minusp pos))
@@ -289,11 +290,13 @@ Leading zeros are present."
   "Outputs a string of LEN digit with an optional initial character PCHAR.
 Leading zeros are present."
   (declare (optimize (speed 3) (safety 0) (space 0))
-          (type fixnum len) (type integer num))
+          (type fixnum len)
+          (type integer num))
   (do* ((zero-code (char-code #\0))
        (result (make-string len :initial-element #\0))
        (minus? (minusp num))
-       (val (if minus? (- 0 num) num) (floor (/ val 10)))
+       (val (if minus? (- 0 num) num)
+            (nth-value 0 (floor val 10)))
        (pos (1- len) (1- pos))
        (mod (mod val 10) (mod val 10)))
       ((or (zerop val) (minusp pos))
@@ -318,6 +321,26 @@ Leading zeros are present."
       (unless (char= (schar str (+ i pos)) (schar substr i))
        (return nil)))))
 
+(defun string-delimited-string-to-list (str substr)
+  "splits a string delimited by substr into a list of strings"
+  (declare (simple-string str substr)
+          (optimize (speed 3) (safety 0) (space 0) (compilation-speed 0)
+                    (debug 0)))
+  (do* ((substr-len (length substr))
+       (strlen (length str))
+       (output '())
+       (pos 0)
+       (end (fast-string-search substr str substr-len pos strlen)
+            (fast-string-search substr str substr-len pos strlen)))
+       ((null end)
+       (when (< pos strlen)
+         (push (subseq str pos) output))
+       (nreverse output))
+    (declare (fixnum strlen substr-len pos)
+            (type (or fixnum null) end))
+    (push (subseq str pos end) output)
+    (setq pos (+ end substr-len))))
+  
 (defun string-to-list-skip-delimiter (str &optional (delim #\space))
   "Return a list of strings, delimited by spaces, skipping spaces."
   (declare (simple-string str)
@@ -332,7 +355,8 @@ Leading zeros are present."
        (when (and i (< i end))
          (push (subseq str i end) results))
        (nreverse results))
-    (declare (fixnum i j end))
+    (declare (fixnum end)
+            (type (or fixnum null) i j))
     (push (subseq str i j) results)))
 
 (defun string-starts-with (start str)
@@ -351,3 +375,131 @@ Leading zeros are present."
     (declare (fixnum i len count))
     (when (char= (schar s i) c)
       (incf count))))
+
+(defun count-string-char-if (pred s)
+  "Return a count of the number of times a predicate is true
+for characters in a string"
+  (declare (simple-string s)
+          (type (or function symbol) pred)
+          (optimize (speed 3) (safety 0) (space 0)))
+  (do ((len (length s))
+       (i 0 (1+ i))
+       (count 0))
+      ((= i len) count)
+    (declare (fixnum i len count))
+    (when (funcall pred (schar s i))
+      (incf count))))
+
+
+;;; URL Encoding
+
+(defun non-alphanumericp (ch)
+  (not (alphanumericp ch)))
+
+(defvar +hex-chars+ "0123456789ABCDEF")
+(declaim (type simple-string +hex-chars+))
+
+(defun hexchar (n)
+  (declare (type (integer 0 15) n))
+  (schar +hex-chars+ n))
+
+(defconstant +char-code-0+ (char-code #\0))
+(defconstant +char-code-upper-a+ (char-code #\A))
+(declaim (type fixnum +char-code-0+ +char-code-upper-a+))
+
+(defun charhex (ch)
+  "convert hex character to decimal"
+  (let ((code (char-code (char-upcase ch))))
+    (declare (fixnum ch)) 
+    (if (>= code +char-code-upper-a+)
+       (+ 10 (- code +char-code-upper-a+))
+       (- code +char-code-0+))))
+
+(defun escape-uri-field (query)
+  "Escape non-alphanumeric characters for URI fields"
+  (declare (simple-string query)
+          (optimize (speed 3) (safety 0) (space 0)))
+  (do* ((count (count-string-char-if #'non-alphanumericp query))
+       (len (length query))
+       (new-len (+ len (* 2 count)))
+       (str (make-string new-len))
+       (spos 0 (1+ spos))
+       (dpos 0 (1+ dpos)))
+      ((= spos len) str)
+    (declare (fixnum count len new-len spos dpos)
+            (simple-string str))
+    (let ((ch (schar query spos)))
+      (if (non-alphanumericp ch)
+         (let ((c (char-code ch)))
+           (setf (schar str dpos) #\%)
+           (incf dpos)
+           (setf (schar str dpos) (hexchar (logand (ash c -4) 15)))
+           (incf dpos)
+           (setf (schar str dpos) (hexchar (logand c 15))))
+       (setf (schar str dpos) ch)))))
+
+(defun unescape-uri-field (query)
+  "Unescape non-alphanumeric characters for URI fields"
+  (declare (simple-string query)
+          (optimize (speed 3) (safety 0) (space 0)))
+  (do* ((count (count-string-char query #\%))
+       (len (length query))
+       (new-len (- len (* 2 count)))
+       (str (make-string new-len))
+       (spos 0 (1+ spos))
+       (dpos 0 (1+ dpos)))
+      ((= spos len) str)
+    (declare (fixnum count len new-len spos dpos)
+            (simple-string str))
+    (let ((ch (schar query spos)))
+      (if (char= #\% ch)
+         (let ((c1 (charhex (schar query (1+ spos))))
+               (c2 (charhex (schar query (+ spos 2)))))
+           (declare (fixnum c1 c2))
+           (setf (schar str dpos)
+                 (code-char (logior c2 (ash c1 4))))
+           (incf spos 2))
+       (setf (schar str dpos) ch)))))
+
+
+(defconstant +char-code-a+ (char-code #\a))
+
+(defun random-string (&optional (len 10))
+  "Returns a random lower-case string."
+  (declare (optimize (speed 3)))
+  (let ((s (make-string len)))
+    (declare (simple-string s))
+    (dotimes (i len s)
+      (setf (schar s i)
+           (code-char (+ +char-code-a+ (random 26)))))))
+
+
+(defun first-char (s)
+  (declare (simple-string s))
+  (when (and (stringp s) (plusp (length s)))
+    (schar s 0)))
+
+(defun last-char (s)
+  (declare (simple-string s))
+  (when (stringp s)
+    (let ((len (length s)))
+      (when (plusp len))
+      (schar s (1- len)))))
+
+(defun ensure-string (v)
+  (typecase v
+    (string v)
+    (character (string v))
+    (symbol (symbol-name v))
+    (otherwise (write-to-string v))))
+
+(defun string-left-trim-one-char (char str)
+  (declare (simple-string str))
+  (let* ((len (length str))
+        (last (1- len)))
+    (declare (fixnum len last))
+    (if (char= char (schar str last))
+       (subseq str 0 last)
+      str)))
+
+