r11859: Canonicalize whitespace
[xmlutils.git] / ChangeLog
1 2003-02-13  Kevin Layer  <layer@crikey>
2
3     from jkf:
4         * phtml.cl: bug13050: parse-html close tag closes consecutive
5           identical open tags
6
7 *******************************************************************************
8 Mon Jun 17 11:29:36 PDT 2002
9 merge from trunk to acl62 branch (for 6.2)
10 command: ../../join.sh trunk acl62 trunk_to_acl62_merge1 xmlutils
11 *******************************************************************************
12
13 2002-05-14  John Foderaro  <jkf@tiger.franz.com>
14
15         * phtml.cl: - add :parse-entities arg to parse-html. If true then
16            entities are converted to the character they represent.
17
18 2002-04-29  John Foderaro  <jkf@tiger.franz.com>
19
20         * pxml1.cl (check-xmldecl): - if the xml tag specifies an 
21          encoding then set lisp's external format to that encoding.
22
23 2001-06-08  Steve Haflich  <smh@romeo>
24         
25         * pxml.htm: Added mention that it is necessary to load or require
26                 the module.  Cleaned up a little html formatting.
27         
28 2001-05-30  John Foderaro  <jkf@tiger.franz.com>
29
30         * phtml.cl - add :,_,- and . to valid attribute name characters.
31
32 2001-03-23  Steve Haflich  <smh@romeo>
33
34         * pxml3.cl: state-dtd-!-element-type-paren-choice-name2 was
35            missing code to handle decls such as
36            <!ELEMENT item1 ((item2 | item3)+ , item4)>
37            which was presumably overlooked in the merge of
38            *-choice and *-seq into a single set of parser states
39            It is quite clear that the dtd parsr does not return correct
40            tree structure in all cases, but this fix may allow it at
41            least to accept legal dtds without signalling error.
42            Also made minor *debug-dtd* enhancements.
43         * pxml[0,1,2,3]: Added dribble-bug version number tracking.
44         
45 2001-02-05 Steve Jacobson <sdj>
46
47         phtml.cl: symbols mapped to preferred case at runtime (as opposed to
48                     a compile time macro determining the case mapping)
49
50 2000-12-20 Steve Jacobson <sdj>
51
52         pxml-test.cl: NameSpace example change to reflect URI module fix
53         pxml.htm: NameSpace example change
54         pxml2.cl: bug10165 fix
55         pxml3.cl: bug10165 fix
56
57 2000-12-05 Steve Jacobson <sdj>
58
59         phtml.cl: add user visible change comment; fix comment spelling error
60         pxml.htm: change ANSI notes to reflect code changes
61         pxml1.cl: use symbol-name where needed to support ANSI case usage
62         pxml2.cl: use symbol-name where needed to support ANSI case usage
63         pxml3.cl: add two declarations to prevent forward referencing compile warnings
64
65 2000-10-27 Steve Jacobson <sdj>
66
67         phtml.cl: check callbacks arg when tag has no body
68                   REMEMBER TO ADD TEST TO PHTML-TEST!!!
69         
70 2000-10-14 Steve Jacobson <sdj>
71
72         phtml-test.cl: add test related to raw mode infinite loop
73         phtml.cl: remove risk of negative buffer index
74                      caused by multiple un-next-char calls in raw mode
75                      fixed it by moving first-pass parse buffer to tokenbuf
76                   removed :script from *in-line* to prevent infinite loop
77                       (it should not have been there, anyway)
78                   fixed :table tag-auto-close-stop typo
79                   don't reopen char format tags within raw mode tags
80         pxml1.cl: changes required by 6.0 unicode changes
81         pxml2.cl: show char code in debug output
82                  
83
84 2000-09-05 Steve Jacobson <sdj>
85
86         New files:
87
88         phtml.htm: HTML version of doc file
89         pxml.htm: HTML version of doc file
90
91         Changed files:
92
93         pxml-test.cl: Add namespace example; change because of xml-error change
94         pxml.txt: Namespace changes and other edits
95         pxml1.cl: namespace support; add format string to xml-error 'error call
96         pxml2.cl: namespace support
97
98 2000-08-16  Steve Jacobson <sdj>
99
100         pxml-test.cl: cleanup for distribution
101         *.cl: add AllegroServe license text
102
103 2000-08-10  Steve Jacobson <sdj>
104
105         phtml-test.cl: add tests for latest changes
106         phtml.cl: allow underscore as tag character
107                   fix <![if ..]> --> (:! "if ..]") bug ('[' lost)
108                   add collect-rogue-tags & no-body-tags arguments to
109                       support 2 pass parse for really bad pages (e.g. New
110                       York Times page)
111                   special inline character formatting close/reopen strategy
112                       preserves any attributes (smh reported bug)
113         phtml.txt: new argument and <! processing documentation
114         pxml0.cl,pxml1.cl,pxml2.cl,pxml3.cl: continued development - now in a state
115                                              to be used by others
116         pxml-test.cl: new file (pending task: add xmltest directories to cvs -
117                                               it will take some work because
118                                               binary files must be indentified)
119         pxml.txt: new documentation file
120
121 2000-07-24 Steve Jacobson <sdj>
122
123         * phtml.cl: handle <script></script> pair with no text between the tags
124                     correctly. Change works for any "raw" mode tag.
125
126         * phtml-test.cl: add test for the above change
127
128 2000-07-17  Kevin Layer  <layer@ultra>
129
130         * *.cl: add rcs id's
131
132 2000-07-17 Steve Jacobson
133
134         * phtml.cl: more robust handling of illegal attribute value HTML:
135                     parse-html "<frame src= foo.html>") => ((frame :src "foo.html"))
136                     (skip spaces after '=' to look for attribute value)
137
138                    <frame> is not a paired tag; it's standalone like <img>
139
140         * phtml-test.cl: add tests for the above two changes
141                  
142
143 2000-06-29 Steve Jacobson
144
145         * phtml: export phtml-internal
146         
147         * phtml.txt: phtml-internal now exported;
148                      describe read-sequence-func return value
149
150 2000-06-26 Steve Jacobson <sdj>
151
152         * phtml.cl: let colon be permissable tag name character;
153                     parse <!...> xml type tags in raw mode with no contents;
154                     parse :script & :style correctly when there are attributes
155                        present
156         
157         * phtml-test.cl: add tests for above changes
158         
159 2000-06-23 Steve Jacobson <sdj>
160
161         * phtml.cl: add autoclose property to :p tag
162
163         * phtml-test.cl: adjust test to reflect that <P> tags can't nest
164
165         * phtml.txt: new file: preliminary documentation
166
167 2000-06-20 Steve Jacobson <sdj>
168
169         * phtml.cl: identify end of input errors
170
171         * phtml-test.cl: add end of input error test
172
173 2000-06-10 Steve Jacobson <sdj>
174
175         * phtml.cl: made input buffer usage thread-safe, without increasing 
176                     consing.
177
178 Fri May 26 22:55:52 PST 2000  Duane Rettig  <duane@beta>
179
180         * Makefile: set SHELL variable
181
182 2000-05-24 Steve Jacobson <sdj>
183
184         * phtml-test.cl: added more character format (<b>,<i>,etc.) tests
185                          test changes to reflect new callback API
186
187         * phtml.cl: removed element-callback support; replaced it with
188                         parse-html :callbacks argument
189                     took *entity-mapping* out of source until we decide to
190                         add entity processing
191                     added some more tags to "character formating" group
192                     changed "character formating" tag parsing to both
193                         coerce parse results to HTML 4.0 spec and also
194                         prevent generating syntax equivalent yet unexpected
195                         results
196         
197 2000-05-17 Steve Jacobson <sdj>
198
199         * phtml.cl: output keyword symbols in upper case when phtml.cl is compiled in
200                     :CASE-INSENSITIVE-UPPER lisp. 
201                     runtime raw mode (<style>,<script>) change to be case insensitive
202
203 2000-05-12 Steve Jacobson <sdj>
204
205         * phtml-test.cl: added tests to check things like <b><i>bold and italic</b>just italic</i>
206         * phtml.cl: accept all characters in undelimited attribute values except for whitespance
207                       and >
208                     handle "interleved" character style tags in a sensible way
209
210 2000-05-09 Steve Jacobson <sdj>
211
212         * phtml-test.cl: added STYLE test
213         * phtml.cl: replaced declaim optimization with declarations in each function
214                     allow / in undelimited attribute value
215                     don't treat :comment as special, but treat :style as special "raw" mode
216
217         
218 2000-04-21  Steve Jacobson <sdj>
219
220         phtml.cl
221
222         * add :callback-only keyword to parse-html methods and change
223           code to speed processing when set to non-nil
224
225         phtml-test.cl
226
227         * complete transition to using test harness
228         * add :callback-only tests and callback test with nested elements
229         
230 2000-04-19  Steve Jacobson <sdj>
231
232         phtml.cl:
233
234         * take out stale comments
235         * use net.html.parser package - exported symbols are:
236               parse-html element-callback
237         * phtml methods renamed parse-html
238         * setf'able element-callback method registers function to be invoked
239           with parse tree output that starts with specified HTML tag
240         * support raw mode in <comment> and <script> tags
241         * parse incorrect HTML in a manner that reflects writer's intentions:
242             <a href=mailto:lmcelroy@performigence.com>lmcelroy@performigence.com</a>
243             is processed as if it read:
244             <a href="mailto:lmcelroy@performigence.com">lmcelroy@performigence.com</a>
245         * :colgroup was incorrectly identified as a tag that can't have a body
246         * fixes resulting from test suite
247
248         phtml-test.cl:
249
250         * reflect above package and symbol changes
251         * use test harness
252         * add tests for element-callback methods
253         * user::testit invokes test suite
254         
255
256 2000-03-28  Steve Jacobson <sdj>
257
258         * take out comments that are no longer relevant
259         * :object shouldn't have tag-no-end property
260         * :dd also closes :dt
261         * first *if clause in close-off-tags has to check that candidate
262           tag may close off more than just the current tag
263
264         * New file: phtml-test.cl - test by:
265           (lhtml-equal (phtml *test-string*) *expected-result*)
266
267 2000-03-28  John Foderaro  <jkf@tiger.franz.com>
268
269         *  add stream when user supplied read-sequence function is called
270
271 2000-03-23  Steve Jacobson <sdj>
272
273         * added state-rawdata lexer state, which can be triggered
274           by calling parser to put lexer in mode where subsequent text
275           is gobbled up into ocdata until the specified delimiter is seen
276
277         * added read-sequence-func arg to next token, so user can 
278           optionally supply function to fetch next sequence of chars;
279           turned phtml stream method into internal function so method args
280           don't change - user who wishes to supply read-sequence-func can
281           either invoke phtml-internal or add a method that calls 
282           phtml-internal with custome read-sequence-func argument
283
284         * added knowledge to parser to reduce number of pcdata outputs that
285           only contain whitespace
286
287         * added large number of tag-auto-close and some tag-auto-close-stop
288           properties to html symbols so parser properly handles all tags
289           with optional end tags