<?xml-stylesheet type="text/xsl" href="./local.xsl"?> 
<!DOCTYPE TEI.2 PUBLIC '-//C. M. Sperberg-McQueen//DTD
          TEI Lite 1.0 plus SWeb (XML)//EN'
          './../../../lib/swebxml.dtd' [
<!ATTLIST list type CDATA 'bullets' >
<!ATTLIST seg  rend CDATA 'incremental' >
<!ATTLIST xref href CDATA '' >

<!ATTLIST item id ID #IMPLIED >
<!ATTLIST div id ID #IMPLIED >
<!ATTLIST item id ID #IMPLIED >

<!ENTITY date.last.touched '24. Januar 2013'>

<!ENTITY S "<hi rend='ital'>S</hi>">
<!ENTITY A "<hi rend='ital'>A</hi>">


<!ENTITY equiv  "&#x2261;" ><!--/equiv R: =identical with-->
<!ENTITY exist  "&#x2203;" ><!--/exists =at least one exists-->
<!ENTITY forall "&#x2200;" ><!--/forall =for all-->
<!ENTITY iff    "&#x2194;" ><!--/iff =if and only if-->
<!ENTITY iff    "&#x21D4;" ><!--/iff =if and only if-->
<!ENTITY isin   "&#x2208;" ><!--/in R: =set membership-->
<!ENTITY not    "&#xAC;" ><!--/neg /lnot =not sign-->
<!ENTITY rArr   "&#x21D2;" ><!--/Rightarrow A: =implies-->
<!ENTITY rarr   "&#x2192;" ><!--/rightarrow /to A: =rightward arrow-->
<!ENTITY rarr   "&#x2192;" ><!--/rightarrow /to A: =rightward arrow-->
<!ENTITY rarr   "&#x2192;" ><!--/rightarrow /to A: =rightward arrow-->

<!ENTITY exist  "&#x2203;" ><!--/exists =at least one exists-->
<!ENTITY Sigma  "&#x03A3;"><!--=capital Sigma, Greek-->

<!ENTITY Acirc   "&#194;" ><!-- capital A, circumflex accent -->
<!ENTITY Ecirc   "&#202;" ><!-- capital E, circumflex accent -->
<!ENTITY Icirc   "&#206;" ><!-- capital I, circumflex accent -->
<!ENTITY Ocirc   "&#212;" ><!-- capital O, circumflex accent -->
<!ENTITY Ucirc   "&#219;" ><!-- capital U, circumflex accent -->
<!ENTITY Uuml    "&#220;" ><!-- capital U, dieresis or umlaut mark -->
<!ENTITY acirc   "&#226;" ><!-- small a, circumflex accent -->
<!ENTITY aelig   "&#230;" ><!-- small ae diphthong (ligature) -->
<!ENTITY ap     "&#x2249;" ><!--/approx R: =approximate-->
<!ENTITY approx "&#x2245;" ><!-- approximately equal to -->
<!ENTITY auml    "&#228;" ><!-- small a, dieresis or umlaut mark -->
<!ENTITY ccedil  "&#231;" ><!-- small c, cedilla -->
<!ENTITY darr   "&#x2193;" ><!--/downarrow A: =downward arrow-->
<!ENTITY eacute  "&#233;" ><!-- small e, acute accent -->
<!ENTITY ecirc   "&#234;" ><!-- small e, circumflex accent -->
<!ENTITY equiv  "&#x2261;" ><!--/equiv R: =identical with-->
<!ENTITY ge     "&#x2265;" ><!--/geq /ge R: =greater-than-or-equal-->
<!ENTITY hellip "&#x2026;" ><!--=ellipsis (horizontal)-->
<!ENTITY icirc   "&#238;" ><!-- small i, circumflex accent -->
<!ENTITY iquest "&#xBF;" ><!--=inverted question mark-->
<!ENTITY larr   "&#x2190;" ><!--/leftarrow /gets A: =leftward arrow-->
<!ENTITY ldquo  "&#x201C;" ><!--=double quotation mark, left-->
<!ENTITY le     "&#x2264;" ><!--/leq /le R: =less-than-or-equal-->
<!ENTITY lsquo  "&#x2018;" ><!--=single quotation mark, left-->
<!ENTITY mdash  "&#x2014;" ><!--=em dash-->
<!ENTITY nbsp   "&#160;" ><!--=no break (required) space-->
<!ENTITY ne     "&#x2260;" ><!--/ne /neq R: =not equal-->
<!ENTITY ntilde  "&#241;" ><!-- small n, tilde -->
<!ENTITY ocirc   "&#244;" ><!-- small o, circumflex accent -->
<!ENTITY ouml    "&#246;" ><!-- small o, dieresis or umlaut mark -->
<!ENTITY ouml    "&#246;" ><!-- small o, dieresis or umlaut mark -->
<!ENTITY quest  "?" ><!--=question mark-->
<!ENTITY rArr   "&#x21D2;" ><!--/Rightarrow A: =implies-->
<!ENTITY rarr   "&#x2192;" ><!--/rightarrow /to A: =rightward arrow-->
<!ENTITY rdquo  "&#x201D;" ><!--=double quotation mark, right-->
<!ENTITY rsquo  "&#x2019;" ><!--=single quotation mark, right-->
<!ENTITY sim    "&#x223C;" ><!--/sim R: =similar-->
<!ENTITY sime   "&#x2243;" ><!--/simeq R: =similar, equals-->
<!ENTITY szlig   "&#223;" ><!-- small sharp s, German (sz ligature) -->
<!ENTITY times  "&#215;" ><!--/times B: =multiply sign-->
<!ENTITY uarr   "&#x2191;" ><!--/uparrow A: =upward arrow-->
<!ENTITY ucirc   "&#251;" ><!-- small u, circumflex accent -->
<!ENTITY uuml    "&#252;" ><!-- small u, dieresis or umlaut mark -->

<!ENTITY forall "for all" ><!--/forall =for all-->
<!ENTITY implies "&rarr;" ><!-- my generic implication -->

<!ENTITY P "<ident>P</ident>" >
<!ENTITY Q "<ident>Q</ident>" >

<!NOTATION PNG SYSTEM "image/png">
<!NOTATION JPEG SYSTEM "image/jpeg">
<!NOTATION BMP SYSTEM "image/bmp">

<!ENTITY Walther-abbrev-nows-gi-text SYSTEM 
         "images/Walther-abbrev-nows-gi-text.svg">
<!ENTITY Walther-abbrev-nows-gi-notext 
         SYSTEM "images/Walther-abbrev-nows-gi-notext.svg">
<!ENTITY Codex_Manesse_Walther_von_der_Vogelweide-394x599 
         SYSTEM "images/Codex_Manesse_Walther_von_der_Vogelweide-394x599.jpg" 
         NDATA JPEG>
<!ENTITY Punch-card-blue 
         SYSTEM "images/Punch-card-blue.jpg" NDATA JPEG>

<!ENTITY Codex_Manesse_130v SYSTEM "images/Codex_Manesse_130v.jpg"
         NDATA JPEG>
<!ENTITY Walther-ed-Lachmann-p39 SYSTEM
         "images/Walther-ed-Lachmann-p39.png"
         NDATA PNG>
]>
<TEI.2>
<teiHeader>
<fileDesc>
<titleStmt>
<title type="main">SGML, XML in zehn und zwanzig Jahren</title>
<title type="sub">Zur&uuml;ckblicken, vorausschauen</title>
</titleStmt>
<publicationStmt>
<pubPlace>Espa&ntilde;ola, New Mexico</pubPlace>
<publisher>Black Mesa Technologies LLC</publisher>
<date>2013</date>
</publicationStmt>
<sourceDesc>
<p>No source; created in electronic form.</p>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<front>
<titlePage>
<docTitle>
<titlePart>SGML, XML in 10 und 20 Jahren</titlePart>
<titlePart>Zur&uuml;ckblicken, vorausschauen</titlePart>
</docTitle>

<docAuthor>C. M. Sperberg-McQueen, Black Mesa Technologies LLC</docAuthor>
<docDate>Rev. &date.last.touched;</docDate>

</titlePage>

<div id="navbar" type="navbar">
<head>Nearby documents</head>
<divGen type="toc"/>
<list>
<!--* <item><xref href="online.html">Online interface to Thutmose II</xref></item>
      <item><xref href="progdoc.xml">Programmers' documentation</xref></item>
    *-->
<item id="siteroot"><xref href="./../../..">Home</xref></item>
</list>
</div>
</front>
<body>

<div>
<head>&Uuml;berblick</head>
<list>
  <item>Woher?</item>
  <item>Wo?</item>
  <item>Wohin?</item>
</list>
</div>

<div>
<head>Woher?</head>
<list>
<item>maschinenlesbare Texte (gibt es sie?)</item>
<item>Textdarstellung</item>
<item>Ausdruckskraft, Kosten, Wiederverwendbarkeit &rArr; Ontologie</item>
<item>Formatierungssprachen, Auszeichnungssprachen, Mischsprachen</item>
<item>SGML</item>
<item>Ziele von XML</item>
</list>

<div>
<head>Maschinenlesbarer Text</head>
<p rend="incremental">Gibt es elektronische / maschinenlesbare Texte?</p>
<p rend="incremental">Elektronisch sein kann nur K&ouml;rperliches.</p>
<p rend="incremental">Der Text aber besteht aus sprachlichen Äußerungen, 
die man k&ouml;rperlich darstellen, wiedergeben, oder realisieren
kann.  Doch die Darstellung eines Dings ist nicht das Ding selbst.</p>
<p rend="incremental">Texte kann man elektronisch darstellen,
sie k&ouml;nnen aber nicht im Wesen elektronisch sein.</p>
</div>

<div>
<head>Textdarstellung</head>
<p>Wie kann man in maschinenlesbarer Form Texte
darstellen?</p>
</div>

<div>
<head>Der <soCalled>reine</soCalled> Text (?)</head>
<p>Viele meinen spontan, es genüge, den Text als
Zeichenfolge nachzuschreiben:<eg>
“Under der linden
an der heide,
dâ unser zweier bette was,
dâ mugent ir vinden
schône beide
gebrochen bluomen unde gras.
vor dem walde in einem tal,
tandaradei,
     schône sanc diu nahtegal.

  Ich kam gegangen
zuo der ouwe:
dô was mîn friedel komen ê.
dâ wart ich empfangen
hêre frouwe,
daz ich bin sælic iemer mê.
kuster mich? wol tûsentstunt:
tandaradei,
     seht wie rôt mir ist der munt.

  Dô het er gemachet
alsô rîche
von bluomen eine bettestat.
des wirt noch gelachet
inneclîche,
kumt iemen an daz selbe pfat.
bî den rôsen er wol mac,
tandaradei,
     merken wâ mirz houbet lac.

  Daz er bî mir læge,
wessez iemen
(nu enwelle got!), sô schamt ich mich
wes er mit mir pflæge,
niemer niemen
bevinde daz, wan er unt ich,
und ein kleinez vogellîn:
tandaradei,
     daz mac wol getriuwe sîn.”
</eg></p>
</div>

<div>
<head>Die Lochkartenbarriere</head>
<p>Aber der Zugang zu der Maschine wird abgesperrt:
<figure entity="Punch-card-blue">
</figure>
</p>
</div>

<div>
<head>Lochkartenzeichensatz</head>
<p>Die ersten Versuche sehen eher so aus:
<eg>'UNDER DER LINDEN
AN DER HEIDE,
DA= UNSER ZWEIER BETTE WAS,
DA= MUGENT IR VINDEN
SCHO=NE BEIDE
GEBROCHEN BLUOMEN UNDE GRAS.
VOR DEM WALDE IN EINEM TAL,
TANDARADEI,
SCHO=NE SANC DIU NAHTEGAL.
ICH KAM GEGANGEN
ZUO DER OUWE$..
DO= WAS MI=N FRIEDEL KOMEN E=.
DA= WART ICH EMPFANGEN
HE=RE FROUWE,
DAZ ICH BIN SA+ELIC IEMER ME=.
KUSTER MICH)+. WOL TU=SENTSTUNT$..
TANDARADEI,
SEHT WIE RO=T MIR IST DER MUNT.
DO= HET ER GEMACHET
ALSO= RI=CHE
VON BLUOMEN EINE BETTESTAT.
DES WIRT NOCH GELACHET
INNECLI=CHE,
KUMT IEMEN AN DAZ SELBE PFAT.
BI= DEN RO=SEN ER WOL MAC,
TANDARADEI,
MERKEN WA= MIRZ HOUBET LAC.
DAZ ER BI= MIR LA+EGE,
WESSEZ IEMEN
(NU ENWELLE GOT'+.), SO= SCHAMT ICH MICH
WES ER MIT MIR PFLA+EGE,
NIEMER NIEMEN
BEVINDE DAZ, WAN ER UNT ICH,
UND EIN KLEINEZ VOGELLI=N$..
TANDARADEI,
DAZ MAC WOL GETRIUWE SI=N.'
</eg></p>
</div>

<div>
<head>Die Lochkartenfolge</head>
<p>Wenn man die Groß- und Kleinschreibung (und die Zeilenfolge!)
festhält, dann etwa:
<eg>02023911'*UNDER DER LINDEN
02023912AN DER HEIDE,
02023913DA= UNSER ZWEIER BETTE WAS,
02023914DA= MUGENT IR VINDEN
02023915SCHO=NE BEIDE
02023916GEBROCHEN BLUOMEN UNDE GRAS.
02023917VOR DEM WALDE IN EINEM TAL,
02023918TANDARADEI,
02023919SCHO=NE SANC DIU NAHTEGAL.
02023920*ICH KAM GEGANGEN
02023921ZUO DER OUWE$..
02023922DO= WAS MI=N FRIEDEL KOMEN E=.
02023923DA= WART ICH EMPFANGEN
02023924HE=RE FROUWE,
02023925DAZ ICH BIN SA+ELIC IEMER ME=.
02023926KUSTER MICH)+. WOL TU=SENTSTUNT$..
02023927TANDARADEI,
02023928SEHT WIE RO=T MIR IST DER MUNT.
02024001*DO= HET ER GEMACHET
02024002ALSO= RI=CHE
02024003VON BLUOMEN EINE BETTESTAT.
02024004DES WIRT NOCH GELACHET
02024005INNECLI=CHE,
02024006KUMT IEMEN AN DAZ SELBE PFAT.
02024007BI= DEN RO=SEN ER WOL MAC,
02024008TANDARADEI,
02024009MERKEN WA= MIRZ HOUBET LAC.
02024010*DAZ ER BI= MIR LA+EGE,
02024011WESSEZ IEMEN
02024012(NU ENWELLE GOT'+.), SO= SCHAMT ICH MICH
02024013WES ER MIT MIR PFLA+EGE,
02024014NIEMER NIEMEN
02024015BEVINDE DAZ, WAN ER UNT ICH,
02024016UND EIN KLEINEZ VOGELLI=N$..
02024017TANDARADEI,
02024018DAZ MAC WOL GETRIUWE SI=N.'
</eg></p>
</div>

<div>
<head>Bereicherung des Zeichensatzes</head>
<p>Noch später (Modell 029 statt 026):
<eg>02023911'*UNDER DER LINDEN
02023912AN DER HEIDE,
02023913DA¬ UNSER ZWEIER BETTE WAS,
02023914DA¬ MUGENT IR VINDEN
02023915SCHO¬NE BEIDE
02023916GEBROCHEN BLUOMEN UNDE GRAS.
02023917VOR DEM WALDE IN EINEM TAL,
02023918TANDARADEI,
02023919SCHO¬NE SANC DIU NAHTEGAL.
02023920*ICH KAM GEGANGEN
02023921ZUO DER OUWE:
02023922DO¬ WAS MI¬N FRIEDEL KOMEN E¬.
02023923DA¬ WART ICH EMPFANGEN
02023924HE¬RE FROUWE,
02023925DAZ ICH BIN S@LIC IEMER ME¬.
02023926KUSTER MICH? WOL TU¬SENTSTUNT:
02023927TANDARADEI,
02023928SEHT WIE RO¬T MIR IST DER MUNT.
02024001*DO¬ HET ER GEMACHET
02024002ALSO¬ RI¬CHE
02024003VON BLUOMEN EINE BETTESTAT.
02024004DES WIRT NOCH GELACHET
02024005INNECLI¬CHE,
02024006KUMT IEMEN AN DAZ SELBE PFAT.
02024007BI¬ DEN RO¬SEN ER WOL MAC,
02024008TANDARADEI,
02024009MERKEN WA¬ MIRZ HOUBET LAC.
02024010*DAZ ER BI¬ MIR L@GE,
02024011WESSEZ IEMEN
02024012(NU ENWELLE GOT!), SO¬ SCHAMT ICH MICH
02024013WES ER MIT MIR PFL@GE,
02024014NIEMER NIEMEN
02024015BEVINDE DAZ, WAN ER UNT ICH,
02024016UND EIN KLEINEZ VOGELLI¬N:
02024017TANDARADEI,
02024018DAZ MAC WOL GETRIUWE SI¬N.'
</eg></p>
</div>

<div>
<head>Text als Zeichenfolge</head>
<p>Was kann man mit solchen Texten unternehmen?
<list>
<item>lesen</item>
<item>drucken*</item>
<item>speichern, verteilen</item>
<item>suchen*, verarbeiten</item>
</list>
</p>
<p>Grundbestandteile: 
Zeichen, Karten / Zeilen.</p>
</div>

<div>
<head>Senkrechte (2-dimensionale) Texte</head>
<p><eg>020239110 '         INPNK
020239111 *UNDER    PRAEP
020239112 DER       BESTA
020239113 LINDEN    SUBST
020239121 AN        PRAEP
020239122 DER       BESTA
020239123 HEIDE     SUBST 
020239124 ,         INPNK
020239131 DA¬       ADVLO
020239132 UNSER     POSPN
020239133 ZWEIER    NUMGN
020239134 BETTE     SUBST
020239135 WAS       VIPRT
020239135 ,         INPNK
020239141 DA¬       ADVLO
020239142 MUGENT    VX2PL
020239143 IR        PN2PL
020239144 VINDEN    VTINF
020239151 SCHO¬NE   ADVTM
020239152 BEIDE     ADVXX
020239161 GEBROCHEN PRTPR
020239162 BLUOMEN   SUBST
020239163 UNDE      KONJK
020239164 GRAS      SUBST
020239164 .         INPNK
...
</eg></p>
</div>

<div>
<head>Text als Wortfolge</head>
<p>Die Zusatzinformationen erlauben uns,
besser zu suchen und raffinierter mit dem Text
zu arbeiten.</p>
<p>Daf&uuml;r ist der Text etwas schwieriger
zu lesen.</p>

<p>Grundbestandteile: 
Karten / Zeilen = Rekord</p>
<p>Zeichenfolge = Feld, Angabe.</p>
</div>

<div>
<head>Formatierprogramme</head>
<p>Um den Text in gewohnter Weise
drucken zu k&ouml;nnen, bedarf es
der Formatierungsanweisungen.  Z.B.
<eg>.ce .bd 
14
.la .ro
.fo no
'Under der linden
an der heide,
d&amp;acirc unser zweier bette was,
d&amp;acirc mugent ir vinden
sch&amp;ocirc.ne beide
gebrochen bluomen unde gras.
vor dem walde in einem tal,
tandaradei,
.in 10;sch&amp;ocirc.ne sanc diu nahtegal.

.in 5;Ich kam gegangen
zuo der ouwe:
d&amp;ocirc was m&amp;icirc.n friedel komen &amp;ecirc..
d&amp;acirc wart ich empfangen
h&amp;ecirc.re frouwe,
daz ich bin s&amp;aelig.lic iemer m&amp;ecirc..
kuster mich? wol t&amp;ucirc.sentstunt:
tandaradei,
.in 10;seht wie r&amp;ocirc.t mir ist der munt.

.in 5;D&amp;ocirc het er gemachet
als&amp;ocirc. r&amp;icirc.che
von bluomen eine bettestat.
des wirt noch gelachet
innecl&amp;icirc.che,
kumt iemen an daz selbe pfat.
b&amp;icirc den r&amp;ocirc.sen er wol mac,
tandaradei,
.in 10;merken w&amp;acirc mirz houbet lac.

.in 5;Daz er b&amp;icirc. mir l&amp;aelig.ge,
wessez iemen
(nu enwelle got!), s&amp;ocirc schamt ich mich
wes er mit mir pfl&amp;aelig.ge,
niemer niemen
bevinde daz, wan er unt ich,
und ein kleinez vogell&amp;icirc.n:
tandaradei,
.in 10;daz mac wol getriuwe s&amp;icirc.n.'
</eg>
</p>
</div>

<div>
<head>Texte als typographisches Objekt</head>
<p>Hier sind die wesentlichen Eigenschaften
des Textes haupts&auml;chlich (bzw. rein)
typographische:
<list>
<item>Schriftfamilie</item>
<item>Schriftgr&ouml;&szlig;e</item>
<item>Seitenbild</item>
</list>
(Oder:  Text und Formatierungskommando ...)
</p>
<p>Das kann den Text (auch f&uuml;r Verlage!)
weniger brauchbar machen.</p>


</div>

<div>
<head>Trennung von Inhalt und Typographie</head>
<p>V.a. bei der Herstellung von technischen
Dokumenten will man die Typographie
systematisch &auml;ndern / revidieren 
k&ouml;nnen.<list>
<item>Konsistenz</item>
<item>bequeme Verwaltung des typographischen Stils</item>
</list>
</p>
<p>
Alles, was <emph>immer</emph> gleich aussehen soll,
soll <emph>gleich</emph> ausgezeichnet / markiert
sein.</p>
<p>
Alles, was <emph>gelegentich</emph> (je nach 
Buchentwurf / Design) verschieden aussehen <emph>kann</emph>,
soll <emph>verschieden</emph> ausgezeichnet / markiert
sein.</p>

</div>

<div>
<head>Sachliche Auszeichnung</head>
<p>
Wie kann man wissen, was immer gleich aussehen soll,
und was verschieden gestaltet werden darf?</p>
<p rend="incremental">Zwei Stellen sollen (bei einer konsequenten,
konsistenten) Gestaltung immer gleich aussehen,
wenn sie sich gleichen, wenn es sich um zwei 
Erscheinungen desselben Sachverhalts handelt.</p>
<p rend="incremental">Zwei Stellen dürfen (bei derselben Voraussetzung
einer konsequenten,
konsistenten Gestaltung) verschieden gestaltet werden, wenn 
sie sich voneinander unterscheiden lassen.</p>
<p rend="incremental">D.h. man wird zwangsläufig zur
Ontologie hingeführt.</p>

</div>

<div>
<head>Mischsprachen</head>
<p>Die sachliche Textauszeichnung f&uuml;hrt man mehrfach ein:</p>
<list rend="incremental">
<item>troff : troff -ms</item>
<item>Script : GML</item>
<item>Tex : LaTeX</item>
<item>Scribe</item>
<item>Textverarbeitungsprogramme (WordPerfect, Word, u.d.gl.m.) :
Stilvorlagen / Musterbl&auml;tter</item>
</list>
<p rend="incremental">Doch die Dokumente bieten meist nur 
<soCalled>makaronische</soCalled>
Texte an, ohne Anwendungsunabh&auml;ngigkeit.</p>
</div>
<div>
<head>Ein Mangel</head>
<p>Keine dieser Methoden vermittelt den ganzen
Eindruck der Handschriften:
<figure entity="Codex_Manesse_Walther_von_der_Vogelweide-394x599"
rend="30%">
</figure>
</p>
</div>
<div>
<head>Seitenbilder</head>
<p>Man kann aber die Hss einfach abbilden:
<figure entity="Codex_Manesse_130v"
rend="30%">
</figure>
</p>
</div>
<div>
<head>Seitenbilder</head>
<p>Oder die Ausgaben:
<figure entity="Walther-ed-Lachmann-p39"
rend="30%">
</figure>
</p>
</div>

<div>
<head>Text als Zeichenfolge</head>
<p>Was kann man mit solchen Texten unternehmen?
<list>
<item>lesen</item>
<item>drucken*</item>
<item>speichern, verteilen</item>
<item><del>suchen*, textuell verarbeiten</del></item>
<item>mit Bildverbesserungssoftware verarbeiten</item>
</list>
</p>
<p>Grundbestandteile: 
Pixel, Farbe.</p>
</div>

<div>
<head>GenCode</head>
<p>In den 60er u. 70er Jahren, arbeitet man
dem <term>generic coding</term> (GenCode) zu.
Ziele:</p>
<list>
<item>sachliche Textauszeichnung</item>
<item>Ger&auml;teunabh&auml;ngigkeit</item>
<item>Anwendungsunabh&auml;ngigkeit</item>
<item>G&uuml;ltigkeitskriterien</item>
</list>
</div>

<div>
<head>SGML</head>
<p>1986 wird die <term>Standard Generalized
Markup Language</term> (SGML) zu ISO-Norm ISO 8879.
Ziele*:</p>
<list>
<item>die sachliche Textauszeichnung
(inkl. Ger&auml;teunabh&auml;ngigkeit
u. Anwendungsunabh&auml;ngigkeit)
<emph>ermöglichen</emph></item>
<item>Vokabular / Tagmenge <emph>nicht</emph> vorschreiben /
festnageln,
sondern offen lassen</item>
<item>Selbstdefinition des Vokabulars</item>
</list>
<p rend="incremental">Also:  keine Textauszeichnungssprache,
sondern eine <term>Metasprache</term>
(<soCalled>Flucht</soCalled> auf die Meta-Ebene).</p>
</div>
<div>
<head>Die Revolution</head>
<p>Eine Revolution:  <emph>ein</emph>
Dokument mit <emph>mehreren</emph> Softwares verarbeiten.</p>
<p rend="incremental">Alle Macht den Informationsherstellern!
<seg><hi>bzw. Informationseigentümern</hi></seg></p>
</div>

<div>
<head>SGML (2)</head>
<p>Technisch gesehen:</p>
<list>
<item>sachliche Textauszeichnung</item>
<item>hierarchische Organisation (Baumstruktur)</item>
<item>Dokumentgrammatik (Dokumenttypvereinbarung)</item>
<item>Minimierungstechniken (<kw>OMITTAG</kw>,
<kw>SHORTTAG</kw>, 
<kw>DATATAG</kw>, 
<kw>SHORTREF</kw>, 
<kw>RANK</kw>, und dgl. mehr)
</item>
<item>Parallelhierarchien (<kw>CONCUR</kw>)</item>
<item>Zeichensatzvereinbarung</item>
<item>abstrakte Syntax (mit konkreter Bezugssyntax)</item>
</list>
</div>

<div>
<head>SGML (3)</head>
<p>Praktisch gesehen:</p>
<list>
<item>sehr schwer, konforme Prozessoren zu erstellen</item>
<item>kleine, zähe Benutzergemeinde</item>
</list>
<p>Wer einmal SGML im Ernst angewendet hat, ...
<!--* liess praktisch nie wieder los. *--></p>
</div>

<div>
<head>Das Ziel der XML-AG</head>
<p>Ziel der <term>SGML on the Web Working Group</term> war:</p>
<list rend="incremental">
<item>SGML* webfähig zu machen</item>
<item>= SGML* browserfähig zu machen</item>
<item>= SGML so einfach zu machen, dass sie auch in dem Browser
verarbeitet werden konnte<list>
<item>das Wesentliche bewahren</item>
<item>auf das Verzichtbare verzichten</item>
</list>
</item>
<item>SGML neu zu vermarkten (daher die Umbenennung)</item>
</list>
</div>

<div>
<head>XML</head>
<p>Technisch gesehen:</p>
<list rend="incremental">
<item>sachliche Textauszeichnung <seg>(&rarr; Teilmenge von SGML)</seg></item>
<item>möglichst einfach <seg>(&rarr; 20 S.)</seg></item>
<item>Anwendungs- und Geräteunabhängigkeit</item>
<item>Sprachunabhängigkeit <seg>(&rarr; Unicode, ISO/IEC 10646)</seg></item>
</list>
</div>


</div><div>
<head>Wo?</head>
<list>
<item>der Dreifu&szlig;<list>
<item>Syntax (Austausch)</item>
<item>Dokumentstruktur (Verarbeitung)</item>
<item>Dokumentgrammatik (G&uuml;ltigkeits&uuml;berpr&uuml;fung)</item>
</list></item>
<item>Semantik</item>
</list>

<div>
<head>XML: Syntax</head>
<p>Alles wird abgegrenzt:</p>
<list>
<item><term>Elemente</term> durch <term>Etiketten</term> (<term>Tags</term>)</item>
<item><term>Etiketten</term> durch spitze Klammern (&lt;, &gt;)</item>
<item><term>Entityreferenzen</term> durch Sonderzeichen (&amp;, ;)</item>
<item><term>Attributwerte</term> durch Anführungszeichen</item>
</list>
</div>

<div>
<head>XML: Syntax (Beispiel)</head>
<p><eg>&lt;Kanzone>
  &lt;Strophe>
    &lt;Aufgesang>
      &lt;Stollen>
	&lt;Z>&ldquo;Unter den linden&lt;/Z>
	&lt;Z>an der heide,&lt;/Z>
	&lt;Z>d&acirc; unser zweier bette was,&lt;/Z>
      &lt;/Stollen>
      &lt;Stollen>
	&lt;Z>d&acirc; mugt ir vinden&lt;/Z>
	&lt;Z>schone beide&lt;/Z>
	&lt;Z>gebrochen bluomen unde gras.&lt;/Z>
      &lt;/Stollen>
    &lt;/Aufgesang>
    &lt;Abgesang>
      &lt;Z>vor dem walde in einem tal,&lt;/Z>
      &lt;Z>tandaradei&lt;/Z>
      &lt;Z>sch&ocirc;ne sanc diu nahtegal.&lt;/Z>
    &lt;/Abgesang>
  &lt;/Strophe>
  &lt;Strophe>
    &lt;Aufgesang>
      &lt;Stollen>
	&lt;Z>Ich kam gegangen&lt;/Z>
	&lt;Z>zuo der ouwe:&lt;/Z>
	&lt;Z>d&ocirc; was m&icirc;n friedel komen &ecirc;.&lt;/Z>
      &lt;/Stollen>
      &lt;Stollen>
	&lt;Z>d&acirc; wart ich empfangen&lt;/Z>
	&lt;Z>h&ecirc;re frouwe,&lt;/Z>
	&lt;Z>daz ich bin s&aelig;lic iemer m&ecirc;.&lt;/Z>
      &lt;/Stollen>
    &lt;/Aufgesang>
    &lt;Abgesang>
      &lt;Z>kuster mich? wol t&ucirc;sentstunt:&lt;/Z>
      &lt;Z>tandaradei,&lt;/Z>
      &lt;Z>seht wie r&ocirc;t mir ist der munt.&lt;/Z>
    &lt;/Abgesang>
  &lt;/Strophe>
&lt;/Kanzone></eg>
</p></div>

<div>
<head>Die Datenmodelle von XML</head>
<p>XML hat mehrere Datenmodelle:</p>
<list>
<item>Zeichenfolge <seg>(vgl. SQL)</seg></item>
<item>Entitystruktur / Folge von Zeichen bzw. Entityreferenzen</item>
<item>Folge von Zeichendaten und Tags</item>
<item>Baumstruktur</item>
</list>
</div>

<div>
<head>Die Baumstruktur</head>
<p>Elemente <term>nisten</term> ineinander
und ergeben eine Baumstruktur:
<figure entity="Walther-abbrev-nows-gi-text" rend="svg">
</figure>
</p>
</div>

<div>
<head>Die Dokumentgrammatik</head>
<p>Für ein Vokabular kann man eine <term>Grammatik</term>
bereitstellen, in der man die vorgesehenen Strukturen / Vernistung
der Elemente und Attribute festlegt.  Z.B.
<eg><![CDATA[<!ELEMENT Kanzone (Strophe+)>
<!ELEMENT Strophe (Aufgesang, Abgesang)>
<!ELEMENT Aufgesang (Stollen, Stollen)>
<!ELEMENT Stollen (Z+)>
<!ELEMENT Abgesang (Z+)>
<!ELEMENT Z (#PCDATA)>
]]></eg>
</p>
<p>N.B. unvollständige Wiedergabe der Kanzonenform!</p>

</div>

<div>
<head>Die Dokumentgrammatik (2)</head>
<p>D.h.
<eg><![CDATA[
Kanzone ::= "<Kanzone>" Strophenfolge "</Kanzone>"
Strophenfolge ::= "Strophe Strophenfolge
Strophe ::= "<Strophe>" Aufgesang Abgesang "</Strophe>"
Aufgesang ::= "<Aufgesang>" Stollen Stollen "</Aufgesang>"
Stollen ::= "<Stollen>" Zeilenfolge "</Stollen>" 
Abgesang ::= "<Abgesang>" Zeilenfolge "</Abesang>" 
Zeilenfolge ::= Z Zeilenfolge 
Z ::= ::= "<Z>" Zeichenfolge "</Z>"
Zeichenfolge ::= /* nichts */ | Zeichen Zeichenfolge
Zeichen ::= "A" | "a" | "B" | ... 
]]></eg>
</p>

</div>

<div>
<head>Stilmöglichkeiten d. Dokumentgrammatik</head>
<list>
<item>eng oder breit</item>
<item>beschreibend oder vorschreibend</item>
</list>
<p>Vgl. Chomsky, BNF, EBNF, ...</p>
</div>

<div>
<head>Der Dreifuß</head>
<list>
<item>Syntax (Zeichenfolge)</item>
<item>Grammatik (Gültigkeit)</item>
<item>Datenstruktur (Baum)</item>
</list>
<p></p>
</div>

<div>
<head>Die Semantik</head>
<p>Was bedeutet ein XML-Dokument?</p>
</div>

<div>
<head>Die Semantik (2)</head>
<p>Wie definiert man die Bedeutung (der Sätze) einer Sprache?</p>
<list>
<item>Metasprache</item>
<item>Grundbegriffe, Zusammensetzung</item>
</list>
<p rend="incremental">Aber XML schreibt keine semantische Metasprache,
keine Grundbegriffe vor.  <seg>(Wieder die Flucht auf die
Meta-Ebene.)</seg></p>
</div>


</div>

<div>
<head>Wohin?</head>
<list>
<item>die technische Umwelt</item>
<item>die Marktwirtschaft</item>
<item>die Wissenschaft</item>
</list>

<div>
<head>Technische Umwelt</head>
<p>Jedes Datenformat verlangt nach:<list>
<item>Aufbereitung / Editieren <seg>(Editoren)</seg></item>
<item>Ausgabe / Ausdruck <seg>(XSL-FO, CSS, XSLT, ...)</seg></item>
<item>Verlinkung <seg>(XLink, XPointer)</seg></item>
<item>Verarbeitung <seg>(XSLT, XQuery, DOM, SAX, ...)</seg></item>
<item>Abfragen / Indizierung <seg>(XQuery)</seg></item>
</list></p>
<p><seg>Die Zukunft scheint bereits da zu sein.</seg></p>
</div>

<div>
<head>Die Marktwirtschaft</head>
<p>Ist XML inzwischen überholt?
veraltet?
aus der Mode gekommen?</p>
<p><seg>Nein.</seg></p>
<p><seg>Nicht besonders.</seg></p>
<p><seg>Durchaus*.  Jetzt sind JSON und HTML5 &ldquo;in&rdquo;, 
XML ist &ldquo;out&rdquo;.</seg></p>
<p><seg>Ob das wichtig ist?</seg></p>
</div>

<div>
<head>Technologischer Wert</head>
<p>Viele Technologien bringen desto mehr Vorteile,
je breiter sie aufgegriffen werden.</p>
<p>Manche Technologien bringen <emph>nur dann</emph> Vorteile,
wenn sie allgegenw&auml;rtig sind.</p>
<p rend="incremental">Die einheitliche Syntax von XML ...</p>
<p rend="incremental">Die Grundbegriffe der sachlichen
Textauszeichnung,
der Gültigkeit,
der Informationsstruktur ...</p>
</div>

<div>
<head>Die Wissenschaft und die Infrastruktur</head>
<p>These: XML ist für die Wissenschaft nicht von Interesse.</p>
<p rend="incremental">Sie soll interessante Arbeit erst
ermöglichen / erleichtern, ist aber kein Selbstzweck.</p>
<p rend="incremental">Denkwerkzeuge sollen uns erlauben,
gezielt zu denken.</p>
<p>
<seg>D.h. Ihr Zweck ist nur dann erfüllt, wenn wir nicht
mehr an sie denken.</seg></p>
</div>

<div>
<head>Die Wissenschaft und die Infrastruktur (2)</head>
<p>Gegenthese: XML ist für die Wissenschaft von h&ouml;chstem Interesse.</p>
<p rend="incremental">Schreibweise ist Werkzeug.</p>
<p rend="incremental">Das Werkzeug formt den Benutzer.</p>
<p rend="incremental">Das Denkwerkzeug formt unsere Denkweise.
Verdinglichung schließt Kritik aus.</p>
</div>

<div>
<head>Die Wissenschaft der Textauszeichnung</head>
<p>Offene Probleme:</p>
<list rend="incremental">
<item>Datenstruktur? Baum, Wald, oder Netz? Graph oder Zeichenfolge?</item>
<item>boolesche / aristotelische Gültigkeit oder qualitative / unscharfe
(Fuzzy-) Logik?</item>
<item>Semantik / Modellieren</item>
</list>
</div>

<div>
<head>Die Textauszeichnung als Infrastruktur</head>
<p>Die Infrastruktur rechtfertigt sich durch 
den &Uuml;berbau, den sie erm&ouml;glicht.</p>
<p rend="incremental">Die Zukunft bestimmen nicht die, die vor 25 und
15 Jahre SGML und XML gemacht haben<seg>, <lb/>sondern Sie.</seg></p>
<p rend="incremental">Bauen Sie weiter!</p>
</div>


</div>

<div>
<head>Dank</head>
<list>
  <!--*
  <item>Foto: <xref
	      href="http://www.flickr.com/photos/larry1732/5499394899/">Black
	      Mesa: San Ildefonso Pueblo</xref>, von Larry Lamsa
	    (<xref
	      href="http://creativecommons.org/licenses/by/2.0/deed.en">CC
	      BY 2.0</xref>)</item>
  *-->
  <item>Foto: Detail aus <xref
	      href="http://www.flickr.com/photos/wmichary/2843673873/">Black
	      Mesa</xref>, von Marcin Wichary, 9.9.2008
	    (<xref
	      href="http://creativecommons.org/licenses/by/2.0/deed.en">CC
	      BY 2.0</xref>)</item>

</list>
</div>


</body>
</text>
</TEI.2>
<!-- Keep this comment at the end of the file
Local variables:
mode: xml
sgml-default-dtd-file:"/Library/SGML/Public/Emacs/sweb.ced"
sgml-omittag:t
sgml-shorttag:t
End:
-->
