lernscouts.de
Home Datenschutz Nutzungsbedingungen Impressum Kontakt
Microsoft - Ihr Potenzial. Unser Antrieb.
Strategische Partner
Bundesinitiative Jugend ans Netz Initiative D21


 
Textcodierung
Textcodierung und Textbeschreibung
Jill möchte sich eine Webseite basteln und quält sich durch einen Dschungel von Kürzeln und Anweisungen. „Ich komme mir vor wie die Menschen beim Turmbau zu Babel!“ stöhnt sie. „Die wollten nur EINEN Turm und ich will nur EINE Webseite. Aber es gibt so viele Sprachen und Versionen, dass ich schon ganz durcheinander bin. Das ist wirklich eine Strafe.“ Jim schüttelt den Kopf: „Das musst du mal anders sehen“, meint er. „Jede Sprache ist eine Welt für sich. Mit jeder Sprache kann man andere Dinge ausdrücken. Bei vielen Sprachen hast du einfach nur die Wahl!“

In dieser Lerneinheit erfährst du:

Hoch Runter

Vielleicht kennen einige die Geschichte des Alten Testaments vom Turmbau zu Babel: als die Menschen noch alle eine gemeinsame Sprache hatten, wollten sie einen Turm bauen, der von der Erde bis zum Himmel reichen sollte. Das Vorhaben endete mit der „Sprachverwirrung“ und der Turm konnte nicht gebaut werden. Meistens wird diese Geschichte so gedeutet, dass die Menschen bestraft werden sollten: durch die große Anzahl von Sprachen können sie sich nicht mehr verständigen. Daher war es auch nicht mehr möglich, ein gemeinsames Bauwerk zu errichten.

Man kann die Geschichte jedoch auch ganz anders deuten: Eine Sprache – ein Weltbild - ein Turm. Jede Sprache ist eine Welt für sich. Die „Sprachverwirrung“ ist keine Strafe, sondern eine Befreiung. Jetzt kann jeder sein Türmchen bauen.

Sprache und Text
Hoch Runter

Sprachwelten
Durch Sprachen können wir uns verständigen und ausdrücken. Man kann befehlen, dass jemand etwas macht, man kann jemanden erklären, wie er etwas tun soll, man kann jemanden vor etwas warnen, man kann Neuigkeiten oder Klatsch austauschen. Vorausgesetzt, man spricht die gleiche Sprache.

Wenn man eine fremde Sprache hört, versteht man erst einmal nur Bahnhof. Im Ausland wird es mühsam einzukaufen und die einfachsten Dinge zu organisieren, wenn man die Landessprache nicht spricht. Beginnt man jedoch eine Sprache zu erlernen, eröffnet sich eine neue Welt.

Übrigens
Für einige deutsche Worte gibt es in anderen Sprache gar keine Übersetzung – das Wort „Gemütlichkeit“ ist so z.B. in die englische und amerikanische Sprache aufgenommen worden. In Inuit, der Sprache der Eskimos gibt es mindestens sechs verschiedene Ausdrücke für Schnee.

Alle Sprachen bestehen aus verschiedenen Wortarten und Lauten, aus denen sich die Worte zusammensetzen. Es gibt z.B. Worte für Dinge und Worte für Tätigkeiten. Außerdem gibt es Regeln, wie man Laute zu Worten formt, wie man die Wortarten einsetzt und verbindet usw. Auch in der gibt es Wortarten und Regeln.

Innerhalb einer Sprache kann es Unterschiede geben, je nach dem mit wem man spricht: es gibt Baby- oder Kindersprachen, Gebetssprachen, Slang, Jugendsprachen, Gelehrtensprachen oder Amtssprachen. Aber alle halten bestimmte Regeln ein. Deshalb kann man Sprachen lernen.

Gebärdensprache
Gebärdensprache

Aufsagen und Aufschreiben
Mit Sprache kann man auch Geschichten oder wichtige Ereignisse bewahren. Allerdings muss man die Geschichten oder Ereignisse zum Aufbewahren über Generationen hinweg immer weiter erzählen oder sich berichten lassen. Viele alte Märchen und Sagen haben sich so erhalten. Aber viele sind auch verloren gegangen, wenn die Letzten, die sie kannten verstorben sind. Die Gebrüder Grimm wollten das z.B. verhindern und sind durch das Land gefahren, um Geschichten zu sammeln und sie aufzuschreiben.

Dazu braucht man eine Schrift, etwas womit und etwas worauf man schreiben kann. Die Schrift besteht aus Zeichen, mit denen man Gesprochenes festhalten kann. Die hörbaren Lautzeichen des Gesprochenen werden in sichtbare Zeichen, in Text umgewandelt.

Historische Schriften
Historische Schriften

Durch die Entwicklung von Schrift, Schreibmaterialien und Schreibwerkzeugen ist das Aufbewahren von Informationen unabhängig vom Berichterstatter oder Erzähler geworden. Einmal schriftlich festgehalten, können sich Informationen nicht mehr so leicht verändern. Außerdem können sie länger aufbewahrt werden und man kann Informationen weit weg von ihrem Entstehungsort verbreiten.

Lesen kann sie jedoch nur, wer die Schriftzeichen versteht. Lesen heißt, die Schriftzeichen im Kopf in die richtigen Lautzeichen umzuwandeln, dann die Worte zu erkennen und schließlich Sätze und Abschnitte zu verstehen.

Was man sagt und was man meint
Je nachdem wie etwas gesagt wird, kann es ganz unterschiedlich gemeint sein, auch wenn dieselben Worte gebraucht werden. Die Betonung von Worten, die Satzmelodie, Pausieren zwischen Worten oder Pausieren nach einem Satz, gliedern den Inhalt und helfen uns beim Verstehen des Gesprochenen.

Du hast einen schönen Pulli! = ein Kompliment
Du hast einen schönen Pulli... = Ironie
Du hast einen schönen Pulli? = Frage nach dem Gegenstand
Du hast einen schönen Pulli? = Frage nach der Anzahl

Obwohl die Beispiele nur als Text vorhanden sind, kann sich jeder vorstellen, wie sie gemeint sind, auch wenn er den Text sieht und nicht hört.
Durch Satzzeichen und Gestaltung kann ein Text ebenso vielschichtig wie Sprache sein.

Textstruktur
Mit der Entwicklung von immer schnelleren Schreibverfahren und immer handlicheren Schreibmaterialien, kam es auch zu immer mehr Information. Wenn ein Text aus vielen Seiten Papier besteht, macht es Sinn diese Blätter zu nummerieren, damit die Reihenfolge deutlich wird. Auch innerhalb von Textseiten werden hilfreiche Strukturen wie Überschriften, Zwischentitel, Absätze, Kapitel, Verweise aufgebaut. So wird Information leichter zugänglich.
Es gibt verschiedene Textsorten, die man schon durch ihre Struktur unterscheiden kann, ohne ihren Inhalt zu kennen: Ein Brief sieht anders aus als ein Buch, ein Roman anders als ein Schulbuch.

Besonderheiten elektronischer Texte
Hoch Runter

Text codieren
Computer verstehen nur zwei Zustände – „Strom an“ und „Strom aus“. Die beiden Möglichkeiten werden durch zwei Zahlen dargestellt – „1“ und „0“. Das ist die kleinste Informationseinheit, 1
Bit. Trotzdem kann man nur mit diesen zwei Ziffern alle 10 Ziffern des Dezimalsystems darstellen.

Binär- und Dezimalsystem
Binär- und Dezimalsystem

Aber wie kann man mit Zahlen Buchstaben darstellen? Bob Bemer, ein amerikanischer Computerpionier hatte eine Idee: Er kodierte das lateinische Alphabet. Er erfand sozusagen eine Geheimschrift für den Computer. Die 26 Zeichen, aus denen das Alphabet besteht, übersetzte er jeweils in Zeichen, die im Binärsystem geschrieben werden können.

Schrift- und Binärzeichen
Schrift- und Binärzeichen

Dazu brauchte er pro Zeichen 8 . Jeder Buchstabe wird mit nur 2 Ziffern ausgedrückt in einer achtstelligen Zahlenkette. Damit erhält man 128 verschiedene, binäre Zahlenketten und kann 128 Zeichen kodieren.

1968 wurde diese Textcodierung mit dem Namen ASCII, American Standard Code for Information Interchange , eingeführt. Mit Hilfe dieses Codes können Geräte Texte senden, empfangen und verarbeiten.

Übrigens
Andere Schriftsysteme wie das Kyrillische oder Japanische brauchen zu ihrer Darstellung mehr als 265 Zeichen. Der Unicode, der 1991 eingeführt wurde, beruht auf einer Ziffernkette von 16 Bit. Damit kann man 65.536 Zeichen darstellen.
Der Buchstabe A hat hier die Codierung 0000000001000001.

Was macht elektronischer Text?
Wenn ein Text in einem Computer aufgerufen oder empfangen wird, verändert er den Zustand von einem oder mehreren Programmen: Damit der Text in einem Programm erscheint, muss er in den Programmspeicher geladen werden.
Text kann aber auch in dem Programm bestimmte Vorgänge auslösen. Auch ein Programm ist schließlich nichts anderes, als ein Text.

Daher ist es für den Computer wichtig, zu wissen, mit welcher Art Text er es zu tun hat. Einmal angenommen, man würde per Telefon jemanden bitten, einen Brief zu schreiben, dann würde man nicht nur den Inhalt des Briefes diktieren. Man würde auch Anweisungen geben, wann ein Absatz erfolgen, ein Wort fett dargestellt werden soll, oder auf welchen anderen Teil an einer bestimmten Stelle verwiesen werden soll. Das Telefonat würde vielleicht so klingen:

Wenn der Schreiber die Anweisungen richtig verstanden hat, würde der Brief so aussehen:

Man merkt, dass es wichtig ist, den Inhalt von der und der Form deutlich zu trennen. Obwohl alles zusammen dann das gewünschte Ergebnis ergibt.

Schriftliche Anweisungen
Die Anweisungen per Telefon, wie man sie im Beispiel gesehen hat, könnte man einfacher erklären, indem man dem eigentlichen Text ein paar Anmerkungen hinzufügt:

Die andersfarbigen Angaben im Beispiel kommen den Notizen nahe, die Drucker und Setzer in der Druckindustrie benutzten, um Dokumente richtig auszugeben. Das war lange bevor Computer dazu eingesetzt wurden. Schließlich konnte nicht jeder Journalist oder Herausgeber alle Textbeschreibungen durchs Telefon oder persönlich erklären.

Generic Coding
William Tunnicliffe von der Graphic Communications Association kam durch die Notizen für Drucker auf einen Einfall. Er schlug vor, den Inhalt eines Dokumentes von seiner äußeren Form deutlich zu trennen. Damit war schon 1967 die Idee des coding geboren.

Beim coding geht es darum, den Aufbau und die logischen Teile eines Dokumentes zu kennzeichnen. Generic heißt auf Englisch „artgemäß“. Mit den Markierungen sagt man auch etwas über die Art der markierten Stelle aus. Das hat den Vorteil, dass die Stellen, die man z.B. mit der Markierung „Überschrift“ gekennzeichnet hat, überall im gleich aussehen. Diese Idee war die Voraussetzung für die Entwicklung der Auszeichnungssprachen für elektronische Dokumente.

Trennung von Inhalt, Struktur und Aussehen
Trennung von Inhalt, Struktur und Aussehen

Wozu man Markup Languages und HTML braucht
Hoch Runter

Markup Languages oder Auszeichnungssprachen
Eine Auszeichnungsprache wird auf englisch
Markup Language (ML) genannt. Durch sie kann man auch elektronische Dokumente beschreiben: z.B. wie bestimmte Wörter, Sätze oder Abschnitte aufgebaut sind, worauf sie sich beziehen oder zu welcher Art sie gehören. Im Beispiel des Briefes von Jill an Jim finden sich drei Textarten: Überschrift, Normaltext und Auflistung. Durch die kann man diese Textarten benennen. Um die Auszeichnung vom Text deutlich zu trennen, wird sie in spitze Klammern <...> gesetzt. In die Klammer schreibt man dann die Kürzel für die jeweilige Textart. Zusammen wird das dann „tag“ genannt. Mit tags wird auch angegeben, wo die Stelle beginnt und wo sie wieder aufhört.

Für den Brief von Jill an Jim würde die erste Zeile dann folgendermaßen aussehen:

<h1>Lieber Jim!</h1>

h1 steht dabei für das englische Wort „headline“, Überschrift. Falls man verschiedene Arten von Überschriften und Untertiteln hat, sind die Kürzel „h“ nummeriert.

Dort, wo die Überschrift beginnt, taucht das tag <h1> auf. Um zu zeigen, dass die Markierung endet, setzt man das tag </h1>. Nachdem man das ganze so durchgearbeitet und gegliedert hat, würde man nun in einem zweiten Schritt in einem weiteren festlegen, wie z.B. h1 aussehen soll.

In den Überlegungen zu Sprache und Text am Anfang dieses Lernobjekts konnte man feststellen, dass jede Sprache eine kleine Welt für sich ist. Ähnlich verhält es sich auch mit den verschiedenen Auszeichnungssprachen. Sie sind verschieden, weil sie verschiedene Dinge beschreiben.

Innerhalb der Markup Languages gibt es zwei Arten von Sprachen. Die , auf englisch Procedural , beschreibt den Darstellungsablauf. und PostScript gehören z.B. zu dieser Art . Ihre Formate weisen z.B. den Drucker an, wie der Text ausgedruckt werden soll.

Mit der , auf englisch Descriptive , wird das Gefüge des Textes beschrieben. Descriptive Markup Languages sind z.B. SGML, und XML.

Die Beziehungen zwischen SGML, HTML und XML
Die Beziehungen zwischen SGML, HTML und XML

Wie HTML erfunden wurde
Mit der „Hyper Text “ kann man Dokumente für das Internet beschreiben. Sie wurde 1989 von Tim Berners-Lee im Kernforschungszentrum CERN in Bern entwickelt. Er wollte damit eigentlich ein wenig Ordnung in das Dateienchaos bringen und gleichzeitig auch für Nicht-Computerfachleute eine verständliche Lösung anbieten.

Seine Idee bestand darin, Textteile oder Dokumente, die sich aufeinander beziehen, elektronisch zu verknüpfen: die „“ . Ausgegangen war Berners-Lee von der Metasprache SGML. So kam zu seinem Namen.

Inzwischen wurde mehrmals verbessert. Das W3C () ist eine Gruppe von Vertretern aus über 100 Firmen und freien Webentwicklern. Sie bestimmen und entwickeln den Standard. Die letzte Version des - Standards war 4.01. Daraus hat man die Metasprache XML und X 1.0 entwickelt.

Was im Quelltext steht und was dargestelt wird
Was im Quelltext steht und was dargestelt wird

Was kann man mit HTML machen?
ist eine für Dokumente im Internet. Damit man die Dokumente dort sehen kann, braucht man ein Programm: den „“ . Der Internet Explorer ist ein solches Programm. Es liest das gesamte , den “ und stellt dann nur den Inhalt dar, nicht die tags der .

Mit kann man keine Befehle schreiben, sondern nur beschreiben, wie das aussehen soll. Daher ist keine Programmiersprache.

Man kann mit aber Programmiersprachen einbinden, ebenso wie man Bilder, Grafiken oder Musik mit seinem verknüpfen kann. Damit wird nicht das Bild oder die Musikdatei in den selbst aufgenommen, sondern nur der Name der Datei mit einem Verweis. Außerdem gibt es tags, die bestimmen, wie das Bild in den Text eingebaut werden soll.

Das HTML- Grundgerüst
Das HTML- Grundgerüst

Das wird vom Computer über den ASCII-Code gelesen. Mit diesem Code können nur 128 Zeichen dargestellt werden. Die verschiedenen Sonderzeichen, die es in Sprachen gibt wie ä,ö ,ü oder ß müssen daher durch eine Zeichenfolge verschlüsselt werden. „ä“ wird so zu &auml;, „ß“ zu &szlig;. Das Wort Mütze muss man daher M&uuml;tze schreiben.

HTML-Grundgerüst
HTML-Grundgerüst

Zusammenfassung

Jetzt hat Jill verstanden. Sie beginnt, ihren Text in Textarten zu gliedern und in eine sinnvolle Reihenfolge zubringen:

Überschrift erster Ordnung <h1>
Text <p>
Überschrift zweiter Ordnung <h2>
Text <p>
Ein Bild <img>
Eine Liste <ul, ol, dl>
Text <p>
Ein Formular <form>

Dann baut sie ihre in das Seitengerüst ein. Das ist der Rohbau ihrer Webseite.

Teste dein Wissen!

 
 Toolbox


Drucken
Die Druckversion des Lernobjekts
Wissensnetz
Das Wissensnetz mit allen Begriffen.

 Film zum Lernobjekt

 Mehr im Netz
Codieren und Decodieren von Texten
Hinweise und Tipps zum Codieren und Decodieren von Texten in und mit Word, notwendige Schritte und Hinweise zur Erstellung von Codierungsmakros; Download
Strukturorientiert schreiben
Geschichte des generic coding, Entwicklung bis zur Entstehung der Extensible Markup Language; Links zur Geschichte des Hypertextes, Bestandteilen eines Dokumentes u.a.

 Kontakt
 © 2004 helliwood:media. Alle Rechte vorbehalten. Rechtliche Hinweise | Informationen zum Projekt | Autorenverzeichnis