in der U-Bahn
Ein interessanter Bug neulich in der U-Bahn: ein
auf einem Info-Display.
Kurze Erklärung: Was ist
?
Um diese Frage zu klären, machen wir erstmal einen Ausflug in die Typografik. Jeder kennt ein Leerzeichen. So nennen wir den Abstand zwischen zwei Wörtern. Für Computer-Texte genügt uns das normale Leerzeichen aber manchmal nicht. Wir müssen manchmal sicherstellen, dass zwei Wörter nicht durch einen Zeilenumbruch getrennt werden. Ein Beispiel ist die Abkürzung "z. B.". Wir wollen nicht, dass das "z." am Ende einer Zeile und das "B." am Beginn der nächsten Zeile steht.
Während handschriftlich dies einfach zu bewerkstelligen ist, macht uns das am Computer schon mehr Ärger. Typische Programme brechen den Text automatisch an einem Leerzeichen in die nächste Zeile um, wenn kein Platz mehr ist. Mit dem geschützten Leerzeichen können wir uns vor so einem automatischen Umbruch schützen. Das geschützte Leerzeichen garantiert, dass die damit verbundenen Wörter nicht getrennt werden. Je nach Programm und Betriebssystem wird das geschützte Leerzeichen anders eingegeben.
Nun kommen wir langsam zum
. In den Anfängen des Internets (als es noch keine
UTF-8-Kodierung gab) waren viele verschiedene Kodierungen üblich. Sonderzeichen – wie z. B.
deutsche Umlaute – wurden mittels sog. HTML-Entities in den Code geschrieben. Hierzu wird das
Und-Zeichen (&), ein Kürzel (wie z. B. "uuml" für das "ü") und ein abschließendes
Semikolon (;) geschrieben. Mit dieser Methode können Sonderzeichen mit reinen ASCII-Zeichen
dargestellt werden und sind somit unabhängig von der Kodierung. Das Kürzel für das geschützte
Leerzeichen ist nbsp
(englisch: non-break space).
Zurück zum Bug und von dort zum Quelle
Wie kommt es nun zum Bug in der U-Bahn? Denken wir kurz nach. Eigentlich sind es sogar zwei Bugs!
- Der Entwickler hat einmal zuviel escapt. Aus einem
wurde 
. Der Nutzer sieht die Kodierung des geschützten Leerzeichens und nicht das geschützte Leerzeichen selber. - Der Autor des Texts hat an einer Stelle ein geschütztes Leerzeichen eingesetzt, wo es allein von der Rechtschreibung schon falsch ist.
Punkt 1 ist den Entwicklern der VAG anzukreiden oder wer auch immer für diese die Info-Displays in der U-Bahn baut.
Für Punkt 2 hilft uns Google und die Quellenangabe auf dem Info-Display, dass der Text von nordbayern.de zur Verfügung gestellt wird. Der Artikel ist hier zu finden. Sieht man sich den Quellcode an, erkennt man, dass auch dort das falsche geschützte Leerzeichen zu sehen ist. Die VAG scheint diese News wohl über eine Schnittstelle zu importieren und stellt sich dabei zu dumm, mit den HTML-Entities ordentlich umzugehen.
Kommentare zu diesem Artikel
Schreib einen Kommentar zum Artikel
Vielen Dank für deinen Kommentar! :-)
Da alle Kommentare von Hand bearbeitet werden,
gedulde dich bitte, bis der Kommentar freigeschaltet wird.
Formular nicht richtig ausgefüllt.
Oops... da ist was schiefgelaufen :-(
Dein Kommentar konnte nicht gespeichert werden.
Bitte probier es später nochmal.