theHacker's Blog
– It's just a glitch in the Matrix –

  in der U-Bahn

Ein interessanter Bug neulich in der U-Bahn: ein   auf einem Info-Display.

Kurze Erklärung: Was ist  ?

Um diese Frage zu klären, machen wir erstmal einen Ausflug in die Typografik. Jeder kennt ein Leerzeichen. So nennen wir den Abstand zwischen zwei Wörtern. Für Computer-Texte genügt uns das normale Leerzeichen aber manchmal nicht. Wir müssen manchmal sicherstellen, dass zwei Wörter nicht durch einen Zeilenumbruch getrennt werden. Ein Beispiel ist die Abkürzung „z. B.“. Wir wollen nicht, dass das „z.“ am Ende einer Zeile und das „B.“ am Beginn der nächsten Zeile steht.

Während handschriftlich dies einfach zu bewerkstelligen ist, macht uns das am Computer schon mehr Ärger. Typische Programme brechen den Text automatisch an einem Leerzeichen in die nächste Zeile um, wenn kein Platz mehr ist. Mit dem geschützten Leerzeichen können wir uns vor so einem automatischen Umbruch schützen. Das geschützte Leerzeichen garantiert, dass die damit verbundenen Wörter nicht getrennt werden. Je nach Programm und Betriebssystem wird das geschützte Leerzeichen anders eingegeben.

Nun kommen wir langsam zum  . In den Anfängen des Internets (als es noch keine UTF-8-Kodierung gab) waren viele verschiedene Kodierungen üblich. Sonderzeichen – wie z. B. deutsche Umlaute – wurden mittels sog. HTML-Entities in den Code geschrieben. Hierzu wird das Und-Zeichen (&), ein Kürzel (wie z. B. „uuml“ für das „ü“) und ein abschließendes Semikolon (;) geschrieben. Mit dieser Methode können Sonderzeichen mit reinen ASCII-Zeichen dargestellt werden und sind somit unabhängig von der Kodierung. Das Kürzel für das geschützte Leerzeichen ist nbsp (englisch: non-break space).

Zurück zum Bug und von dort zum Quelle

Wie kommt es nun zum Bug in der U-Bahn? Denken wir kurz nach. Eigentlich sind es sogar zwei Bugs!

  1. Der Entwickler hat einmal zuviel escapt. Aus einem   wurde  . Der Nutzer sieht die Kodierung des geschützten Leerzeichens und nicht das geschützte Leerzeichen selber.
  2. Der Autor des Texts hat an einer Stelle ein geschütztes Leerzeichen eingesetzt, wo es allein von der Rechtschreibung schon falsch ist.

Punkt 1 ist den Entwicklern der VAG anzukreiden oder wer auch immer für diese die Info-Displays in der U-Bahn baut.

Für Punkt 2 hilft uns Google und die Quellenangabe auf dem Info-Display, dass der Text von nordbayern.de zur Verfügung gestellt wird. Der Artikel ist hier zu finden. Sieht man sich den Quellcode an, erkennt man, dass auch dort das falsche geschützte Leerzeichen zu sehen ist. Die VAG scheint diese News wohl über eine Schnittstelle zu importieren und stellt sich dabei zu dumm, mit den HTML-Entities ordentlich umzugehen.

11. Februar 2019

Schreib einen Kommentar hierzu

Deine eMail-Adresse wird nicht veröffentlicht.