013
28.01.2016, 12:01 Uhr
Micha
|
Keine Ahnung ob ihr mich meint... das Posting in 000 ist zugegebenermaßen ohne Illustration mißverständlich. Ich wollte ganz bestimmt nicht in die Richtung diskutieren, daß eine Microsoft Word Datei ja nicht in meinen simplen Text-Editor lädt. Daß Formate wie MS-Word's .doc alles mögliche verwursten, war mir schon klar.
Meine Perspektive war die des Programmierers: für Quelltexte braucht man bis heute meistens immer noch nur die 7-Bit-Teilmenge des ASCII Zeichensatzes, ohne Codepage, ohne Ove Sprogø, ohne Norton Commander Kanten, ohne 'German Umlauts' ;-)
@Mobby5: tut mir leid, wenn ich immer noch Zeichensatz sage. Begriffe wie Zeichensatz, Kodierung, Schriftart, Schriftschnitt usw. haben im Laufe der Jahre gelegentlich gewechselt. Es braucht nur wenig guten Willen um zu verstehen was jemand meint, der vom ASCII-Zeichensatz spricht, auch wenn es vielleicht nicht ganz korrekt ist.Der Begriff "ASCII Zeichensatz" ist so gebräuchlich - nur ganz hartgesottene Klugscheißer werden sich dem Verständnis bewußt entziehen was gemeint ist. Mir ist schon bewußt: bei 80er Jahre Computern klebte auf dem entsprechenden EPROM öfters ein Zettel: ZS-ROM. Aber meint "Zeichensatz" wirklich den Pixel-Bitmuster-Kram? Meine Ehre würde ich nicht dafür verwetten mögen.
Ich hoffe das angehängte Bild illustriert, was ich wirklich sagen wollte. Wenn man sich mit einem in C geschriebenen Programm, das eine Textdatei char für char einliest darauf verlässt, daß eine reine Textdatei ab dem ersten Byte aus Text besteht, kann man ggf. Schiffbruch erleiden. Ich hab ne Weile dran gerätselt, warum meine (wie in Fortran) positionsfixierte Datei immer die erste Zeile vermurkst hat - bis ich mir die 'reine' Textdatei dann mal in HxD angeschaut hab.
Gibt übrigens Editoren, die auch beim Speichern in UTF-8 intelligent genug sind den UTF-8 Vorspann wegzulassen, wenn im Text nur die ASCII Teilmenge an Zeichen verwendet wird. Nur verlassen sollte man sich da nicht drauf...
Dieser Beitrag wurde am 28.01.2016 um 13:05 Uhr von Micha editiert. |