Gutes HTML, schlechtes HTML
Habe eben einen “Flyer” zum Einpflegen auf einer Homepage eines Square-Dance-Vereins bekommen.
Und in welchem Format bekommt man sowas zugeschickt ?
Richtig, als Word-Datei…
Die HTML-Ausgabe von MS Word wird ihrem Namen nicht gerecht, aber alles neu machen bin ich auch zu faul.
Auf der Seite http://www.codinghorror.com/blog/archives/000485.html ist den Sourcecode für ein kleines C#-Programm (alternativ auch das kompilierte Programm), welches den gröbsten “Dreck” aus dem Word-HTML entfernt.
Zwar sind nach der Ausführung z.B. Umlaute und Tabstops “verstümmelt”, aber immer noch besser als alles neu schreiben.
Comments(0)
