MAMA sagt, wo es lang geht: Opera untersucht Webseiten
Juni 3rd, 2009Opera, der Browserhersteller mit den höchsten Ansprüchen an Webstandards, untersucht zur Zeit das Internet mit einer ganz besonderen Suchmaschine, die den schönen Namen MAMA – Metadata Analysis and Mining Application trägt. Die Suchmaschine widmet sich den Eigenheiten, die bei Webseiten nicht auf den ersten Blick (aber ganz sicher auf den zweiten) ins Auge fallen, etwa Strukturierung, Beachtung von Webstandards, Meta-Informationen, konforme Verwendung von HTML-Tags und -Attributen. Die gewonnenen Erkenntnisse sind nicht nur für Opera als Browserhersteller wichtig (das Unternehmen muß ja schließlich wissen, welche Fehler bei der Seitencodierung auftreten, wie die Mehrzahl der Webseiten gebaut ist und welches Qualitätslevel zum Beispiel der (X)HTML-Code aufweist), sondern auch für die Seitenproduzenten selbst sehr interessant. Aus über 4 Millionen URLs hat Opera bereits im Oktober Key Findings extrahiert und gibt jetzt in seinem Developer Network a sneak peek at headings, images and summary. Und da MAMA immer recht hat, gibt es hier einige der Ergebnisse:
- No headings used: 2473197, 58.5%
- H1 used multiple times in a doc: 336523, 7.9%
- Headings don’t start with H1: 681316, 16.1%
- Heading levels were skipped: 479294, 11.3%
- Heading levels were out of order: 298695, 7.1%
- title used in an img element: 647651, 15.3%
- alt used in an img element: 3176199, 75.1%
- title and alt used together in same img element: 575544, 13.6%
Zu den unpopulärsten, m.a.W. am wenigsten genutzten CCS-Properties gehörten übrigens Page-break-inside, Outline-color, Caption-side, Outline-width, Quotes, Orphans, Widows, Counter-increment, Outline-style und Counter-reset.
