The truth is rarely pure and never simple

Jugend forscht: Layoutanalyse

Wieder hat mich der vielzitierte “Jugend forscht”-Virus erwischt. So habe ich dieses Jahr mit dem Thema “Modularsequentielle Layoutanalyse – Zeitungsausschnitt durch Algorithmus statt Schere” am Wettbewerb teilgenommen. Auf der Regionalrunde wurde die Arbeit mit einem ersten Platz ausgezeichnet; auf Landesebene mit einem zweiten Platz.

Worum geht es?

Wenn Zeitungen in Papierform vorliegen (bspw. die Tageszeitung oder in Archiven), bleibt zum Durchsuchen nur die Option, die Zeitung durchzublättern. Ab einer gewissen Menge an Ausgaben wird die manuelle Bearbeitung sehr aufwändig. All jene, die einen Pressespiegel erstellen oder in Archiven Informationen suchen, könnten Hilfe bei dieser – für Menschen – recht stupiden Arbeit sicher gebrauchen.

Ich habe einen Algorithmus entwickelt, der es ermöglicht, sehr schnell und genau Scans von Zeitungsseiten zu digitalisieren und wieder als Artikel im Rechner zu speichern. Dabei liegt die Erkennungsrate derzeit bei etwa 93%. Um zu demonstrieren, dass der Algorithmus funktioniert, ist eine funktionsfähige Beispielimplementierung verfügbar. Mehr nach Abschluss des Wettbewerbs oder auf Anfrage.

Wie arbeitet das Programm?

Für die Präsentation beim Wettbewerb habe ich ein Video erstellt, dass die einzelnen Schritte visualisiert. Eine Version mit geringer Auflösung ist online verfügbar.