GeoStat 2010 Beta

von Christoph

Die Beta-Version von GeoStat 2010 zur Verkartung beliebiger Daten gibt es nun hier zum Download (Zip-Datei, 7.5 MByte). Beta-Version bedeutet, dass das Projekt nicht ganz fertig ist und möglicherweise noch Fehler enthalten kann. Es handelt sich dementsprechend um eine Vorschau, die für interessierte Nutzer veröffentlicht wird. Die erstellten Karten sind nicht zur Veröffentlichung freigegeben, ein entsprechender Hinweis wird in der Karte vermerkt. Die Installation des Programms ist nicht notwendig, es genügt alle Dateien des Archivs in ein Verzeichnis zu entpacken.

Die vorliegende Beta beherrscht den Import statistischer Basisdaten im

  • CSV-Format (Textdateien die manuell oder via Export von Excel, OpenOffice Calc, etc. erstellt werden können)
  • Geogen Familiennamendaten (benötigt die Geogen-CDR oder den Geogen-Download)
  • vorberechneten XML-Statistiken (bislang nicht dokumentiert, zur internen Verwendung des Programms)

Die Methode der CSV-Dateien ist sicherlich die einfachste. Erstellen Sie eine Datei namens Beispiel.txt. Hierin schreiben Sie zeilenweise Ihre Datensätze. Jede Zeile ein Datensatz. GeoStat 2010 benötigt zur Kartierung mindestens eine Postleitzahl und einen Ortsnamen. Die einzelnen Einträge müssen Sie durchgehend mit demselben Zeichen trennen. Empfohlen ist das Komma, das Semikolon, Tab oder Doppelpunkt. Wollen Sie beispielsweise Ihre Familie kartieren, schreiben Sie in jede Zeile ein Familienmitglied mit Adresse getrennt durch Komma.

Christoph Stöpel,14974,Ludwigsfelde
Christoph Stöpels Bruder,14974,Ludwigsfelde
Grakein Stöpel,14480,Potsdam

Innerhalb von GeoStat 2010 wählen Sie im Hauptmenü Datei den Punkt Daten importieren und hierin Von CSV/Text. Im erscheinenden Assistenten wählen Sie Ihre Beispieldatei aus. Das Programm versucht automatisch den Spaltentrenner zu erkennen. Sollte das Komma nicht identifiziert worden sein, können Sie dies manuell einstellen. Der nächste Schritt ist entscheidend für die Kartierung. Hier beschreiben Sie, in welcher Spalte GeoStat 2010 welche Daten findet. Im oberen Beispiel enthält Spalte 1 den Titel, Spalte 2 die Postleitzahl und Spalte 3 den Ortsnamen. Stellen Sie dies auch so ein, wie im Bilschirmfoto gezeigt.

GeoStat Importassistent

Anschließend startet die Berechnung der Statistik und die Kartierung. Dies kann je nach Leistung Ihres PCs einige Zeit in Anspruch nehmen. Erzeugt werden Karten, die die Statistiken zugeordnet zu Landkreisen, in Clustern oder anamorph verzerrt darstellen. Über die Toolbar oder das Hauptmenü können Sie zwischen den verschiedenen Ansichten wechseln. Über das Menü Datei/Speichern unter können Sie die aktuelle Karte in verschiedenen Formaten sichern.

Systemvoraussetzungen:

  • Betriebssystem MS Windows XP SP3, Vista, 7 oder neuer
  • Prozessor mit 2 GHz oder mehr
  • 512 MByte Arbeitsspeicher
  • 25 MByte freier Festplattenspeicher

Bekannte Probleme in dieser Beta-Version:

  • Die Zusammenlegung von Aachen Stadt und Land zu einem Landkreis ist noch nicht integriert. Die Landkreise werden gemäß Stand vom 31.12.2009 getrennt behandelt.
  • Das Speichern von Karten im HTML-Format berücksichtigt nicht die aktuelle Ansicht und exportiert immer die Cluster-Ansicht.
  • Die Karte der HTML-Ansicht ist etwas großformatig, so dass Nutzer innerhalb des Browserfenster häufig scrollen müssen.

Kartierung der Woche: Arbeitslosenzahlen 06/2010

von Christoph

Diese Woche gibts wieder ein Cartogram mit Landkreisen: die aktuellen Arbeitslosenzahlen von der Federal Employment Agency (hach das klingt so modern, so international). Zur Diskussion des Inhalts fällt mir jetzt nicht allzuviel ein. Ideal wäre natürlich ein Punkt - rein geometrisch ein Objekt mit Null-Ausdehnung. Das hieße Vollbeschäftigung. Dem ist leider nicht so, also hier die transformierte Karte.

Cartogram Arbeitslose Juni 2010

Auffällig ist, dass alle Großstädte Hotspots sind. Das ist logisch, weil hier die meisten Menschen leben. Also auch die Vielzahl der Arbeitslosen. Das führt zu einem enormen Berlin-Ausschlag im Osten. Im Westen beult sich das Ruhrgebiet ziemlich stark aus. Ähnlich wie in Sachsen gibt es hier aber kein offensichtliches Zentrum, sondern die gesamte Region ist mit durchgehend hohen Zahlen gekennzeichnet.

Bei der ganzen Kartogrammerei ist mir übrigens aufgefallen, dass diese Art der Darstellung eigentlich ein didaktisch sinnvoller Ersatz zu den bekannten Tortendiagrammen ist. Dort sieht man die Statistik in der Größe der Tortenstücke. Mit der Farbe des Tortenstückes kann man in der Legende herausfinden, um welchen Eintrag es sich konkret handelt. Das ist beim Cartogram nicht notwendig. Da die Transformation topologietreu ist (also Schlüsselmerkmale nicht unkenntlich macht), kann der Leser mit geeignetem Vorwissen (!) die Statistik direkt ablesen, ohne eine Legende bemühen zu müssen. Mithin dürfte die Darstellung von 400 Werten in einem Tortendiagram ziemlich unübersichtlich sein.

360° Panorama

von Christoph

Nun mal wieder ein Panorama. Die älteren bestanden aus 5 Einstellungen pro Panorama, diesmal sollte es etwas mehr sein. Das Maximum von 360°. Ich habe 67 Aufnahmen in je drei Belichtungen (HDR) gemacht. Das ist soviel, weil ich sogar den Boden unter meinen Füßen und den Himmel über meinem Kopf geknipst habe. Leider hat das beim Ausbelichten dann Probleme bereitet: der wirklich interessante Bereich um den Horizont wirkte dunkel und flau. Boden und Himmel habe ich deswegen leider weggeschnitten, das Panorama lässt sich nur um 12° nach oben und nach unten neigen.

Die Darstellung läuft in einem Flash-Plugin ab, das ich überlicherweise nicht so mag. Aber hier war es ziemlich einfach für das Web einen Viewer zu schreiben, der Skyboxen, genauer Skyspheres beherrscht. Wobei schreiben ist übertrieben. Mit PaperVision3D gibt es eine ziemlich ausgereifte 3D-Engine in Flash, die man nur noch integrieren braucht. Achja, der Aufnahmeort.

Nachtrag 27.04.2017: nun sind so viele Jahre vergangen, dass kein Mensch mehr Flash benutzt und ich keinen Browser mehr habe, der das Panorama anzeigen kann. Ersteres ist gut, letzteres nicht so ganz. Daher das ganze schnell als Javascript nachimprovisiert. Allerdings mit einem Sky-Cylinder, die Darstellung ist also nicht korrekt projeziert. Man schiebt nur noch die Tapete hin und her, jedoch wäre mir eine texturierte Kugel in WebGL jetzt zu viel Aufwand.

Kartierung der Woche: Mitglieder der Linken

von Christoph

Letzte Woche wurde es politisch. Das werde ich heute nochmal fortsetzen. Da ich Gegenüberstellungen mag, diesmal mit dem Gegensatz der Unionsparteien. Doch was ist eigentlich der Gegenpart zur CDU/CSU? Die SPD fällt einem zuerst ein. Bei genauerem Hinsehen, finden sich allerdings fast nur Gemeinsamkeiten. Richtig gegensätzliche Positionen sind kaum auszumachen. Hmm. Dann muss eben eine Abspaltung der SPD herhalten: die Linken.

Damit fix zum Cartogram: Hier sieht man schön die Gegensätze in der Verteilung. Die CDU wurde ja übermäßig stark durch die weiter westlich gelegenen Bundesländer repräsentiert. Bei den Linken ist es nun fast genau andersrum. Obwohl kein Bundesland so stark geschrumpft (id est unterrepräsentiert) ist wie bei der CDU. Die Partei ist aber auch noch vergleichsweise jung - und so auch ihre Hochburgen.

Mitglieder-Cartogram der Linken

Dass Bayern gerademal halb so groß ist wie Berlin, ist allerdings 'ne Ansage!

Kartierung der Woche: Mitglieder der Unionsparteien

von Christoph

Die heutige Kartierung ist schwarz-weiß. Nicht etwa, weil mir die Farbe ausgegangen ist, sondern weil es dabei um die Mitgliederzahlen einer Partei geht. Genau genommen um zwei Parteien: die CDU/ CSU. Und deren bevorzugte Darstellung ist nunmal schwarz. (Jaja, seit einigen Jahren wird auch ein herzlich warmes, modernes Wohlfühlorange benutzt. Ein Hoch auf die Imageberater!) Aber die Farbe der Union ist und bleibt trotz aller Spins schwarz - das meine ich jetzt wirklich nicht doppeldeutig sondern rein physikalisch vom Farbspektrum.

Spektrum. Das bringt mich auch gleich zur kurzen Diskussion der Grafik. Die westlichen Bundesländer sind deutlich überrepräsentiert. Im Vergleich dazu sind die ostdeutschen Länder stark geschrumpft. Die Mitgliederzahlen sind hier vergleichsweise gering. Das ist insofern überraschend, als dass die Wiedereinigung bereits 20 Jahre her ist, das Ungleichgewicht in der Parteienmitgliedschaft aber immernoch gravierend ist. Offenbar braucht eine Partei mehr als 20 Jahre, um die Menschen überall gleichermaßen zu erreichen. Wobei die kostenpflichtige Mitgliedschaft eine höhere Motivation darstellt als blosse Stimmabgabe bei einer Wahl. Echte Überzeugung breitet sich offenbar langsamer aus, als Wahlplakate.

Mitgliederzahlen der Unionsparteien

Das zugrunde liegende Zahlenmaterial ist übrigens aus dem Geschäftsbericht von 2008 (PDF). Ich habe diese Broschüre in megatrendigem Orange allerdings nicht selbst rausgesucht, sondern aus der Wikipedia übernommen, die sie dort rausgesucht haben. Es gibt zwei gesondert ausgewiesene Stadtverbände. Die habe ich eiskalt zum sie umgebenden Bundesland dazugerechnet.

Die Farbskala habe ich mit dem Colorbrewer v2 (Flash) generiert. Das Cartogram für Bundesländer wurde mit einem selbstgeschriebenen Konsolenprogramm auf Basis des GeoStat-Kerns erstellt.

Kartierung der Woche: Richters in Deutschland

von Christoph

Der Familienname Richter belegt den 14. Platz der häufigsten Namen in Deutschland. Ich habe mich für diesen Namen entschieden, weil sich in der Visualisierung geradezu vorbildlich eine Konzentration in Sachsen ausmachen lässt. Wenn man alle Richters gleichmäßig auf Deutschland verteilen wollte, müsste man die Grenzen wie in der folgenden Grafik anpassen. Oder anders ausgedrückt: Aus den Flächen der Landkreise lassen sich unmittelbar die Anteile der Richters ablesen. Sachsen ist dementsprechend 3x so groß wie Bayern, da es dort dreimal soviele Richters gibt. Die Landkreise habe ich zusätzlich aus didaktischen Gründen eingefärbt.

Richterin Deutschland

Erstellt habe ich diese Karte mit meinem aktuellen Build 20100609 von GeoStat 2010. Wie man unschwer erkennen kann, ist der Import von Geogen-Daten nun fertiggestellt. Ich werde noch an ein paar Kleinigkeiten feilen und hoffentlich demnächst eine Beta-Version veröffentlichen.

Announcing Geostat 2010

von Christoph

Wie ich auf Twitter bereits kurz schrieb, bin ich ganz begeistert von einem englischen Paper zur Kartographie. Darin geht es um die Generierung von Cartograms (die deutsche Entsprechung ist -man mag es sich denken- Kartenanamorphote). In Cartograms wird die Karte nicht nur eingefärbt sondern entsprechend des statistischen Wertes auch noch verzerrt. Das erinnert an die relative Verkartung, wenn man z.B. die Bevölkerungsdichte verrechnet. Hier wird aber direkt die Projektion verändert, so dass man aus der Größe der Darstellung (und eben nicht nur aus der Farbcodierung) die einzelnen Werte herauslesen kann.

Eine Implementierung für Deutschland war schnell erstellt. Als Beispiel seien die Landkreise Deutschlands verzerrt nach ihrer Bevölkerungszahl angeführt. Ich habe diese Grafik für den Wikipedia-Artikel zur Kartenanamorphote freigegeben.

Und was hat der geneigte Leser davon? Nun, die Implementierung war interessant, dass ich denke, dass dies ein neues Softwareangebot rechtfertigt. Wie der geneigte Leser bereits aus dem Titel entnimmt, lautet der Entwicklungsname GeoStat 2010. Ja, mit Jahreszahl. Eine regelmäßige Weiterentwicklung ist durchaus denkbar. Erstmal geht es aber nur darum, eine einfache Möglichkeit bereitzustellen an verkartete Statistiken zu kommen, die sonst nur wissenschaftlichen Instituten zugänglich sind.

Screenshot

GeoStat 2010 hat einen völlig neu geschriebenen Kartierungskern. Auch wenn die Optik den Geogen-Karten derzeit bis aufs Haar gleicht. Die interne Struktur ist weitaus besser auf Erweiterungen ausgelegt. Eine kurze Übersicht für die Technikinterssierten:

  • Kern in C++ mit Verwendung der STL und Boost
  • Oberfläche in MFC mit dem Visual C++ Feature Pack (Themes...) erweitert
  • Visualisierung auf Basis der freien Cairo-Bibliothek
  • Geographische Daten mit Grenzen von 2010
  • Import und Georefenzierung beliebiger Daten im CSV-Format (geplant: OpenDocument-Tabellen, Geogen)
  • Export in hochauflösende PNGs und interaktive HTML-Seiten (geplant: PovRay für 3D)
  • frei konfigurierbare Farbschemata und Transformationen

So. Das erstmal zum Announcement. Der Plan ist, dass ich weitere Artikel schreibe, wenn irgendetwas besonders interessantes aus Entwicklersicht angefallen ist. Der Release steht dann an, wenn all das getan ist und wird wiederum hier verkündet.

HDR-Panorama-Fotographie

von Christoph

Fotos ohne Nachbearbeitung? Gibts doch garnicht mehr! Aber richtig macht mans nicht mit ein klein wenig Retusche hier und da, sondern wenn schon dann komplett synthetisch. Besonders interessant sind hierbei die High-Dynamic-Range Techniken (Hochkontrast-Fotographie). Ich benutze dafür die Powershot G9 von Canon, die eine Belichtungsreihe mit einem Knopfdruck aufnehmen kann. D.h. es wird nicht nur ein Bild geschossen sondern zusätzlich noch ein oder mehr unterbelichtete und ein oder mehr überbelichtete. Die Belichtungen werden dann zum "perfekten" Bild kombiniert. Vorbei sind die Zeiten mit überstrahltem reinweißen Himmel!

Die Kombination zum HDR-Bild übernimmt Photomatix. Hat man mehrere Aufnahmen einer Szene, die sich überlappen kann man diese zu einem Panorama kombinieren. Gute Arbeit im automatischen zusammenpappen (stitching) leistet Autopano Pro. Doch genug der Vorrede, hier die Bilder: ich habe jeweils 3 Belichtungen in 5 veschiedenen Winkeln, also in der Summe 15 Bilder pro Panorama aufgenommen.

Rathaus Ludwigsfelde Campus Griebnitzsee Umland Ludwigsfelde Feldweg nach Siethen Strand Heiligendamm Pier Heiligendamm