Vanions Blog

Cloudy Day at the North Sea

Spielerei mit Python und dem Mastodon-Archiv

Ich bin seit einigen Tagen krank und es scheint, dass ich noch ein paar weitere Tage brauchen werde, um wieder auf die Beine zu kommen. Aber heute fühle ich gut genug um ein bisschen mehr tun, als im Bett zu liegen und hirnlos an die Decke zu starren - oder Tik Toks zu schauen … die Dinge, die man eben tut kann, wenn das Gehirn auf Nebelfahrt ist.

Seit einigen Jahren poste ich auf Mastodon immer mal etwas aufwendigeres. Nicht viel: Einige Hintergrundinformationen zu einer LP, die gerade läuft. Oder ein eine Recherche zu einem Songcover, dass mir gefällt. Über die Jahre ist das aber so viel geworden, dass ich selbst etwas den Überblick verloren habe. Außerdem ist Mastodon (wie alle sozialen Netzwerke) kein sehr gutes Archiv - man kann nicht gut suchen und Altes verliert sich im Rauschen. Deshalb habe ich mich entschlossen, die interessanten Toots noch mal auf meiner Website zu veröffentlichen.

Das jetzt alles aus Mastodon zu kopieren und dann die einzelnen Toots für Hugo aufzuarbeiten, ist aber eine Menge Arbeit. Gut aber, dass Mastodon anbietet, die eigenen Daten als Archiv herunterzuladen. Allerdings sind die Toots in einem riesigen JSON-File und die zugehörigen Mediendateien gehasht in einem großen Verzeichnisbaum. Also etwas, wo man ein bisschen Automatisierung draufwerfen muss, um nicht zu viel Arbeit zu haben.

Das hab ich dann heute getan und - ich schiebe es auf mein vernebeltes Hirn - Python als Tool der Wahl genutzt. Da das mein erste halbwegs ernsthafter Kontakt mit Python war, war das gleich doppelt schmerzhaft. Aber die Sprache hat Bibliotheken um schnell mal große strukturierte Daten durchzugehen. also nicht jammern. Google und ChatGPT sei Dank ging es auch recht gut voran.

Das Ergebnis findet sich auf GitLab und kann dort belächelt werden. Oder vielleicht nutzt es jemandem sogar. Ich hab aber noch ein, zwei Ideen für weitere Funktionen, die wohl dieser Tage dazu kommen.

Natürlich macht das Skript nur die halbe Arbeit, aber vor allem die langweilige. Die verbleibende Hälfte ist die inhaltliche Auseinandersetzung: Was soll übernommen werden, was ist Quark, wo müssen noch mal ein, zwei Sätze ergänzt oder follow-Toots angehängt werden.

Hat Spaß gemacht. Nu geh ich aber wieder die Decke anstarren.

Copyright © 2023 Vanion