©

Wer Daten aus sozialen Medien verwenden darf und für welchen Zweck, wird heftig debattiert, seit die Beratungsfirma Cambridge Analytica mithilfe von Facebook-Daten versucht hat, die Wahlentscheidung von Millionen Amerikanern zu manipulieren. Wissenschaftler jedoch nutzen soziale Netzwerke schon lange als Datenquelle. Auch der Computerlinguist Egon Stemle und der Ökosystemforscher Lukas Egarter Vigl von Eurac Research. Ein Gespräch über Möglichkeiten und Methoden solcher Forschung – und über die ethische Verantwortung des Forschers.

In welchen Forschungsprojekten nutzen oder nutzten Sie Daten aus sozialen Medien?

Egon Stemle:
Vor ein paar Jahren haben wir die Facebook-Einträge deutschsprachiger Südtiroler analysiert und je nach Altersgruppen interessante Unterschiede im Sprachgebrauch festgestellt. Jetzt gerade arbeite  ich an einer Studie von Lukas Egarter Vigl mit, in der wir die immateriellen Ökosystemleistungen alpiner Landschaften untersuchen. Datenquelle ist dabei die Fotoplattform Flickr.

Lukas Egarter Vigl: Wer dort seine Fotos veröffentlicht, lädt gleichzeitig Metadaten hoch: die geographische Position und die Zeit. Es gibt also nicht nur die Bilder – man kann auch genau sagen, wo und wann sie gemacht wurden. Diesen riesigen Datenpool nutzen wir, um die kulturellen Leistungen zu  analysieren, die eine Landschaft bereitstellt. Wir verwenden eine Software, die den Inhalt der Bilder erkennt und in Sprache verwandelt: Zu jedem Bild erhalten wir damit kurze Beschreibungen, sogenannte Tags. Bei der Analyse dieser Textinformation kommt die Linguistik ins Spiel, also Egon Stemle. So ordnen  wir die Bilder verschiedenen Kategorien zu, etwa „Landschaftsästhetik“. Am Ende haben wir bestenfalls ein ziemlich klares Bild davon, welche kulturellen Bedürfnisse eine Landschaft in welchem Maß erfüllt.

Was macht Daten aus sozialen Netzwerken für Forscher so interessant?

Egarter Vigl: Eine Untersuchung wie diese wäre ohne solche Daten nur mit immensem Aufwand möglich:  Die immateriellen Güter, die uns Ökosysteme zur Verfügung stellen, sind schwer zu quantifizieren und werden auch sehr subjektiv empfunden – wir müssten also ausführliche Befragungen durchführen, könnten damit aber nie so große Gebiete abdecken wie es uns mit den Flickr-Daten gelingt. Diese Daten sind schon vorhanden, wir brauchen sie nur zu analysieren und können auf Fragen antworten wie: Wo in Südtirol werden die meisten Bilder gemacht? Zu welcher Jahreszeit? Welche sind die häufigsten Motive? Die Ergebnisse können wir dann z.B. mit Strukturmerkmalen der Landschaft in Verbindung bringen, um so von den Ökosystemleistungen einer bekannten Landschaft auf andere, vergleichbare Landschaften zu schließen.

Stemle: Als Sprachwissenschaftler bin ich an sprachlichen Phänomenen interessiert, und da ist Kommunikation natürlich immer spannend – und in sozialen Netzwerken kommunizieren Menschen in  sehr ausgeprägter Form. Hat man ausreichend Daten über einen längeren Zeitraum, kann man daran z.B. sehr gut untersuchen, wie Sprache sich verändert.

Wie aussagekräftig die Ergebnisse sind, hängt stark von der Datenqualität ab – welche Probleme können auftreten, wenn soziale Medien der Datenlieferant sind?

Stemle: Bei der Arbeit mit Sprachdaten ist prinzipiell zu berücksichtigen, dass viele Metadaten maßgeblich von der Art und Weise beeinflusst sind, in der User ihren Text eingeben, also von der Interaktion mit dem Gerät, oder von den Mitteln, die eine Plattform zur Verfügung stellt. Sammelt man da als Forscher Daten über einen Zeitraum von zehn Jahren, bedeutet das in Social-Media-Zeitdimensionen eine Ewigkeit! Da kann vieles sich einfach deshalb verändert haben, weil die Technologie sich verändert hat, oder die Plattform.

Egarter Vigl: Bei unserer Studie besteht ein Problem darin, dass nicht alle Flickr-User in gleichem Maß  aktiv sind – veröffentlicht jemand von einem Ort sehr viele Fotos, dann verzerrt das natürlich unser Ergebnis. Um diesen Fehler so klein wie möglich zu halten, zählen wir jeden User nur einmal pro Tag und Ort mit.

Der Zugriff auf Social Media-Daten wird wegen des Falls Cambridge Analytica derzeit heftig debattiert – welche Richtlinien gelten in dieser Hinsicht für die Wissenschaft? Was dürfen Forscher?

Stemle: Die Rechtslage war da bisher in jedem europäischen Land ein bisschen anders, was internationale Forschungszusammenarbeit schwierig machte. Ab 25. Mai aber regelt die „Datenschutz- Grundverordnung“ der EU die Verarbeitung personenbezogener Daten durch private Unternehmen und öffentliche Stellen für alle Mitgliedstaaten einheitlich. Sie enthält auch Vorschriften für besondere Verarbeitungssituationen, etwa zu Forschungszwecken. Das ist ein wichtiger Schritt in die richtige Richtung. Doch zum rechtlichen Aspekt kommt natürlich der ethische – da tut sich nochmal eine ganz neue Dimension auf.

Mit strengeren Maßstäben?

Stemle: Jedenfalls darf ich als Wissenschaftler Daten noch lange nicht einfach für meine Forschungen verwenden, nur weil sie frei zugänglich sind. Daten können auf einer Plattform verfügbar sein – aber wenn  die Menschen, die sie dort zur Verfügung gestellt haben, nicht damit rechnen konnten, dass ihre Daten wissenschaftlich analysiert werden, dann darf man das als Forscher auch nicht. Es gilt das Prinzip des  „informed consent“: Ein Wissenschaftler muss den Leuten genau erklären, wofür er ihre Daten verwenden möchte, und ihr Einverständnis einholen. So haben wir es bei unserer Facebook-Studie auch gemacht.

Die Flickr-User wissen aber nicht, dass ihre Fotos wissenschaftlicher Erkenntnis dienen.

Egarter Vigl: In diesem Fall ist das vertretbar, weil die Daten völlig anonymisiert und in keiner Weise personenbezogen sind, wir sogar bewusst den Einfluss des einzelnen Users begrenzen.

So hohe ethische Standards haben sich in der Wissenschaftsgemeinschaft aber offenbar noch nicht  allgemein durchgesetzt: Eine diesbezügliche Studie in Großbritannien kam zu dem Schluss, dass in  sozialen Netzwerken geteilte Informationen häufig für Forschungsprojekte genutzt werden, ohne dass die User es wissen.

Stemle:
Da fällt mir eine Studie zweier dänischer Forscher ein, die dafür einfach Daten der Dating-Plattform OkCupid verwendeten, ohne dass irgendwer dem zugestimmt hätte. Den beiden schlug aus der  Forschergemeinschaft aber scharfe Kritik entgegen. Allen ist bewusst: Wenn Wissenschaftler so arbeiten –  also wenn sie sich auf eine rein rechtliche Position zurückziehen, ohne jede moralische Sensibilität – dann  werden Forscher bald an keine Daten mehr herankommen.

Die Facebook-Daten, die Cambridge Analytica im US-Wahlkampf nutzte, wurden offenbar auch von einem Wissenschaftler weitergegeben, der sie  ursprünglich zu Forschungswecken gesammelt hatte.

Stemle: Welche Verantwortung dieser Wissenschaftler hat, ist noch nicht zur Gänze geklärt. Sicher ist aber,  dass die Ergebnisse, die wir als Forscher erzielen, natürlich auch für Zwecke verwendet werden können, die wir ganz und gar nicht im Sinn hatten. Ich arbeite als Computerlinguist z.B. unter anderem daran, Sprachdaten auch in dialektaler Form maschinell analysierbar zu machen. Wenn aber Computer irgendwann auch Dialekte verarbeiten können, etwa die des süddeutschen Raums, dann bedeutet das auch, dass man über ein paar Millionen Leute genauere Aussagen machen kann, weil Tweets oder Facebook-Messages, die im Dialekt verfasst sind, ebenfalls analysiert werden können.

Related Articles

Tecno-prodotti. Creati nuovi sensori triboelettrici nel laboratorio di sensoristica al NOI Techpark

I wearable sono dispositivi ormai imprescindibili nel settore sanitario e sportivo: un mercato in crescita a livello globale che ha bisogno di fonti di energia alternative e sensori affidabili, economici e sostenibili. Il laboratorio Sensing Technologies Lab della Libera Università di Bolzano (unibz) al Parco Tecnologico NOI Techpark ha realizzato un prototipo di dispositivo indossabile autoalimentato che soddisfa tutti questi requisiti. Un progetto nato grazie alla collaborazione con il Center for Sensing Solutions di Eurac Research e l’Advanced Technology Institute dell’Università del Surrey.

unibz forscht an technologischen Lösungen zur Erhaltung des Permafrostes in den Dolomiten

Wie kann brüchig gewordener Boden in den Dolomiten gekühlt und damit gesichert werden? Am Samstag, den 9. September fand in Cortina d'Ampezzo an der Bergstation der Sesselbahn Pian Ra Valles Bus Tofana die Präsentation des Projekts „Rescue Permafrost " statt. Ein Projekt, das in Zusammenarbeit mit Fachleuten für nachhaltiges Design, darunter einem Forschungsteam für Umweltphysik der unibz, entwickelt wurde. Das gemeinsame Ziel: das gefährliche Auftauen des Permafrosts zu verhindern, ein Phänomen, das aufgrund des globalen Klimawandels immer öfter auftritt. Die Freie Universität Bozen hat nun im Rahmen des Forschungsprojekts eine erste dynamische Analyse der Auswirkungen einer technologischen Lösung zur Kühlung der Bodentemperatur durchgeführt.

Article
Gesunde Böden dank Partizipation der Bevölkerung: unibz koordiniert Citizen-Science-Projekt ECHO

Die Citizen-Science-Initiative „ECHO - Engaging Citizens in soil science: the road to Healthier Soils" zielt darauf ab, das Wissen und das Bewusstsein der EU-Bürger:innen für die Bodengesundheit über deren aktive Einbeziehung in das Projekt zu verbessern. Mit 16 Teilnehmern aus ganz Europa - 10 führenden Universitäten und Forschungszentren, 4 KMU und 2 Stiftungen - wird ECHO 16.500 Standorte in verschiedenen klimatischen und biogeografischen Regionen bewerten, um seine ehrgeizigen Ziele zu erreichen.

Article
Erstversorgung: Drohnen machen den Unterschied

Die Ergebnisse einer Studie von Eurac Research und der Bergrettung Südtirol liegen vor.