Please scroll down for english version.
Auf dem Digital Participation Camp (DPC), welches in Münster stattfand, sprachen wir mit dem jungen tunesischen Aktivisten Wassim Zoghlami. Er arbeitet zurzeit in Deutschland an einem Projekt, um den IS-Terror mit Anwendungssoftware aus dem Social-Media-Bereich und Monitoring-Strategien zu bekämpfen.
Du bist ziemlich weit herum gekommen – ursprünglich stammst Du aus Tunesien, Du hast in Kalifornien studiert und nun bist Du in Deutschland – wie kam es dazu?
Ja, ich bin in Tunesien geboren und aufgewachsen und als Austauschstudent in die Vereinigten Staaten gegangen, was mich zu einem offeneren Menschen mit einem größeren Netzwerk machte. Ich habe an der California State University studiert und war für ein Jahr im Silicon Valley. Dort machte ich einige Praktika und entdeckte meine Leidenschaft für Datenmaterial. Als Student der Softwaretechnik wollte ich meinen Schwerpunkt auf die Arbeit mit Daten legen und das Beste daraus machen, also konzentrierte ich mich auf Informationsdienste. Hier werden öffentliche Daten zur Visualisierung verwendet, um Entscheidungsträger bei der Ergebnisfindung zu unterstützen. Ich habe in meinem Leben viel ehrenamtliche Arbeit geleistet, so etwa in gemeinnützigen Einrichtungen und Open-Source-Projekten fürs soziale Gemeinwohl und ich arbeite leidenschaftlich gerne an Projekten, die eine größere Wirkung erzielen. Ich möchte nicht nur einfach für einen Kunden arbeiten, der solche Projekte dann benutzt, sondern mir liegt die Idee am Herzen, dass Technologien dabei helfen können, Menschrechten Gehör zu verschaffen und Menschen auf der ganzen Welt zu helfen. Denn Technik ist der schnellste und einfachste Weg, um Einfluss zu nehmen. Mein großes Interesse für Daten half mir dabei, die Idee des DataShield Projektes zu entwickeln.
Ich interessiere mich sehr für dieses DataShield Projekt – bitte erzähl uns ein wenig davon.
Die Idee zum DataShield Projekt kam mir unmittelbar nach dem Anschlag auf das Nationalmuseum in Bardo, dem schlimmsten militanten Anschlag im Land seit mehr als einem Jahrzehnt. Das war sehr schockierend, sowohl für Tunesien, als auch für die ganze Welt. Ich habe die Nachrichten über den IS speziell seit dem Anschlag in Frankreich im Februar verfolgt, als jeder vom Anschlag auf Charlie Hebdo entsetzt war. Und dabei fand ich heraus, dass der IS zu der attraktivesten Terrorgruppierung für Kämpfer aus aller Welt geworden war. Diese nutzen Social Media, um zu kommunizieren. Sie benutzen spezielle Hashtags, Phrasen und Kombinationen von Wörtern, um untereinander zu kommunizieren, denn das Netzwerk ist groß und jeder kann mitmachen. Also verwenden sie soziale Netzwerke, vor allem Facebook und Twitter, um ihre düstere Ideologie zu verbreiten, um Leute anzuwerben, speziell, um neue Kämpfer für den IS zu gewinnen, um andere einer Gehirnwäsche zu unterziehen. Wir haben von vielen Fällen gehört, in denen Gehirnwäsche angewandt wurde.
Da der IS viel Datenmaterial produziert, wollten wir dieses wirksam einsetzen, um ihn zu bekämpfen, um es gegen ihn zu verwenden. So kam ich also dazu, an einem Nebenprojekt zu arbeiten, als der Anschlag auf das Nationalmuseum in Bardo verübt wurde, bei dem 24 Menschen getötet und mehr als 50 verletzt wurden. Ich erinnere mich daran, dass ich in der Nacht vor dem Anschlag einen Trend in den Tweets bemerkte; es gab einen Tweet, der von einem offiziellen IS-Account kam und der bereits einen Tag vorher den Anschlag auf das Museum ankündigte. Ich war erstaunt und stellte fest, dass ein riesiges Netzwerk von Leuten darüber sprach, sich organisierte und sehr viel Datenmaterial veröffentlichte. Also dachte ich: Vielleicht kann ich an einem Data Mining Projekt arbeiten? Überraschenderweise entdeckte ich, dass es ich nur drei Tage vor dem Anschlag auf das Nationalmuseum von Bardo eine höhere Aktivität der IS-assoziierten Accounts gab und einen stärkeren Gebrauch von speziellen Hashtags, die sie verwendeten. Wir hätten also drei Tage vor dem eigentlichen Anschlag wissen können, dass da etwas vor sich geht – man stelle sich die Möglichkeiten vor, die wir gehabt hätten, um diesen Anschlag zu verhindern.
Könntest Du im Detail erklären, wie Data Mining funktioniert?
Ich rede jetzt von Data Mining als Konzept – das bedeutet zunächst einmal viel Material zu sammeln und es zu analysieren. Man muss spezielle Algorithmen dafür verwenden und die ganzen Daten entschlüsseln und versuchen sie so zu sortieren, dass sie einen Sinn ergeben. Wir verwenden dabei nicht alles Datenmaterial, sondern greifen auf Data Mining von Twitter mit speziellen Hashtags zurück. Für die Begriffe und Hashtags, die die IS-Sympathisanten verwenden, haben wir eine Datenbank. Es gibt eine Liste, die wir nicht auf unserer Plattform veröffentlichen werden. Die Hashtags müssen geschützt bleiben, denn sie [die IS-Sympathisanten, Anmerkung d. Verfasserin] benutzen sie immer noch und würden sie anderenfalls ändern. Wir verwenden diese Hashtags, um zwischen den Tweets zu unterscheiden, die wir analysieren. Dadurch erhalten wir ein besseres Verständnis darüber, welche die wichtigsten Hashtags sind. Wir benutzen auch ein System zur automatischen Priorisierung, also je häufiger ein Hashtag verwendet wird, desto höher wird es eingestuft. So funktioniert das Ranking und so trennen wir die normalen Tweets von denen mit Hashtag. Wir bekommen viel Datenmaterial, das wir visualisieren; wir erstellen Graphen, welche die Intensität verdeutlichen.
Daneben haben wir eine Datenbank über die offiziellen Kanäle und die Accounts der IS-Anhänger. Twitter und Facebook sperren diese Accounts ständig, daher müssen wir unsere Datenbank immer auf dem neusten Stand halten. Dieses Sperren ist ein äußerst ineffektiver Weg, um den IS zu verhindern, denn sie erstellen einfach einen neuen Account. Uns hilft es eher, wenn sie ihre alten Accounts behalten, denn dann haben wir mehr Datenmaterial, was uns dabei hilft diese Aktivitäten aufzudecken.
Und man erkennt auch direkt, wer sich hinter einem Account verbirgt während wenn jemand einen neuen Account erstellt, kann man nicht sicher sein, ob es die gleiche Person wie zuvor ist?
Doch, das kann man erkennen. Denn wenn jemand zum IS geht, dann bekommt er einen bestimmten Namen, den wirklich nur er hat. Und selbst bei einem neuen Benutzernamen können wir herausfinden, ob es derselbe Account wie zuvor ist, weil sie meistens nur das Ende wie etwa Zahlen ändern, zum Beispiel „Irgendwas 14“ wird dann zu „Irgendwas 15“ – so läuft das. Der Graph zur Intensität der Aktivitäten zeigt, wann sie etwas planen; sie twittern dann mehr und das kann ein Indiz sein. Auch das müssen wir in die Plattform integrieren. Ein anderer Graph zeigt den Gebrauch der Hashtags, welcher die wichtigste Information auf der Plattform ist, denn das kann bei einer verstärkten Verwendung in der Kommunikation ebenfalls ein großer Hinweis darauf sein, dass ein Anschlag unmittelbar bevorsteht und sogar auf einen zukünftigen Anschlag hindeuten, wenn es einen rasanten Anstieg gibt.
Ein weiterer Graph enthält eine Weltkarte, welche die Orte herausstellt, an denen der IS häufig tweetet; so haben wir vor einigen Tagen herausgefunden, dass sich in Europa vor allem in Polen eine hohe Aktivität verzeichnen lässt. Das ist schon sehr merkwürdig, daher nehmen wir an, dass sie statt ihrer eigenen IP-Adressen VPN-IP-Adressen aus Polen benutzen. Oder aber – es gibt etliche Theorien im Moment, wir wissen es noch nicht genau – es gibt vielleicht viele IS-Sympathisanten in Polen, was allerdings ziemlich unwahrscheinlich ist und sehr seltsam wäre. Wir können also nicht mit 100-prozentiger Wahrscheinlichkeit vorhersagen, wir analysieren lediglich das Datenmaterial, dass sie produzieren und versuchen es zu visualisieren, um es für die Öffentlichkeit zugänglich zu machen, damit sie Vorkehrungen treffen kann. Und hoffentlich, um Leben zu retten und zukünftige Anschläge zu verhindern.
Momentan gibt es in Deutschland eine große Diskussion um Vorratsdatenspeicherung: Wie steht Dein Projekt zu den Argumenten der Befürworter bzw. Gegner?
Ich bin ein großer Befürworter der Privatsphäre und des Datenschutzes. Ich bin gegen alle NSA-Aktivitäten, bei denen sie versuchen sich an persönliche Informationen heranzumachen und jedermanns Daten zu bekommen. Und das ist auch der Grund, warum wir nur öffentlich zugängliches Datenmaterial verwenden. Wir werden uns also keine heimlichen Aktionen durchführen oder die Accounts von Leuten hacken, wir benutzen lediglich das Datenmaterial, was diese Terroristengruppierungen produzieren. Wir unterstützen nach wie vor Datensicherheit – was das angeht, sind wir sauber.
Wenn Du von „wir“ sprichst – wie viele Leute arbeiten an dem DataShield Projekt, es ist Teil Deiner Abschlussarbeit, soweit ich weiß?
Ja, es ist Teil meines Studienprojekts, das ich ursprünglich allein angefangen habe. Aber nach dem TEDx Talk wollten eine Menge Leute mitmachen und ich habe dann entschieden, das Projekt öffentlich zugänglich zu machen, so dass jeder dazu beitragen kann. Während des DPC hatte ich ein Team von 12 Leuten, von denen jeder auf einem bestimmten Gebiet mit speziellen Aufgaben arbeitete. Einige arbeiten an der Recherche, einige entwickeln die Algorithmen, andere entwickeln die Webseite und wiederum andere richten den GitHub Account für das Open-Source-Projekt ein und arbeiten an einer Dokumentation für jeden, der mitmachen will. Mir ist klar, dass ich einerseits ein persönliches Interesse verfolge aufgrund dessen, was in meinem Land passiert ist, aber mittlerweile ist es eine sehr globale Angelegenheit. Das ist der Grund, warum diese Initiative globalisiert werden sollte. Jeder kann dazu beitragen, denn jeder ist betroffen, es geht nicht nur um Tunesien, es geht nicht nur um einen Freund aus dem Jemen oder den Vereinigten Staaten – jeder kann das Ziel sein. Indem wir es also öffnen, bekommen wir mehr Unterstützung und somit eine größere Qualität.
Was sind Deine zukünftigen Pläne für die nächsten zwei Jahre?
Ich würde sehr gerne zu Sicherheitszwecken mit diesen Daten arbeiten, denn ich denke, da liegt ein großes Potential für die Zukunft. Außerdem bin ich ein Serienunternehmer: ich habe zwei Start-Ups ins Leben gerufen, eins in Kalifornien, was ich auch in Tunesien eingeführt habe – beides Start-Ups im Bereich der Gesundheitswesen-Technologie. Eins nannte sich „What’s In“ und ist eine App, die das Leben von Menschen mit Allergien verbessern soll. Daran möchte ich immer noch parallel weiterzuarbeiten. Vielleicht rufe ich in Zukunft auch noch ein anderes Unternehmen ins Leben, welches sich mit der Arbeit an Daten zu Sicherheitszwecken beschäftigt, denn das ist ein großes Feld, durch das in einigen Jahren mit Sicherheit viele Probleme in der ganzen Welt gelöst werden.
— English version —
At the Digital Participation Camp (DPC) which took place in Münster we spoke to young Tunisian activist Wassim Zoghlami. He is currently working in Germany on a project to fight ISIS terror using social media applications and monitoring strategies.
You have travelled a long way – originally you are from Tunisia, you studied in California, now you are in Germany, how did this come about?
Yes, I was born and raised in Tunisia and I went to the United States as an exchange student which made me more open and led to a bigger network. I studied at California State University, and I was in Silicon Valley for a year. I did some internships there and I discovered my passion for data. As a Software Engineering student I wanted to put my emphasis on working with data, making the best of it so I emphasised on Business Intelligence. It is using public data to visualise it and that helps decision makers to make better decisions. During my life I have been volunteering a lot, working in community services and in open sources projects for social good and I am very passionate about working on a project that will help to have a bigger impact. I don not want to work on a project for just a client who is going to use it. And I am also very passionate about the idea that technology can help and uplift human rights and help people around the world because technology now is the fastest and easiest way to create an impact everywhere. So I think my passion for data helped me working to come up with the idea of the DataShield Project.
I am very interested in this DataShield Project. Please tell us a bit about it.
I came up with the idea of the DataShield Project right after what had happened in the Bardo Museum, which was the country’s worst militant attack since more than a decade ago. That was very shocking for the whole world and for Tunisia. I have been following the news of ISIS especially after what happened in France in February when everyone was shocked by the Charlie-Hebdo attacks.
And I found out that Islamic State became one of the most interesting terrorist groups all over the world and now they have fighters from absolutely everywhere. They are using social media to communicate, they use special hashtags and phrases and combinations of words to communicate between each other, because the network is very big and everyone can join. So they are using social networks, especially Facebook and Twitter to promote their dark ideology, to recruit people, to recruit new fighters to join the Islamic State, to brainwash people. We heard from many cases of brainwashing from everywhere. So we wanted to leverage – because they are producing lots of data – all the data to counter them, to use it against them. So that is how I worked on a side project after the Bardo attack, which resulted in 24 people dead and more than 50 people injured. I remember the night of the attack I saw a tweet trending, a tweet that was sent from an official ISIS account, announcing the attack on the museum a day before it actually happened. I was astonished and I discovered this big huge network of people talking about it, organising themselves and publishing data, lots of data. So I thought: Maybe I could work on a data mining project? Surprisingly I found out that there was a higher activity of the ISIS associated accounts and a higher usage of special hashtags that they were using just three days before the actual attack in the Bardo Museum happened. So we could have known that something is going to happen three days before the actual attack – so can you imagine the possibility that we could have done something to prevent the attack?
Could you explain how data mining works in detail?
Data mining is gathering a lot of data – I am talking of data mining like a concept – and analysing it. You have to use special algorithms to do that and decrypt all the data and try to make sense of it. We are not using all data, we are trying to use the data mining from Twitter with special hashtags. We have a database of the wordings and hashtags that ISIS supporters are using. There is a list we are not going to show on the platform later because we need the hashtags to be preserved because they are still using them, otherwise they might change them. We are using these hashtags to differentiate the tweets we are analysing. Basically we can obtain a better understanding of what are the most important hashtags. We even have an automatic ranking system – so the more one hashtag is used, the higher priority it gets. That is how we do the ranking and separate the normal tweets from the tweets that include the hashtag. We get a lot of data that we visualise; we built graphs that showcase the intensity. We also have a database of official channels and ISIS supporter’s accounts. Twitter and Facebook are suspending ISIS supporter’s accounts all the time so we have to keep the database of the supporters updated. This suspending is a very ineffective way to prevent ISIS because they just create a new account. And it is really helpful if they keep their accounts because we have more data and it is more helpful to detect all these activities.
And you probably know straight away who this person is whereas if someone creates a new account you do not know if it is the same person as before?
No, you can tell. Because when you join ISIS they give you a special name so it is only you who has that name. And even with their new username we can detect if it is the same account or not because they are just changing the last part like the numbers – so if it is “something fourteen” they just change it into “something fifteen” – that is how we do it.
The graph of the intensity of the activity shows when they are going to do something, they tweet more, so that can be significant. So we have to include that into platform. The other graph is about the usage of the hashtags which is the most relevant information on the platform because they start using it more to communicate between each other and that can be a very big significance that an attack might happen and might even predict a future attack if there is a big leap. And there is another graph, which is a world map that will showcase the places that ISIS has been tweeting more, for example a few days ago we found out that in Europe there is a high activity of ISIS accounts in Poland. That is really weird, so we assume that maybe they are using VPN-IP addresses from Poland instead of using their own IP. Or –there are a lot of theories about it, we do not know yet – maybe there are a lot of ISIS supporters from Poland, which is quite unlikely and would be strange to happen. So we cannot predict a hundred percent sure, we are just analysing the data that they are producing and try to visualise it to make it available for the public so that they can make precautions. And hopefully to save lives and prevent future attacks.
There is a big discussion about data retention in Germany: How does your project fit in with the arguments of supporters/opponents?
I am a big supporter of privacy and data privacy. I am against all the NSA activities that they are trying to sneak out the personal information and get everyone’s information. And that is why we are just using publicly available data. So we are not going to sneak or hack people’s accounts, we are just using the data that these terrorist groups are producing. We still support data privacy – we are good from that side.
When you say “we” – how many people are working on that DataShield project? It is part of your Master’s exam as far as I know?
Yes, it is part of my study project, so I started it on my own, but a lot of people wanted to join after the TEDx talk and then I decided to open this project so anyone can contribute in the world. During the DPC I had a team of 12 people and everyone is working on a special field and special tags. Some people are doing research, some people are building the algorithms, some people are working on the website, and some people are setting up the GitHub account for the open source project and working on the documentation for anyone who wants to join. Because I know I am driven by a personal interest after what had happened in my country, but now it is a very global thing. That is why this initiative should be globalised. Anyone can contribute because everyone is involved, it is not just about Tunisia, it is not about a Yemen friend or the US – everyone can be targeted. So opening it more makes us have more contributions and more quality.
What are your future plans for the next two years?
I would love to work on that data for security purposes because I think it has a big potential for the future. And I am also a serial entrepreneur, I started two start-ups, one was in California and I also brought it up in Tunisia, these are healthcare technology start-ups. One was called “What’s In”, which is an app for people who have allergies to improve their life. I am still interested in working on that at the same time. Maybe I will launch another company in the future, working on data for security purposes because it is a big field and I am sure that in a few years it is going to resolve a lot of issues around the world.
- White Stuff eröffnet Ladenlokal in Münster - 10. April 2016
- Premieren auf der „Zimt & Sterne“ - 10. November 2015
- Wilsberg-Promikellnern 2015: Engagement und Information für einen guten Zweck - 7. September 2015