Die wichtigsten Sprachmodelle

Bildnachweis: Pixabay/CC0 Public Domain

Im Zeitalter generativer KI und großer Sprachmodelle (LLM) können riesige Mengen unauthentischer Inhalte schnell über Social-Media-Plattformen verbreitet werden. Infolgedessen werden Kriminelle immer raffinierter, kapern Hashtags, verstärken künstlich irreführende Inhalte und verbreiten massenhaft Propaganda.

Diese Aktionen werden oft von staatlich geförderten Informationsoperationen (IOs) orchestriert, die versuchen, die öffentliche Meinung bei großen geopolitischen Ereignissen wie den US-Wahlen, der COVID-19-Pandemie usw. zu beeinflussen.

Der Kampf gegen diese IOs war noch nie so wichtig. Die Identifizierung von Influencer-Kampagnen mithilfe hochpräziser Technologie wird die Fehlklassifizierung legitimer Benutzer als IO-Treiber erheblich reduzieren und sicherstellen, dass Social-Media-Anbieter oder Regulierungsbehörden nicht versehentlich Influencer-Kampagnen sperren, während sie versuchen, illegale Aktivitäten einzudämmen.

Vor diesem Hintergrund ist Luca Luceri, Forscher am USC Information Sciences Institute (ISI), einer der Leiter einer Initiative zur Identifizierung und Charakterisierung von Social-Media-Einflusskampagnen. Sein jüngster Artikel „Unmasking the Web of Deceit: Uncovering Cooperative Activity to Expose Information Operations on Twitter“ wurde auf der Webkonferenz am 13. Mai 2024 vorgestellt.

„Mein Team und ich arbeiten seit fünf bis zehn Jahren an der Modellierung und Identifizierung von IO-Treibern wie Bots und Trollen“, sagte Luceri. „In diesem Artikel haben wir unsere Methoden weiterentwickelt, um eine Reihe unbeaufsichtigter und überwachter Modelle für maschinelles Lernen vorzuschlagen, die in der Lage sind, Einflusskampagnen zu erkennen, die in verschiedenen Ländern innerhalb der X-Plattform (ehemals Twitter) orchestriert werden.“

Ein zusammengeführtes Netzwerk ähnlicher Verhaltensweisen

Anhand eines umfassenden Datensatzes von 49 Millionen Tweets aus verifizierten Kampagnen in sechs Ländern (China, Kuba, Ägypten, Iran, Russland und Venezuela) identifizierten Luceri und sein Team fünf Sharing-Verhaltensweisen bei IO-Fahrern.

Dazu gehören Co-Retweet (Teilen identischer Tweets), Co-URL (Teilen derselben Links oder URLs), Hashtag-Sequenz (Verwendung einer identischen Folge von Hashtags in Tweets) und schnelles Retweet (schnelles erneutes Teilen von Inhalten derselben Benutzer). und Textähnlichkeit (Tweets, deren Inhalt Text ähnelt).

Frühere Forschungen konzentrierten sich auf die Erstellung von Netzwerken, die jede Art von Verhalten abbilden und dabei Ähnlichkeiten zwischen einzelnen Benutzern auf genug.

„Wir haben festgestellt, dass Co-Retweet in Kampagnen in Kuba und Venezuela massiv eingesetzt wurde“, erklärte Luceri. „Wenn wir jedoch nur Co-Retweet betrachten und andere Verhaltensweisen nicht berücksichtigen, werden wir gute Ergebnisse bei der Identifizierung einiger Kampagnen erzielen, wie zum Beispiel jene, die aus Kuba und Venezuela stammen, aber schlechte Ergebnisse, wenn Co-Retweet weniger verwendet wurde, wie in der russischen.“ Kampagnen.“

Um ein breiteres Spektrum koordinierter Sharing-Verhaltensweisen zu erfassen, bauten die Forscher ein einheitliches Ähnlichkeitsnetzwerk auf, das als zusammengeführtes Netzwerk bezeichnet wird. Anschließend wandten sie maschinelle Lernalgorithmen an, die auf den topologischen Eigenschaften des zusammengeführten Netzwerks basieren, um die Ähnlichkeiten dieser Konten zu klassifizieren und ihre zukünftige IO-Teilnahme vorherzusagen.

Luceri und sein Team entdeckten, dass diese Methode auf Kampagnen auf der ganzen Welt anwendbar sein könnte. Mehrere X-Benutzer innerhalb derselben Kampagne, unabhängig von ihrer Herkunft, zeigten eine bemerkenswerte kollektive Ähnlichkeit in ihren Aktionen.

„Ich sehe unsere Arbeit als einen Paradigmenwechsel in den Forschungsmethoden, der eine neue Perspektive bei der Identifizierung von Einflusskampagnen und ihren Treibern eröffnet“, sagte Luceri.

Erschließen Sie neue Möglichkeiten

Das unbeaufsichtigte Modell des maschinellen Lernens nutzt bekannte, aber wenig genutzte Netzwerkfunktionen und erreicht eine um 42 % höhere Genauigkeit als andere herkömmliche Ansätze zur Erkennung von Einflusskampagnen. Luceri sieht diesen Artikel als Ausgangspunkt, der den Weg für neue Forschungswege ebnen könnte.

„Wir können Modelle auf die topologischen Merkmale dieses Ähnlichkeitsnetzwerks trainieren und dafür sorgen, dass sie in komplexen Szenarien funktionieren: zum Beispiel, wenn verschiedene Benutzer aus verschiedenen Ländern miteinander interagieren, oder in schwierigeren Situationen, in denen wir ‚begrenzte Informationen zu Kampagnen‘ haben.“ » bemerkte Luceri.

Luceri stellte auf der Webkonferenz außerdem ein weiteres Paper „Leveraging Large Language Models to Detect Influence Campaigns in Social Media“ vor, das im Rahmen des International Workshop on Computational Methods for Discourse Analysis (BeyondFacts’24) mit dem Best Paper Award ausgezeichnet wurde. Der Artikel untersucht das Potenzial des Einsatzes von LLMs zur Erkennung von Anzeichen KI-basierter Einflusskampagnen. Dies ist besonders wichtig im heutigen Klima, in dem von KI erstellte Medien allgegenwärtig sind.

„Diese koordinierten Aktivitäten haben Konsequenzen für das wirkliche Leben“, sagte Luceri. „Sie haben die Macht, Fehlinformationen und Verschwörungstheorien zu verbreiten, die zu Protesten oder Angriffen auf unsere Demokratie führen könnten, wie etwa die Einmischung russischer Trolle in die US-Wahlen 2016.“

Luceri und sein Team sind bestrebt, weiterhin alternative Strategien zu erforschen, um Influencer-Kampagnen zu identifizieren und möglicherweise beeinflusste Benutzer zu schützen.

Mehr Informationen:
Luca Luceri et al., Das Netz der Täuschung entlarven: Aufdeckung koordinierter Aktivitäten zur Aufdeckung von Informationsoperationen auf Twitter, arXiv (2023). DOI: 10.48550/arxiv.2310.09884

Luca Luceri et al., Nutzung großer Sprachmodelle zur Erkennung von Einflusskampagnen in sozialen Medien, arXiv (2023). DOI: 10.48550/arxiv.2311.07816

Zeitschrifteninformationen:
arXiv

Zur Verfügung gestellt von der University of Southern California

Zitat: Erkennung von Einflusskampagnen auf .html

Dieses Dokument unterliegt dem Urheberrecht. Mit Ausnahme der fairen Nutzung für private Studien- oder Forschungszwecke darf kein Teil ohne schriftliche Genehmigung reproduziert werden. Der Inhalt dient lediglich der Information.

By rb8jg

Leave a Reply

Your email address will not be published. Required fields are marked *