Analyse Der Twitterverse: Neue Algorithmen Analysieren Tweets
Analyse Der Twitterverse: Neue Algorithmen Analysieren Tweets

Video: Analyse Der Twitterverse: Neue Algorithmen Analysieren Tweets

Video: Tweet Visualization and Sentiment Analysis in Python - Full Tutorial 2022, Dezember
Anonim

Intelligentere Sprachprozessoren helfen Experten dabei, Millionen von Kurztextnachrichten aus dem Internet zu analysieren.

Analyse der Twitterverse: Neue Algorithmen analysieren Tweets
Analyse der Twitterverse: Neue Algorithmen analysieren Tweets

Forscher haben Twitter seit kurz nach dem Start der Website im Jahr 2006 nach Einsichten in die menschliche Verfassung durchsucht. Insgesamt bietet der Dienst eine umfangreiche Datenbank darüber, was Menschen tun, denken und fühlen. Die den Wissenschaftlern zur Verfügung stehenden Forschungsinstrumente sind jedoch äußerst unvollkommen. Keyword-Suchen geben beispielsweise viele Treffer zurück, bieten jedoch ein schlechtes Gefühl für allgemeine Trends.

Als der Informatiker James H. Martin von der University of Colorado in Boulder nach Tweets über das Erdbeben 2010 in Haiti suchte, fand er 14 Millionen. "Sie können keine Studenten einstellen, um sie alle zu lesen", sagt er. Forscher brauchen einen stärker automatisierten Ansatz.

Eine vielversprechende Methode besteht darin, Programme zu entwickeln, die Wörter in Tweets mit Wortarten wie Subjekt, Verb und Objekt kennzeichnen und diese Tags dann verwenden, um zu bestimmen, worum es bei jedem Tweet geht. Diese Methode, die als Verarbeitung in natürlicher Sprache bezeichnet wird, ist keine neue Idee, aber die Anwendung auf kurzen sozialen Text ist neu und wächst. "Das ist im Moment nur ein riesiges Gebiet", sagt Martin.

Wissenschaftler des Xerox-eigenen Palo Alto Research Center haben kürzlich ein solches Programm entwickelt. Es basiert auf Textprozessoren, sogenannten Parsern, die normalerweise in Nachrichtenartikeln getestet werden. Parser können zwischen Wörtern und Interpunktion unterscheiden, Wortarten kennzeichnen und die grammatikalische Struktur eines Satzes analysieren. "Auf Twitter machen sie das nicht so gut", sagt Kyle Dent, einer der Palo Alto-Forscher. Er und sein Co-Autor haben Hunderte von Regeln geschrieben, um Hash-Tags, wiederholte Buchstaben (wie in „pleaaaaaase“) und andere sprachliche Merkmale zu berücksichtigen, die im Wall Street Journal möglicherweise nicht üblich sind. Sie werden ihre Arbeit am 8. August auf einer Konferenz der Association for Advancement of Artificial Intelligence in San Francisco vorstellen.

Dent und seine Kollegen versuchten auch, mit ihrem Programm zwischen rhetorischen Fragen und solchen zu unterscheiden, die eine Antwort erfordern. Unternehmen könnten ein solches Programm verwenden, um herauszufinden, was die Leute nach ihren Produkten fragen. In einer kürzlich durchgeführten Studie klassifizierte ihr Programm 68 Prozent von 2.304 Tweets korrekt. "Für ein brandneues Feld klingt das nach einem anständigen ersten Versuch", sagt Jeffrey Ellen vom Space and Naval Warfare Systems Command, das der US-Marine Nachrichtentechnologie zur Verfügung stellt.

Obwohl die Twitter-Trawling-Technologie noch nicht einsatzbereit ist, "ist sie ziemlich schnell da", sagt Martin. Sobald es reif ist, sollten Forscher Zugang zu einem beispiellosen Datenbestand über menschliches Verhalten haben. Zum ersten Mal in der Geschichte wird "Wasserkühlergespräch" aufgezeichnet und öffentlich zugänglich gemacht, sagt Ellen. "Vor hundert Jahren wussten wir einfach nicht, was alle dachten."

Beliebt nach Thema