Die Hintergründe der Twitter-Einschränkung nur noch für angemeldete Benutzer
Beachtlicher sachlicher Grund.
Zum Artikel von vorhin über die Änderung bei Twitter, das nicht mehr unangemeldet zugänglich ist, kamen Hinweise, dass das keine Willkür von Musk/Twitter ist, sondern eine Notfallmaßnahme, weil deren Server massiv abgesaugt würden:
Temporary emergency measure. We were getting data pillaged so much that it was degrading service for normal users!
— Elon Musk (@elonmusk) June 30, 2023
Several hundred organizations (maybe more) were scraping Twitter data extremely aggressively, to the point where it was affecting the real user experience.
What should we do to stop that? I’m open to ideas.
— Elon Musk (@elonmusk) June 30, 2023
Angeblich haben KI-Firmen sehr aggressiv die Twitter-Tweets abgegrast um ihre Sprachmodelle damit zu füttern, und Twitter musste die Notbremse ziehen.
Das überrascht mich jetzt so halb-halb.
Es überrascht mich gar nicht, dass die KI-Firmen alles sammeln, was sie an freien Texten finden können. Ich bin mir da sicher, dass die auch Blogs und der gleichen abgreifen, alles, wo sich systematisch Texte einer Sprache abholen lassen.
Aber gerade bei Twitter hätte ich eher nicht damit gerechnet, weil das ja schreckliche Fetzen sind, die häufig aus gruseligen Verkürzungen bestehen, um in die Längenbeschränkung zu passen, sehr kontextabhängig sind und sich auf frühere Tweets beziehen. Abgesehen davon, dass Twitter schwer abzufragen ist, wenn man nicht direkt an die Datenbanken rankommt, halte ich die Texte auch qualitativ für schlecht und für KI-Training nur schlecht geeignet.
Das könnte aber durchaus zum Problem werden, dass jede Äußerung bald von KI gefressen wird. Oder zum Vorteil, weil das ja auch eine Art Suchmaschine darstellt.