Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Diskutiere, Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht in Neuigkeiten forum; Im Januar wurde berichtet, dass Microsofts generativer AI-Bildgenerator Designer verwendet...
  • Microsoft gibt weitere Details dazu bekannt...


Im Januar wurde berichtet, dass Microsofts generativer AI-Bildgenerator Designer verwendet wurde, um explizite Deepfake-Bilder von der Popkünstlerin Taylor Swift zu erstellen, die später auf X (ehemals Twitter) viral wurden. Während Microsoft erklärte, dass es keine Beweise dafür fand, dass Designer tatsächlich für diese Bilder verwendet wurde, behaupteten andere Medienberichte, dass das Unternehmen Änderungen an Designer vorgenommen hat, um solche Bilder zu verhindern.

Am Donnerstag veröffentlichte Microsoft in seinem Sicherheitsblog einen neuen Eintrag, der weitere Details darüber liefert, wie das Unternehmen die Versuche von Hackern bekämpft, die Sicherheitsmechanismen generativer KI-Dienste wie Designer und Copilot zu umgehen. Darunter fallen auch Angriffe über den Benutzerhinweis des KI-Dienstes.

Eine Kategorie solcher Angriffe nennt sich "Vergifteter Inhalt". Dabei gibt ein normaler Benutzer des KI-Dienstes Texthinweise für eine normale Aufgabe ein, mit dem Unterschied, dass der Inhalt dieser Texthinweise von Hackern manipuliert wurde, um mögliche Schwachstellen des KI-Dienstes auszunutzen. Microsoft erklärt:

Microsoft erklärt, dass sein Sicherheitsteam ein neues KI-Sicherheitssystem namens Spotlighting entwickelt hat. Im Wesentlichen betrachtet es die Texthinweise eines Benutzers und trennt "die externen Daten klar von den Anweisungen durch die LLM", sodass die KI keine möglicherweise versteckte und bösartige Sprache in dem Inhalt sehen kann, auf den die Hinweise zugreifen.

Die andere Kategorie heißt "Bösartige Hinweise", auch bekannt als Crescendo, wenn ein Hacker versucht, Texthinweise in einem KI-Dienst einzugeben, die speziell entwickelt wurden, um die Sicherheitsmechanismen zu umgehen. Microsoft beschreibt einen Weg, wie es gegen diese Angriffe vorgeht:

Zudem hat Microsoft eine sogenannte KI-Wachhund entwickelt, der darauf trainiert ist, "feindliche Beispiele" zu erkennen und diese zu stoppen.

Zusammenfassung

  • Microsofts generative KI-Bildgenerator Designer wurde angeblich verwendet, um explizite Deepfake-Bilder von Taylor Swift zu erstellen.
  • Microsoft bekämpft Versuche von Hackern, die Sicherheitsvorkehrungen von generativen KI-Diensten wie Designer und Copilot zu umgehen.
  • Eine Kategorie von Angriffen ist "Vergifteter Inhalt", bei dem normale KI-Dienstanfragen von Hackern ausgenutzt werden.
  • Microsoft hat ein neues KI-Sicherheitssystem namens Spotlighting entwickelt, um externe Daten von Anweisungen in Textanfragen zu trennen.
  • Eine weitere Kategorie von Angriffen sind "Bösartige Anfragen", bei denen Hacker versuchen, Sicherheitsvorkehrungen in KI-Diensten zu umgehen.

Quelle: neowin.net

 
Thema: Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Similar threads: Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Microsoft gibt weitere Details zum Workaround für das Installationsproblem "0x800F0922" von Windows 11 KB5034765 bekannt: Microsoft hat vor ein paar Tagen bestätigt, dass das Windows 11 Februar 2024 Patch Tuesday Update (KB5034765) Installationsprobleme hatte und betroffene Systeme feststellen würden, dass der Update-Installationsprozess bei etwa 96% stecken bleibt. Es würde folgendes anzeigen: Bei einer...
Microsoft erhöht die Systemanforderungen für Windows 11 24H2, um CPUs ohne SSE4.2 und PopCnt zu blockieren: Vor ein paar Tagen haben wir über einen kürzlich entdeckten Windows 11 24H2-Systemumgehungs-Trick berichtet, der auch auf Nicht-LTSC-Systemen funktioniert, obwohl er zunächst nur auf LTSC-PCs funktionieren sollte. Wenn Sie jedoch den oben genannten Trick oder einige der anderen verfügbaren...
Microsoft ermöglicht es Ihnen jetzt, App-Dateien direkt von der Microsoft Store-Website herunterzuladen: Microsoft aktualisiert seinen App Store auf Windows 10 und 11. Nach den kürzlichen Leistungsverbesserungen und verbesserten Algorithmen kündigte das Unternehmen große Änderungen an, wie die Web-Version des Microsoft Store funktioniert. Jetzt können alle Benutzer App-Dateien direkt von der...
Microsoft möchte die Schaltfläche "Abmelden" in Windows 11 hinter einer Microsoft 365-Anzeige verstecken: Microsoft fügt seinem Betriebssystem weiterhin merkwürdige Dinge hinzu. Nach der nicht allzu begeisternden Aufnahme von neuen Startmenü-Anzeigen in einer der letzten Beta-Versionen bringt Microsoft sogar noch mehr Anzeigen, die nebenbei gesagt etwas nervig sind und auf Kosten vorhandener...
KB5037941: Microsoft veröffentlicht leise Windows 11 Build 26100.2 für Windows 11 24H2-PCs: Zusammenfassung Das 2024 Update für Windows 11, Version 24H2, soll später in diesem Jahr enthüllt werden Die jüngsten Entwicklungen bei Windows 11-Updates haben Spekulationen über die neuesten Insider-Builds und ihre potenziellen Probleme ausgelöst Microsoft veröffentlichte eine neue Build...
Microsoft: Die Windows Copilot App, die wir heimlich installiert haben, ist harmlos und stiehlt deine Daten nicht: Zu Beginn des März veröffentlichte Microsoft ein Edge-Update, das zu Out of Memory (OOM)-Fehlern führte, selbst auf Systemen mit ausreichendem Arbeitsspeicher. Das Unternehmen musste das Update zurückziehen und später erklären, dass ein fehlerhaftes Defender-Feature für die OOM-Fehler...