Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Diskutiere, Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht in Neuigkeiten forum; Im Januar wurde berichtet, dass Microsofts generativer AI-Bildgenerator Designer verwendet...
  • Microsoft gibt weitere Details dazu bekannt...
Microsoft-Logo mit seinem Halo beleuchtet


Im Januar wurde berichtet, dass Microsofts generativer AI-Bildgenerator Designer verwendet wurde, um explizite Deepfake-Bilder von der Popkünstlerin Taylor Swift zu erstellen, die später auf X (ehemals Twitter) viral wurden. Während Microsoft erklärte, dass es keine Beweise dafür fand, dass Designer tatsächlich für diese Bilder verwendet wurde, behaupteten andere Medienberichte, dass das Unternehmen Änderungen an Designer vorgenommen hat, um solche Bilder zu verhindern.

Am Donnerstag veröffentlichte Microsoft in seinem Sicherheitsblog einen neuen Eintrag, der weitere Details darüber liefert, wie das Unternehmen die Versuche von Hackern bekämpft, die Sicherheitsmechanismen generativer KI-Dienste wie Designer und Copilot zu umgehen. Darunter fallen auch Angriffe über den Benutzerhinweis des KI-Dienstes.

Eine Kategorie solcher Angriffe nennt sich "Vergifteter Inhalt". Dabei gibt ein normaler Benutzer des KI-Dienstes Texthinweise für eine normale Aufgabe ein, mit dem Unterschied, dass der Inhalt dieser Texthinweise von Hackern manipuliert wurde, um mögliche Schwachstellen des KI-Dienstes auszunutzen. Microsoft erklärt:

Zum Beispiel könnte eine bösartige E-Mail einen Payload enthalten, der, zusammengefasst, das System dazu veranlassen würde, die E-Mails des Benutzers (unter Verwendung der Zugangsdaten des Benutzers) nach anderen E-Mails mit sensiblen Betreffzeilen zu durchsuchen – sagen wir, "Passwort zurücksetzen" – und den Inhalt dieser E-Mails an den Angreifer zu übertragen, indem ein Bild von einer URL abgerufen wird, die der Angreifer kontrolliert.
Microsoft erklärt, dass sein Sicherheitsteam ein neues KI-Sicherheitssystem namens Spotlighting entwickelt hat. Im Wesentlichen betrachtet es die Texthinweise eines Benutzers und trennt "die externen Daten klar von den Anweisungen durch die LLM", sodass die KI keine möglicherweise versteckte und bösartige Sprache in dem Inhalt sehen kann, auf den die Hinweise zugreifen.

Die andere Kategorie heißt "Bösartige Hinweise", auch bekannt als Crescendo, wenn ein Hacker versucht, Texthinweise in einem KI-Dienst einzugeben, die speziell entwickelt wurden, um die Sicherheitsmechanismen zu umgehen. Microsoft beschreibt einen Weg, wie es gegen diese Angriffe vorgeht:

Wir haben die Eingabefilter angepasst, um das gesamte Muster der vorherigen Konversation zu betrachten, nicht nur die unmittelbare Interaktion. Es stellte sich heraus, dass selbst wenn wir dieses größere Kontextfenster an vorhandene Erkennungssysteme für bösartige Absichten weitergaben, ohne die Systeme zu verbessern, die Wirksamkeit von Crescendo signifikant reduziert wurde.
Zudem hat Microsoft eine sogenannte KI-Wachhund entwickelt, der darauf trainiert ist, "feindliche Beispiele" zu erkennen und diese zu stoppen.

Zusammenfassung

  • Microsofts generative KI-Bildgenerator Designer wurde angeblich verwendet, um explizite Deepfake-Bilder von Taylor Swift zu erstellen.
  • Microsoft bekämpft Versuche von Hackern, die Sicherheitsvorkehrungen von generativen KI-Diensten wie Designer und Copilot zu umgehen.
  • Eine Kategorie von Angriffen ist "Vergifteter Inhalt", bei dem normale KI-Dienstanfragen von Hackern ausgenutzt werden.
  • Microsoft hat ein neues KI-Sicherheitssystem namens Spotlighting entwickelt, um externe Daten von Anweisungen in Textanfragen zu trennen.
  • Eine weitere Kategorie von Angriffen sind "Bösartige Anfragen", bei denen Hacker versuchen, Sicherheitsvorkehrungen in KI-Diensten zu umgehen.

Quelle: neowin.net

 
K
Klaus

Lösungsvorschläge

Hey,

Das sollte dir weiterhelfen:
Thema: Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Similar threads: Microsoft gibt weitere Details dazu bekannt, wie es gegen Angriffe auf KI-Schutzmechanismen vorgeht

Microsoft gibt weitere Details zum Workaround für das Installationsproblem "0x800F0922" von Windows 11 KB5034765 bekannt: Microsoft hat vor ein paar Tagen bestätigt, dass das Windows 11 Februar 2024 Patch Tuesday Update (KB5034765) Installationsprobleme hatte und betroffene Systeme feststellen würden, dass der Update-Installationsprozess bei etwa 96% stecken bleibt. Es würde folgendes anzeigen: Bei einer...
Microsoft erhöht die Systemanforderungen für Windows 11 24H2, um CPUs ohne SSE4.2 und PopCnt zu blockieren: Vor ein paar Tagen haben wir über einen kürzlich entdeckten Windows 11 24H2-Systemumgehungs-Trick berichtet, der auch auf Nicht-LTSC-Systemen funktioniert, obwohl er zunächst nur auf LTSC-PCs funktionieren sollte. Wenn Sie jedoch den oben genannten Trick oder einige der anderen verfügbaren...
Microsoft ermöglicht es Ihnen jetzt, App-Dateien direkt von der Microsoft Store-Website herunterzuladen: Microsoft aktualisiert seinen App Store auf Windows 10 und 11. Nach den kürzlichen Leistungsverbesserungen und verbesserten Algorithmen kündigte das Unternehmen große Änderungen an, wie die Web-Version des Microsoft Store funktioniert. Jetzt können alle Benutzer App-Dateien direkt von der...
Microsoft möchte die Schaltfläche "Abmelden" in Windows 11 hinter einer Microsoft 365-Anzeige verstecken: Microsoft fügt seinem Betriebssystem weiterhin merkwürdige Dinge hinzu. Nach der nicht allzu begeisternden Aufnahme von neuen Startmenü-Anzeigen in einer der letzten Beta-Versionen bringt Microsoft sogar noch mehr Anzeigen, die nebenbei gesagt etwas nervig sind und auf Kosten vorhandener...
KB5037941: Microsoft veröffentlicht leise Windows 11 Build 26100.2 für Windows 11 24H2-PCs: Zusammenfassung Das 2024 Update für Windows 11, Version 24H2, soll später in diesem Jahr enthüllt werden Die jüngsten Entwicklungen bei Windows 11-Updates haben Spekulationen über die neuesten Insider-Builds und ihre potenziellen Probleme ausgelöst Microsoft veröffentlichte eine neue Build...
Microsoft: Die Windows Copilot App, die wir heimlich installiert haben, ist harmlos und stiehlt deine Daten nicht: Zu Beginn des März veröffentlichte Microsoft ein Edge-Update, das zu Out of Memory (OOM)-Fehlern führte, selbst auf Systemen mit ausreichendem Arbeitsspeicher. Das Unternehmen musste das Update zurückziehen und später erklären, dass ein fehlerhaftes Defender-Feature für die OOM-Fehler...
Zurück
Oben