Knowledge Science - Alles über KI, ML und NLP

Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen

March 12, 2024 Sigurd Schacht, Carsten Lanquillon Season 1 Episode 118
Knowledge Science - Alles über KI, ML und NLP
Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen
Show Notes

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus. 

Eine spannende Sendung. Hören Sie rein.

Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the Show.