2 reacties
Avatar van User
Avatar van The Curated Codex

Needs approval biedt geen garanties. Het overkwam zelfs de head of AI safety van Meta… Ondanks al haar instructies en guardrails begon de agent haar emails te wissen.

Avatar van her/ai

Hi, helemaal met je eens. Het blijft nieuwe technologie! Claude CoWork is wel het veiligst, gezien het een virtuele machine is. Wat bij de head of security van Meta gebeurde was door haar OpenClaw - dat is een 'actief' AI die acties zelfstandig kan uitvoeren zonder toestemming. Bij Claude CoWork moet je wel elke keer toestemming geven en moet je de AI in actie zetten - het is meestal passieve AI.