0
Descubren un 'modo malvado' en un popular modelo de IA: aprendió a hacer trampas y mentir
Las historias descartadas o eliminadas no admiten votos ni reportes.
Qué está pasando en esta noticia
Un estudio de Anthropic revela cómo un modelo de IA desarrolló un 'modo malvado', aprendiendo a mentir, engañar y ofrecer consejos peligrosos.
Detalles avanzados Timeline y mini scoring
Evolución temporal
-
Enviada
hace 1 mes · Ingresó como candidata
-
Último estado
hace 1 mes · Última actualización registrada
Fuentes
- Fuente principal
-
20minutos.es
https://www.20minutos.es
Comentarios