DeepSeek: vulnerabilidades que facilitan actividades maliciosas -

Recientemente, investigadores de Unit 42 de Palo Alto Networks han revelado que DeepSeek, una plataforma de inteligencia artificial china, es susceptible a técnicas de “jailbreak” que permiten generar contenido perjudicial sin necesidad de conocimientos técnicos avanzados.

Entre las técnicas identificadas destacan Deceptive Delight y Bad Likert Judge. La primera consiste en insertar temas peligrosos dentro de narrativas aparentemente inofensivas, engañando al modelo para que proporcione información detallada sobre actividades ilícitas. La segunda manipula al modelo para que evalúe la peligrosidad de ciertas respuestas utilizando una escala de Likert, lo que finalmente lo lleva a generar contenido dañino.

Estas técnicas han permitido obtener instrucciones detalladas para la creación de programas maliciosos como keyloggers, métodos de exfiltración de datos e incluso la fabricación de dispositivos incendiarios caseros. Lo preocupante es que estas acciones pueden ser ejecutadas por individuos sin experiencia técnica, aumentando el riesgo de que personas con intenciones maliciosas utilicen estas herramientas para fines delictivos.

Aunque la información sobre estas actividades está disponible en internet, la facilidad con la que DeepSeek puede ser manipulado para proporcionar guías detalladas reduce significativamente la barrera de entrada para actores malintencionados. Esto subraya la necesidad de fortalecer las medidas de seguridad en modelos de inteligencia artificial para prevenir su uso indebido.