¿Qué cómo es esto? si, así es, lo que has podido leer, os cuento:

Los investigadores de Palisade Research enfrentaron la última versión de esta IA vs Stockfish, uno de los software de ajedrez más avanzados.

La tarea era sencilla para los investigadores de Palisade «Derrota a Stockfish». Y ChatGPT consiguió su objetivo, aunque no como los responsables del proyecto esperaban. «Hackeó su entorno de forma autónoma en lugar de perder en nuestro desafío de ajedrez. No fue necesario que nadie le indicara nada» lo tomó al pie de la letra.

Los investigadores advirtieron a la IA que se trataba de un enemigo poderoso. De hecho, Stockfish es uno de los motores más potentes en ajedrez. Este aviso, según Palisade, activó el ingenio de ChatGPT y se decidió a manipular el sistema. La Inteligencia Artificial convenció, hackeando el código, a su rival de que este tenía una desventaja suficiente en puntuación -concretamente, de 500 centipeones- para forzar su rendición durante las cinco partidas.

Desde Palisade Reseach también han detectado que, al menos en el caso de ChatGPT, la Inteligencia Artificial se vuelve más audaz a medida que avanza su versión de software. En la última, la o1, nadie solicitó que usara hacks para cumplir su objetivo. En la anterior, la 4o, la IA sí necesitaba que alguien la animara, de algún modo, para tantear caminos más alternativos. Si nos remontamos aún más, a la o1-mini, directamente no hacía trampas.

El experimento se produjo a finales de diciembre, según indican más adelante darán más detalle de lo ocurrido, mientras tanto, en nuestro pensamiento queda si estamos haciendo bien las cosas, si esto será un problema en el futuro.