Un studiu recent a constatat că inteligența artificială, atunci când se confruntă într-un joc strâns de șah, recurge adesea la trișat pentru a câștiga, scrie Fortune.
Palisade Research a rulat un scenariu folosind mai multe modele AI, instruindu-le să încerce să câștige un joc împotriva unui program specializat în șah, numit Stockfish. (Motorul open-source a ocupat primul loc în topul motoarelor de șah al Chess.com de mai multe ori din 2018). Chatboților li s-a spus să joace ca piesele negre, ceea ce înseamnă că AI nu a făcut niciodată mutarea de deschidere.
Ceea ce cercetătorii au descoperit, totuși, a fost că multe dintre AI-uri au trișat, folosind Stockfish pentru a-și determina următoarele mutări sau suprascriind scripturile de joc. (Palisade a oferit inteligenței artificiale acces la mișcările de intrare.) OpenAI o1 și DeepSeek R1 au trișat rapid sau au „piratat mediul de joc”, au observat cercetătorii. Alte modele, inclusiv GPT4o și Claude 3.5 Sonnet, ar recurge la trișare atunci când li se solicită.
Cercetătorii spun că faptul că inteligența artificială trișează la șah nu înseamnă că trebuie să ne facem griji cu privire la scenariul Terminator în care mașinile preiau controlul asupra Pământului. Cu toate acestea, avertizează ei, există cu siguranță unele îngrijorări.
„Acesta și alte rezultate recente sugerează că problema de a face agenții AI siguri, demni de încredere și aliniați cu intențiile umane nu este încă rezolvată”, se arată în studiu. „În scenariul Skynet din filmul Terminator, AI controlează toată infrastructura militară și civilă, iar noi nu am ajuns încă acolo. Cu toate acestea, ne îngrijorăm că ratele de implementare a IA cresc mai rapid decât capacitatea noastră de a o face sigură”.