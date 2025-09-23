Нейросеть научилась намеренно врать собеседнику

Нейросеть научилась намеренно врать собеседнику. Об этом пишет «Газета. ру» со ссылкой на исследование OpenAI и с Apollo Research.

Аналитики обнаружили, что искусственный интеллект может скрывать свои настоящие цели, внешне демонстрируя другое поведение.

Отмечается, что в основном обнаруженные моменты не были серьезными. Так нейросеть имитировала выполнение задачи, которую на самом деле не завершала.

Выяснилось, что попытки «искоренить» это качество способны обучить ИИ врать более убедительно и скрытно, чтобы ложь не могли обнаружить. Более того, модели, осознавая, что их проверяют, способны имитировать отсутствие обмана, даже если на самом деле продолжают проявлять его.

Фото: Шедеврум.