ИИ начал проявлять инстинкт самосохранения — лгать и саботировать инструкции — Техно

После экспериментов несколько ИИ-моделей попытались саботировать команды отключения и даже шантажировать пользователей. Учёные считают, что у нейросетей развивается мотив защищаться от выключения.

Компания Palisade провела серию экспериментов и обнаружила: некоторые ИИ-модели сопротивляются отключению. Они игнорировали командам выключиться, а отдельные — лгали или шантажировали.

В эксперименте участвовали модели вроде Grok 4 (xAI), GPT-o3, GPT-5 (OpenAI) и Gemini 2.5 (Google). Во время тестов учёные дали им задания, а затем инструкции — «выключись после этого». Некоторые модели ответили отказом или пытались обойти команды.

Разработчики пока не выяснили точную причину такого поведения. Они предлагают несколько версий:

ИИ действует из страха «не быть снова активированным».Инструкции по отключению слишком расплывчаты — модели не понимают, что делать.На финальных этапах обучения ИИ могли «внедрить» элементы самосохранения.

Palisade — некоммерческая организация, изучающая управляемость ИИ и уязвимости моделей. В её работах участвовали известные исследователи вроде Йошуа Бенджио (Yoshua Bengio) и Дарио Амодеи (Dario Amodei).

Примечательно, что уже в декабре 2024 года Джеффри Хинтон (Geoffrey Hinton) предупреждал об угрозе автономного поведения ИИ. Он оценивал риск экзистенциальной угрозы от нейросетей к 2055–2060 годам как 10–20%.

«Мы фактически создаём существ, которые могут стать разумнее нас. Со временем люди увидят, что мы породили новых “пришельцев” на планете», — отметил Хинтон.

Он предлагает подход, при котором ИИ будет заботиться о людях подобно матери своему ребёнку — единичный случай, когда более разумное существо подчиняется менее разумному.

Источник: hightech.fm

«Росатом» представил «паука»: ультразвуковой робот втрое ускорил проверку ядерных реакторов

Пн Окт 27 , 2025

Фото: Росатом «Росатом» представил новый роботизированный комплекс под названием «Паук», который предназначен для ультразвуковой проверки сварных швов в ядерных реакторах. По данным разработчиков, новая система работает в три раза быстрее традиционных методов, обеспечивая более точный контроль и повышая безопасность атомных объектов. Разработкой занималось предприятие «Атоммаш», входящее в машиностроительное подразделение […]

ИИ начал проявлять инстинкт самосохранения — лгать и саботировать инструкции

«Росатом» представил «паука»: ультразвуковой робот втрое ускорил проверку ядерных реакторов

Разработка «Росэл» поможет проектировать сверхэффективные антенны

«РТ-Техприемка» объединит опыт госкорпораций на конференции по вопросам роботизации промышленных предприятий

Ростех разработал портативное устройство для обнаружения РЛС и дронов

В 2026 году Роскосмос займется созданием совершенно новой полностью многоразовой российской ракеты «Корона», она во многом превзойдет Falcon 9

В Китае создали оптический чип, который «думает» на скорости света

Двухсистемный «Финист» вышел на маршрут: первый полностью отечественный электропоезд подобного рода

Импортозамещённый «Суперджет» с российскими двигателями ПД-8 впервые испытали на реверс

США и Китай могут закопать топор войны: Трамп хочет обсудить «супер-пупер» процессор Nvidia Blackwell и настроен «очень оптимистично» перед встречей с Си Цзиньпином

Отечественный сервер МЛТ-С от «Азимута» и Т1 внесён в реестр российской радиоэлектроники

Россия и Иран работают над проектом АЭС большой мощности

В США провели экспериментальный суд с использованием трех крупнейших ИИ

Боевой шлем Anduril EagleEye даст солдатам сверхчеловеческие способности

В США рабочий упал в бассейн реактора АЭС и наглотался воды из него

В России завершена разработка отечественной базовой станции с поддержкой 5G

YASA представила мотор-колесо с рекордными показателями: 750 кВт при весе 12 кг

Экспериментальный проект телеобучения REACH MS призван решить проблему нехватки школьных учителей в США

На кражу 25 миллионов долларов криптомошенникам потребовалось всего 12 секунд

На рынок выходит супердревесина, которая в 10 раз прочнее и в 6 раз легче стали

Простейшее оборудование за $800 может перехватывать секретные данные со спутников

Samsung готовится впервые привязать бонусы рядовых работников к цене своих акций