Поддержать команду Зеркала
Беларусы на войне
  1. Беларуска рассказала, что получила «повестку за неуборку снега» вокруг авто
  2. Золушка современной Беларуси. Как логопед из Шклова оказалась на верхушке империи развлечений, зарабатывающей миллионы
  3. Беларуска открыла визу и отправилась в поездку, но не учла важную деталь, из-за которой могла остаться на пару часов на «нейтралке»
  4. А вы из Западной или Восточной Беларуси? Рассказываем, что жители этих регионов раньше думали друг о друге (много неприятного)
  5. Пара сняла «бабушатник» и преобразила его за 700 долларов. Хозяева увидели результат и подняли аренду
  6. Мария Колесникова ответила, поддерживает ли она по-прежнему Светлану Тихановскую
  7. «Россия де-факто аннексировала Беларусь». Эксперты о том, зачем беларусские воздушные шары нарушают воздушное пространство Литвы и Польши
  8. Лукашенко дал прогноз на конец зимы. Синоптики с ним не согласны
  9. В Витебске десятки домов остались без отопления ночью в морозы. Аварию устранили к утру
  10. Известный беларусский бизнесмен просил Польшу снять с него запрет на въезд в Шенгенскую зону. Ему отказали
  11. «Мнения разделились». Как европейские политики отреагировали на призыв Колесниковой начать диалог с Лукашенко


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.