События недели в AI: утечка Sora, провалы Gemini и креатив от Google
AI-прорывы и вызовы: утечка видео-генератора Sora от OpenAI, критика модели Gemini от Google, креативная шахматная игра Gen Chess и значимость UX в инструментах генерации изображений.
Обзор ключевых новостей в индустрии ИИ.
Утечка видео-генератора Sora от OpenAI
В конце ноября группа художников, участвовавших в тестировании видео-генератора Sora от OpenAI, опубликовала на платформе Hugging Face интерфейс, связанный с API Sora. Это позволило пользователям генерировать 10-секундные видео с разрешением до 1080p, вводя текстовые описания. Доступ был быстро закрыт, но утечка вызвала значительный резонанс.
Художники, назвавшие себя «Sora PR Puppets», заявили, что OpenAI использует их труд без должной компенсации, превращая их в «PR-марионеток». Они обвинили компанию в том, что она привлекает их к бесплатному тестированию и продвижению продукта, не предоставляя справедливого вознаграждения. В открытом письме группа подчеркнула, что не выступает против использования AI в искусстве, но не согласна с подходом OpenAI к запуску программы и взаимодействию с художниками.
OpenAI ответила, что участие в предварительном тестировании Sora было добровольным, без обязательств по предоставлению отзывов или использованию инструмента. Компания подчеркнула, что Sora находится на стадии исследовательского предварительного просмотра, и они стремятся сбалансировать креативность с надежными мерами безопасности перед более широким запуском. OpenAI также отметила, что поддерживает художников через гранты, мероприятия и другие программы.
Этот инцидент подчеркивает напряженность между разработчиками AI и творческим сообществом, которое обеспокоено использованием их труда без должной компенсации и влиянием AI на их профессиональную деятельность. Sora, как ожидается, станет мощным инструментом для генерации видео, но его успешный запуск будет зависеть от способности OpenAI наладить конструктивное взаимодействие с художниками и обеспечить справедливые условия сотрудничества.
Artists say they leaked OpenAI's Sora video model in protest
OpenAI's text-to-video AI tool Sora leaked in protest by artists
Критика модели Gemini от Google
В начале декабря Google представила свою новую языковую модель искусственного интеллекта — Gemini. Однако, несмотря на ожидания, модель столкнулась с критикой пользователей, особенно в задачах, связанных с программированием и обработкой сложных документов. Многие отмечают, что Gemini уступает конкурентам, таким как ChatGPT от OpenAI и Claude от Anthropic, как по качеству ответов, так и по скорости работы.
Сравнительные обзоры показывают, что ChatGPT и Claude демонстрируют более высокую производительность и точность в различных задачах, включая генерацию кода и решение математических проблем. Gemini, хотя и обладает мультимодальными возможностями, такими как обработка изображений и видео, пока не достигает уровня своих конкурентов в этих областях.
Google интегрировала Gemini в свои сервисы, включая Gmail и Google Docs, что позволяет пользователям получать помощь непосредственно в этих приложениях. Однако пользователи сообщают о недостаточной точности и полезности предоставляемых ответов, что снижает общую удовлетворенность моделью.
В ответ на критику Google выпустила обновление Gemini 1.5 Flash, направленное на улучшение скорости и качества ответов, а также увеличение объема обрабатываемого текста до 32 000 токенов. Однако эти улучшения пока не привели к значительному повышению удовлетворенности пользователей.
Ситуация с Gemini подчеркивает вызовы, с которыми сталкиваются крупные технологические компании при разработке и внедрении передовых моделей искусственного интеллекта. Несмотря на значительные ресурсы и экспертизу, конкуренция на рынке AI остается жесткой, и пользователи ожидают высококачественных и надежных решений.
Gen Chess от Google — новая AI-игра
Google представила экспериментальный проект GenChess, который позволяет пользователям создавать уникальные шахматные фигуры с помощью генеративного искусственного интеллекта. Используя модель Imagen 3, пользователи могут вводить текстовые описания, такие как «суши» или «научная фантастика», и получать соответствующие наборы шахматных фигур. Например, при запросе на тему научной фантастики для белых фигур, система автоматически генерирует для черных фигур тему фэнтези.
После создания фигур пользователи могут играть в шахматы с этими уникальными наборами. Игра предлагает три уровня сложности и два варианта контроля времени. Однако некоторые пользователи отметили отсутствие продвинутых функций, таких как обзор предыдущих ходов и история захваченных фигур. По умолчанию игра отображается в изометрической проекции, но в настройках доступен вид сверху для более привычного восприятия.
Запуск GenChess совпал с началом Чемпионата мира по шахматам 2024 года, где Google выступает главным спонсором. В рамках этого события компания также анонсировала новый шахматный бот в своем AI-чатботе Gemini, который позволит пользователям вводить ходы и видеть обновленную доску по мере прогресса игры. Ожидается, что эта функция станет доступна в декабре для подписчиков Gemini Advanced.
Проект GenChess демонстрирует креативный потенциал искусственного интеллекта, открывая новые возможности для взаимодействия с классическими играми и искусства.
Эволюция генерации изображений: акцент на UX
Обсуждения популярных инструментов, включая MidJourney, Ideogram и Flux, показали, что ключевым фактором становится удобство использования. Например, Ideogram получил высокие оценки за UX, в то время как MidJourney критикуют за сложность интерфейса.
The Generator от Babson College
В октябре 2024 года Babson College официально запустил «The Generator» — междисциплинарную лабораторию искусственного интеллекта, направленную на изучение и поддержку применения AI в различных областях, включая предпринимательство, искусство, дизайн, коммуникации и инженерное дело. Лаборатория объединяет студентов, преподавателей и представителей индустрии для совместной работы над инновационными AI-проектами, способствуя развитию предпринимательского мышления и креативности.
В ноябре «The Generator» провела мероприятие «Generator AI Showcase Event and Roundtable», где студенты представили свои разработки с использованием AI, а также обсудили перспективы и вызовы, связанные с внедрением искусственного интеллекта в различных сферах.
Babson College Announces 'The Generator' Interdisciplinary Artificial Intelligence Lab