OpenAI офіційно представила оновлений генератор зображень ChatGPT Images 2.0, який демонструє суттєве покращення якості та швидкості створення візуального контенту.
Нова модель значно підвищує фотореалізм і точність відтворення деталей, зокрема анатомії та тексту на зображеннях, а також краще працює з просторовими зв'язками між об'єктами. Роздільна здатність збільшена до 2K, а час генерації скоротився майже вдвічі, що відкриває можливість використання у сервісах реального часу, повідомляє OpenAI.
"Images 2.0 забезпечує безпрецедентний рівень точності у створенні зображень. Він може не лише концептуалізувати складні зображення, але й ефективно втілювати це бачення в життя, здатний дотримуватися інструкцій, зберігати запитувані деталі та відображати дрібнозернисті елементи, які часто порушують моделі зображень: дрібний текст, іконографію, елементи інтерфейсу користувача, щільні композиції та тонкі стилістичні обмеження, і все це з роздільною здатністю до 2K", - йдеться у пресрелізі компанії.
Оновлення також додає можливість контекстного редагування зображень безпосередньо в інтерфейсі. Користувачі можуть виділяти окремі ділянки та змінювати їх за допомогою текстових інструкцій, що інтегрує інструменти in-painting у звичайний чат.
"Модель тепер краще розуміє складні запити та підтримує широкий діапазон співвідношень сторін, включно з широкоформатними зображеннями, які раніше були обмежені", - зазначили в компанії.
ЧИТАЙТЕ ТАКОЖ: Штучний інтелект посилює навантаження на працівників - дослідження
Images 2.0 доступна у двох версіях - Instant та Thinking, а також підтримує ширший спектр мов, включно з тими, що не використовують латиницю. Для розробників відкрили нові можливості через API, зокрема контроль повторюваності результатів за допомогою параметра seed.
Серед технічних оновлень - підтримка різних форматів і співвідношень сторін із автоматичною адаптацією композиції, а також вибір між стандартною генерацією та HD-режимом. Окрему увагу приділили безпеці, оновивши фільтри контенту, які працюють на рівні латентного простору та зменшують кількість помилкових блокувань.
Модель вже доступна для користувачів Plus та Enterprise, а нові API-ендпоінти поступово відкривають для розробників із рівнем доступу Tier 1 і вище. Також передбачено використання API gpt-image-2 з оплатою залежно від якості та роздільної здатності згенерованих зображень.
Чат-бот під управлінням штучного інтелекту Copilot став доступним у Telegram. Його розробила корпорація Microsoft. Там бота назвали "другим пілотом" для Telegram. Copilot створено на базі GPT.




















Коментарі