Microsoft (NASDAQ:MSFTOpenAI, що підтримується ), представила останню версію свого інструменту ШІ для перетворення тексту в зображення під назвою DALL·E 3.
Компанія повідомила, що DALL·E 3 зараз знаходиться на стадії попередньої версії та буде доступна клієнтам ChatGPT Plus і Enterprise у жовтні через API та в Labs пізніше цієї осені.
DALL·E 3 побудовано на основі ChatGPT, що дозволяє використовувати ChatGPT і покращувати підказки.
DALL·E 3 розуміє значно більше нюансів і деталей, ніж попередні системи компанії. Сучасні системи перетворення тексту в зображення мають тенденцію ігнорувати слова чи описи, змушуючи користувачів вчитися швидкому розробці. Але, згідно з OpenAI, DALL·E 3 є кроком вперед у своїй здатності генерувати зображення, які точно відповідають тексту, який надає користувач.
Компанія, однак, зазначив що, як і в попередніх версіях, було вжито заходів для обмеження здатності DALL·E 3 генерувати насильницький, дорослий або ненависницький вміст.
У новій версії передбачено пом’якшення для відхилення запитів, у яких запитується ім’я публічної особи. Компанія заявила, що покращила показники безпеки в таких сферах ризику, як створення публічних діячів і шкідливі упередження, пов’язані з надмірною/недостатньою візуальною репрезентацією, у партнерстві з експертами, щоб допомогти інформувати свої зусилля щодо пом’якшення наслідків у таких сферах, як пропаганда та дезінформація.
Крім того, OpenAI зазначив, що також досліджує найкращі способи допомогти людям визначити, коли зображення було створено за допомогою ШІ. Компанія експериментує з класифікатором походження — новим внутрішнім інструментом, який допоможе визначити, чи зображення було створено DALL·E 3 — і сподівається використовувати цей інструмент, щоб краще зрозуміти способи використання згенерованих зображень.
DALL·E 3 також призначений для відхилення запитів, які вимагають зображення в стилі живого художника.
Інструменти ШІ для перетворення тексту в зображення OpenAI також мають конкурентів, наприклад Alibaba (БАБА) Тонгі ВаньсянMidjourney Inc. Midjourney and Stability AI.
OpenAI також стикається з критикою авторів, зокрема Джорджа Р. Р. Мартіна та Джона Грішема подав до суду компанії за ймовірне порушення авторських прав.
Сервіси Generative AI захопили світ штурмом після запуску ChatGPT. Компанії по всьому світу запустили власні великі мовні моделі, або LLM. Baidu (БІДУ) Ерні БотAlibaba (БАБА) Tongyi Qianwen і Tongyi Wanxiang, підрозділ «Алфавіт» (GOOG) (GOOGL) Google БардМетаплатформи (МЕТА) AudioCraft, Безшовний M4T і Лама 2деякі з них.