OpenAI 宣佈 ChatGPT 在影像創建方面取得突破

facebooktwitterplurklinkedin

OpenAI 發布了其 AI 系統 GPT-4o 的更新版本,可以產生更逼真的圖像。該公司表示,GPT-4o 取代DALL-E 3 成為 OpenAI ChatGPT 聊天機器人背後的預設影像生成模型,ChatGPT Free、Plus、Team 和 Pro 用戶現在可以使用它。

GPT-4o 被譽為當時最先進的 AI 模型的廉價版本,是一種能夠創建和理解文字、視訊、音訊和圖像的多模式模型。OpenAI 表示,改善後的 GPT-4o 模型可以讓消費者和企業更輕鬆地創建更逼真的圖像和易於理解的文本段落。

該計畫首席研究員Gabriel Goh表示,GPT-4o 改進的背後是一群“人類訓練師”,他們為模型標記訓練數據,找出人工智能生成的圖像中的拼寫錯誤、錯誤的手和臉。透過這種技術,人工智慧模型可以訓練得更緊密地遵循人類的指示,從而產生更準確、更有用的圖像。他表示,基礎模型本身就已經很聰明了,「透過人類回饋進行強化學習」過程會將這種智慧發揮出來,並對其進行完善。

OpenAI 表示,隨著對 GPT-4o 研究的改進,ChatGPT 的圖像生成現在對消費者和企業更有用。例如,其 AI 系統的早期版本無法產生帶有圖像的可讀文字段落,而 GPT-4o 卻能夠做到這一點。OpenAI ChatGPT 多模式產品負責人 Jackie Shannon 表示,該模型還能夠創建透明背景,使企業可以創建商標或其他圖像。該公司建議的其他用途包括要求 ChatGPT 根據用戶上傳的品牌風格指南產生圖像。