OpenAIは3月25日、最新のAIモデル「GPT-4o」に画像生成機能を統合したと発表しました。これにより、ChatGPTユーザーはテキスト入力から直接、高精度でフォトリアリスティックな画像を生成できるようになります。
GPT-4oは、テキスト、画像、音声など複数のデータ形式を処理できる「オムニモーダル」モデルとして設計されています。従来のDALL·E 3シリーズと比較して、属性の正確な結びつけやテキストのレンダリング能力が大幅に向上しており、科学的な図解や複雑なテキストを含む画像の生成が、より正確かつ信頼性の高いものとなっています。
OpenAIの研究責任者であるガブリエル・ゴー氏は、「このモデルは以前のモデルに比べて大きな進歩を遂げており、特に属性の結びつけやテキストのレンダリングにおいて顕著な改善が見られる」と述べています。
この新機能は、ChatGPTのPlus、Pro、Team、Freeの各サブスクリプション層で利用可能となり、無料層では使用制限が設けられています。OpenAIは、生成された画像にAIによる生成であることを示すデジタルマーカーを含めるなど、不正使用を防ぐための強力な安全対策を実施しています。
OpenAIは、「ユーザーがこれらの画像をサービスの利用規約内で自由に使用できるようにすることで、創造性を高める新たな手段を提供することを目指している」としています。(Source)
コメント