You are currently viewing OpenAI升级ChatGPT图像生成模型

OpenAI升级ChatGPT图像生成模型

引言:OpenAI升级ChatGPT图像生成模型Images 2.0,凭借网络信息检索与多图生成能力,结合实时数据输出更细致图像,如精准呈现旧金山地标与天气。其灵活比例定制与卓越文本渲染能力显著提升用户体验,有望通过社交媒体潮流趋势重新激发用户兴趣,推动AI图像生成技术迈向新高度。

新闻配图

OpenAI升级了ChatGPT的图像生成模型Images 2.0,这一更新可能重新激发用户兴趣并提升使用率,尤其当社交媒体用户将其用于可传播的潮流趋势时。去年Google推出NanoBanana模型后,用户开始分享超写实人偶形象,而今年早些时候ChatGPT的图像功能也因用户分享AI生成的讽刺漫画而走红。

Images 2.0能利用ChatGPT的“推理”能力,可搜索网络最新信息并一次性生成多张图像,通过额外步骤从单一提示输出更全面的生成结果。该模型的知识截止日期为2025年12月,这意味着输出结果更细致,例如能生成包含旧金山次日天气预报及推荐活动的信息图,图像中准确呈现了雨天细节以及渡轮大厦、卡斯特罗剧院、彩绘女士房屋和美洲金字塔等标志性建筑的写实描绘。

Images 2.0还支持更灵活的图像比例定制,用户可根据需求生成从3:1宽屏到1:3竖屏的图像,并在提示中调整尺寸。经过数小时测试,新模型的文本渲染能力令人印象深刻,尤其在英语表现上。过去主流模型的图像输出常出现字符变形或多余字母,而Images 2.0的清晰复杂输出显示出持续进步。

Google也在其NanoBanana模型的最新版本中专注于改进文本图像输出。测试不同语言输出时,我要求生成以蒂莫西·柴勒梅德为主题的海报,模拟其中国粉丝风格,结果呈现了多张写实图像,包括他身着传统服装或带有猫耳的描绘。

思为交互

思为交互科技

思为交互科技是一家”从云到端”的新型物联网及工业4.0技术公司,可以为各类生产制造型企业提供从硬件到云端全套的解决方案。我公司Galileo OS数据基座融合AI大模型、数据中台、物联网等技术,推动制造业工厂数字化转型。从数字化车间到智能工厂,全面覆盖安全、生产、质量、设备管理等业务。

声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:sales@idmakers.cn删除,任何个人或组织,需要转载可以自行与原作者联系。