来源:TechRadar 作者:Eric Hal Schwartz

谷歌的 Gemini 人工智能在两项重大升级中,为你基于人工智能的图像创作推出了画布和调色板。如今,Gemini 能够直接在其聊天界面中编辑图像,而且你可以一次性发送一批图像(或其他文件)让它进行处理。
这个新的编辑器可以对你上传的任何图像,或者 Gemini 生成的图像施展人工智能魔法。你只需让 Gemini 进行你想要的修改就行。你可以更改度假照片的背景,把你那简陋的爱彼迎民宿厨房 “移” 到圣托里尼的悬崖上;可以去掉夹克上的芥末污渍;甚至可以给你的狗戴上一顶有趣的帽子,尽管在现实生活中它根本不愿意戴任何头饰。
在与 Gemini 的对话中,你可以进行多次编辑,在这个过程中逐步叠加修改。而且每一次修改都会保留之前的更改,所以当你觉得最后几次修改让效果变得更糟时,无需从头再来。
在底层技术方面,Gemini 的编辑器运行着一系列协同工作的工具,这样一来,最终的图像就不会像弗兰肯斯坦的怪物那样,把相互冲突的纹理、光线、角度以及图像的其他方面生硬地拼凑在一起。Gemini 承诺,即使你的想象力天马行空,它也会让图像看起来真实可信。
谷歌称,这个编辑器对众多职业都有诸多积极作用。教师可以快速制作带插图的故事板,设计师可以制作产品照片的作品集,建筑师则可以在会议进行中直观地看到建筑设计的调整方案。
这个编辑器与谷歌取消 Gemini 单一文件上传限制的举措相得益彰。现在你可以一次性上传多达十张图像、PDF 文件或其他文件,然后让 Gemini 来处理这些内容。
人工智能图像创作
你可能想知道,Gemini 的编辑器将如何防止人们出于不良目的,利用其功能对真实人物或事件制作深度伪造的图像。谷歌很想表明公司已经考虑到了这一点。这就是为什么每一张经过人工智能编辑的图像都带有两个水印,而不是一个。一个是可见的,另一个使用了谷歌的 SynthID 水印,这种水印只能通过软件检测到。此外,还有由人工反馈驱动的过滤器,可以阻止那些在伦理道德上有问题的请求。
这个编辑器和扩展的上传选项并非开创性的新功能,但它们增强了 Gemini 的功能深度。这不仅仅关乎 Gemini 能告诉你什么,还关乎它能帮助你创造什么。谷歌正投入大量精力,将 Gemini 打造成一款全面且多功能的工具包,让人们放心使用并依赖。
谷歌希望人们不要仅仅把 Gemini 看作一个会讲笑话的数字记录员或搜索引擎,而是将其视为创意和高效工作任务中的合作伙伴。要达到能让你对 Gemini 说 “设计一张生日贺卡,然后烤个蛋糕” 的程度,我们还有一段路要走,但这一天比你想象的要近。在此之前,能够一次性向 Gemini 发送十个文件,让它给出有条理的回复,同时还能给你的狗戴上帽子,已经是一个相当不错的开始了。
本文转载自TechRadar,本文观点不代表雅典娜AI助手YadiannaAI立场。