特朗普重返白宫后,总爱吹嘘自己结束了多场战争,还嚷嚷着要拿诺贝尔和平奖。可实际情况呢,他那些所谓的成就没得到认可,诺贝尔委员会今年10月就把奖给了别人...
2025-12-24 0
12月22日,阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。
千问新模型采用自研创新架构,可将图片“拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎“零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。
Qwen-Image-Layered打破了主流视觉大模型的“扁平式思维”,模型通过“分层”和“补全”建立起对现实世界更准确的“物理式理解”,让AI从平面的“看图说话”迈向真实的“空间重构”。
在当前的视觉大模型领域,图像一致性编辑始终是一个核心挑战。AI生图有创意但难编辑,主要是因为大模型对图片的理解是扁平的,是一堆像素点紧密耦合在一起,而不能像人一样感知出图中物体的远近、遮挡等物理关系。
因此,让大模型生图和编辑就像抽卡“开盲盒”:比如你想把画里的猫往左挪10厘米,但AI完全不知道猫左挪后空出来的背景会有什么,只能再重新生成一次,猫和背景全都变了样。
这种“牵一发而动全身”的随机性,让AI绘图在追求极致精准的商业广告设计、UI界面设计、影视后期处理等专业领域,始终只能作为一种参考,而无法真正取代专业工具。
Qwen-Image-Layered 的出现,意味着视觉大模型从“像素预测”转向“结构重组”。
千问团队自研了一种全新的RGBA-VAE编码,在传统的RGB图像中引入代表透明度图层的“Alpha通道”,让模型有了图层的概念;同时新模型采用了创新的VLD-MMDiT架构,配合独特的“图层级3D位置编码”,让AI自动“脑补”被遮挡部分的背景纹理,实现对图层和空间的更深入理解和生成。
据了解,为训练这种能力,千问团队从海量的专业Photoshop(PSD)文件中提取真实图层逻辑,让AI从出生起就拥有专业设计师的“分层思维”。
Qwen-Image-Layered模型架构图
业内人士指出,千问新模型将为创意产业带来实质性变革。AI生图不再是死板一块,而成为一个活生生的、可无限调整的素材库;图片编辑也不再需要复杂精细的人工抠图,而是AI原生地实现了“内在可编辑性”,设计师、动画和影视制作人员可在保持背景或主体完全不变的前提下,对特定图层的构件进行位移、缩放或重绘,显著提升数字内容创作的生产效率。
据了解,Qwen-Image-Layered已在魔搭社区和HuggingFace开源,开发者和企业可免费下载商用。截至目前,阿里已开源近400个千问模型,全球下载量突破7亿次,衍生模型数超18万个,是全球第一的开源模型。通义大模型已服务超100万家客户,在中国企业级大模型调用市场中通义位居第一,是中国企业选择最多的大模型。
— 完 —
量子位 QbitAI
关注我们,第一时间获知前沿科技动态
相关文章
特朗普重返白宫后,总爱吹嘘自己结束了多场战争,还嚷嚷着要拿诺贝尔和平奖。可实际情况呢,他那些所谓的成就没得到认可,诺贝尔委员会今年10月就把奖给了别人...
2025-12-24 0
近日广东、中南大学有重要人事调整一起来看——广东广州近日,中央批准:冯忠华同志任广州市委书记;免去郭永航同志的广东省委常委、广州市委书记职务,中央另有...
2025-12-24 0
苹果的设计争议从未停歇,从iPhone 6的天线条到iPhone 17 Pro的特殊造型,每一次质疑背后都暗藏着技术突破与产品定位的深层逻辑。本文将深...
2025-12-24 0
文章参考官媒资料撰写,无任何不良引导请理性阅读,为阅读通顺文章可能存在润色,如有侵权或文章错误请私信指出!【文章参考信源已放在文章结尾】编辑丨ZF“晚...
2025-12-24 0
美国多家媒体21日援引更新消息报道,美国海岸警卫队当天仍在委内瑞拉附近国际水域追截“贝拉1号”油轮,这距离美军扣押上一艘“世纪号”油轮还不到24小时。...
2025-12-24 0
12月24日,中国驻马里大使馆发文,提醒在马中国公民和企业合法经营并立即撤离危险地区。近期,恐怖分子频繁袭击我在布谷尼大区的公民和企业,焚毁生产设备,...
2025-12-24 0
具身智能,似乎真的要走入生活了。12月23日,国内具身智能企业维他动力发布了首款消费级四足机器狗“大头Bobo”,预售价格9988元,首日成交额超过千...
2025-12-24 0
1969年,毛宁出生在沈阳,家里父母搞音乐,一个拉琴一个练声,可他偏爱体育,踢球练田径,高考后进体校,当了几年老师。学校文艺晚会让他试着唱歌,一开口大...
2025-12-24 0
发表评论