你知道那种感觉吗?就是刚准备给某个AI绘画工具充值会员,结果第二天就出现了一个免费且更强大的替代品...昨天我还在各种AI绘画工具之间选择困难症,今天腾讯混元就突然官宣了3.0模型。完全开源,免费使用!
说起这次的更新,那真的是有点颠覆性了。你想啊,以前的AI绘画就像是一个打印机,虽然打印出来的图片很好,但缺少很多常识性的思考,最常见的就是很多工具出图的光影,在生成的时候就显得不合理。
而这次混元3.0却直接换了一玩法,那就是直接给打印机装一颗大脑!因为是原生多模态,所以生图的方式更像是有灵魂的画家,它会主动思考你跟他说话的意思,还会利用常识来去推理画面中的构图、笔触、布局等等。
简单来说,就是会利用世界知识推理。其实就是根据我们的生活常识来推测出我们想要的图像,就比如,直接让混元图像3.0绘制“月饼制作的教学漫画”:
通过这个小例子,我们就能很清楚地看出来,混元图像3.0其实是真的懂如何制作月饼的。整个过程中我什么都没说,完全就是让模型自己发挥,结果它表现得特别好。
这其实是因为混元图像3.0采用全新的原生多模态架构,模型底座共享了混元A13B这个80B的大语言模型,能够更好的理解语义并且具有世界的知识。有了这个基础,它在处理世界知识和推理时,就能更好地利用之前学到的经验来生成图像。
这样来看,混元大模型生图的方式还真的有点像人在思考。目前市面上这些AI生图工具,包括混元图像3.0在内,生成出来的图片质量其实都挺接近,想要拉开明显差距还是挺难的。而真正让我觉得混元能在生图领域占有一席之地的原因,就是它对世界知识的理解能力。
比如我们可以尝试使用混元帮我们“生成一份桂花糖藕的漫画教程”,方便我们在中秋节展示一下厨艺。
再或者我们可以定制一套属于自己的中秋节定制表情包。提示词:生成中秋节兔子九宫格表情包:1) 中秋快乐 2) 一起吃月饼 3) 中秋暴富 4) 共赏明月5) 节日团圆6)思念是一种兵 7) 桂花酒满上 8) 团团圆圆 9) 花好月圆。
说到生成文字,这真的是很多AI工具的老大难问题。国外主流的AI绘图工具,基本上都是生成标题大字还能勉强搞定,但一碰到长文本或者小字就彻底抓瞎了,各种乱码、错字满天飞,看着就让人头疼。但是混元3.0在图像生成方面就可圈可点,比如输入这段复杂的提示词:
提示词:A person writing on a blackboard. Large text "HunyuanImage 3.0" at the top. Smaller text below: "Hunyuan embraces open source, offering multimodal AI models including image, video, and 3D generation tools. Over 3000 derivative models created, with Hunyuan 3D downloaded 2.3M+ times, becoming the world's most popular 3D open source model."
混元图像3.0在文字生成这块的表现特别让人惊喜,能把文字处理得这么好。另外混元图像3.0在语言的理解的能力和美学质感上也有着非常大的优势。就比如我可以尝试使用混元大模型来生成一个月饼礼盒:
提示词:中式禅意风格的月饼礼盒产品摄影,主体一盒暖金色的月饼礼盒,放置在台面上,座子上还摆着两枚月饼;场景以深蓝色渐变背景为衬托,搭配造型简约的黑色树枝(带有清晰投影剪影)与三朵盛放的白色玉兰花,花朵具柔美自然质感;风格融合艺术感静物摄影与东方花艺美学;色调采用沉稳深蓝色(背景渐变)、暖金色(月饼礼盒)、纯净白色(玉兰花)、深邃黑色(树枝与瓶盖),营造高级静谧氛围;构图为平视中心视角,两个月饼在礼盒外面放着,黑色树枝与白色玉兰花从右侧及上方延伸环绕,背景带有树枝投影细节,整体光线柔和,突出产品精致感与东方意境。
不管我怎么描述画面和主体物,混元图像3.0都能精准get到我的意思。精致感和高级感一下就出来了,更像是专业摄影师拍出来的作品。基本上一次就能出效果,这种体验真的很爽,让人有种"哇,它真的懂我想要什么"的感觉。
其实现在的AI生图工具真的已经相当成熟,AI生成的图片在很多方面已经比传统的PS要快很多了。比如快过中秋了我需要做一组中秋节的字体设计,那我可以这样写:
提示词:黑色背景,创意字体设计“中秋节快乐”,搭配英文“HunyuanImage 3.0”进行排版。加入月亮和星星元素,抽象,酸性,silver,金属流体字,艺术性概念性混合。流体艺术形态笔画线条流畅且富有艺术感,将字体进行抽象变形,创造独特的节奏和动感,给人以强烈的视觉冲击高级感。
在生成各种质感字体方面,混元生图3.0的表现也相当出色。像这种立体效果的字体,以前除了用3D软件建模,其他方法还真挺难搞定的。特别是那些不会3D软件的平面设计师,以前碰到客户要求做立体字就头疼,现在有了混元3.0,描述一下想要的效果就行了。
提示词:高达风格的立体机械字体“混元3.0”,3D渲染,C4D风格。它的亮丽颜色有蓝色、绿色还有橙色、白色相结合,细节丰富,黑色的背景
提示词:平面插画,海报设计,高级感排版,新中式美学,中国当代艺术风格,新中式宋代主题,国风美学,高饱和渐变背景,超大的的满月与古代宫殿建筑的剪影居中,超大的的满月在建筑后面并占据大半画幅,满月边缘稍微虚化一点,不要太生硬,周围有一些小星星围绕,旁边还停留一只小玉兔,渐变和肌理磨砂处理,造型柔和,中式建筑,中式花纹,不透明和半透明质感,橙白渐变色,工笔画,层次感,弥散渐变,细节满满,左上方放标题“CHINESE TRADITIONAL FESTIVALS”.用细的衬线体,放大处理,在标题下放“中秋国庆”,下方还有“一轮明月恭贺华诞”,整个画面左下方放日期“10.01”和“10.06”,还有“2025”,日期部分有点缀小字“MID AUTUMN FESTIVAL NATIONAL DAY”,日期与点缀小字都用衬线体,底部左下角有“MID AUTUMN FESTIVAL”,极小号字体,横向排布底端左侧“Oct 1- Oct 06,2025”,极小号字体,横向排布;右下角“NATIONAL DAY”极小号字体,横向排布,统一用衬线体
相比于Nano-Banana这种优秀的模型来说,混元文生图生成海报的能力肯定是略胜一筹的。因为混元3.0本身就对中文理解的更好,所以更适合国内的设计环境来使用。我们也可以使用混元3.0来生成很好看的节日徽记。
提示词:米白色细腻颗粒质感宣纸,画面居中红色印泥质感圆形印章月亮,一小片密集桂花叠影浮凸渗透,层叠的红色宫殿融合,极小的飞鸟群点缀,大面积留白,高清晰度,日式简约设计,完美构图。画面底部左侧黑色字"HunyuanImage 3.0.10/06",右侧"国庆快乐"。
混元模型在生成立体吉祥物方面也有很好的表现,比如生成一个中秋节的小兔子吉祥物。
提示词:插画,扁平,吉祥物设计,盲盒风格, 全身, 可爱的白色小兔子 环形护目镜,头身一体,球型,肥胖圆润的,手里拿着月饼,卡通五官,五官聚拢,左右两侧脸上有一个月亮贴纸,大大的手,大大的脚,黄色外套,绿色短袖,绿色书包,流畅线条感,干净的背景, 三视图,即正面图、侧面图和背面图,鲜艳色彩,杰作,原创,趣味姿势,搞怪。
最后我还想做一个中秋节的一款月饼礼盒设计,直接输入需求和文字描述,礼盒就自动生成好了。
提示词:中秋节月饼礼盒设计,太空航天银色和蓝色的礼盒,创意异形月饼礼盒,月饼礼盒上有满月、四角星、月桂花、星河等元素装饰,礼盒名:“星穹揽月 中秋团圆”,礼盒文案:“摘星入盒 揽月共圆”,英文装饰“MID-AUTUMN”。礼盒旁边有4枚月饼展示。冷调色彩,创意未来科技感,深邃感。
以前光是找素材、扣图就够折腾的,特别是遇到复杂边缘,一扣就是好几个小时,还不一定做得好看。现在直接输入几句话,AI就能给你出非常优质的设计图,整个过程完全不需要你打开任何设计软件。说实话,这对传统设计工作的冲击挺大的。熟练掌握PS技巧的优势,现在可能不如会写提示词来得实用。
很多时候我觉得,相比于Nano-Banana那些闭源模型,开源的生图工具最大的优势就是不用被网络环境限制,也不用充各种会员。在生图模型的搭建上真的给了我们太多想象空间和自由度,现在的开源模型已经强到让人有点意外了。我最近也在尝试一些以前必须用PS才能搞定的活儿,现在直接用AI工具就能解决,效果还真不赖。
所以我特别好奇,屏幕前的各位,你们有多久没打开过PS了?是不是也和我一样,越来越少用设计软件了呢?
优设是国内专业设计师平台,2012年创办至今,作为行业风向标,我们13年来专注于设计师创作者的学习成长交流。 通过优设网、优优教程网、优创网分别沉淀优质内容。是一家集齐媒体、内容、服务的多元化平台。MCN矩阵@优设AIGC 在微博、微信、小红书、抖音、B站布局,全网粉丝过千万。