本文来源:公众号量子位
StableDiffusion又被发掘新用途了——
设计LOGO最关键的“形意结合”,被它拿捏得明明白白。看见Cat秒画猫猫头:
瑜伽店YOGA几个字母用人体形态一转换,风格完全不出错:
只设计其中一个字也没问题,例如将Dog的D画成一个狗子:
属实简洁又传神了有木有!
哪怕是面对中文字体,AI也能很好地理解其中的意思,快速画出甲方想要传达的LOGO形象:
要是开店用上这个,哪里还需要花几十上百块专门设计一个LOGO出来?
虽然之前也有不少设计LOGO的AI了,不过从这次生成的效果来看,还真有点不太一样。
非营利性稳定币评级机构Bluechip上线:7月14日消息,独立非营利性稳定币评级机构Bluechip宣布上线,将从稳定性、管理、技术实施、权力下放、治理和外部因素6个维度对稳定币进行评级。[2023/7/14 10:54:54]
01保留一部分原有字体的味道
事实上,在这次研究之前,已经有不少研究在考虑如何用AI设计LOGO。
从效果来看,主要可以分成三类:
一是以字体为形状限制,将图片风格迁移上去;二是以图片风格为基底,将字体迁移到图片中去;三是将不同图片的形状和字体关联起来,生成或彩色或黑白的“图像拼接”风格LOGO设计。
然而,与下面人类手工设计的LOGO比起来,上面AI设计的效果不能说不好看,但似乎还差那么点意思:
SHIB巨鲸转移近2500亿枚SHIB:金色财经报道,据Spot on Chain披露数据显示, “0x2eFB50开头”的钱包地址已将2130亿枚SHIB转移到Coinbase和OKX两大交易平台。不仅如此,该地址此前还将2300亿枚SHIB中转到了“0x66E092开头”的地址钱包,其中有179亿枚SHIB流向币安,150亿枚SHIB流向了Coinbase。据统计,该巨鲸通过此次操作流向中心化交易所的资金总量达到2459亿枚SHIB。[2023/4/5 13:45:44]
作者们经过一通探查,发现人类手工设计的LOGO并不“喧宾夺主”。
人类设计师会在保留原本字体特色、让人们能一眼认出单词的基础上,再加入一点创新之处,例如将Jazz中的J改成乐器,但其他人一眼仍然能认出“JAZZ”字体的形状。
NEAR基金会任命新的首席运营官和总法律顾问:10月13日消息,NEAR基金会宣布已聘请Bill Earner担任首席运营官,Christopher Donovan担任总法律顾问。Earner此前曾担任公共交通应用和地图服务Citymapper的总经理、 Entrepreneur First的风险合伙人、Connect Ventures的创始人等。Donovan曾是Outlier Ventures的合伙人兼法律主管,负责推动公司的法律战略和构建公司的投资结构。[2022/10/13 10:33:06]
整体来说,就是在保留一部分字体“味道”的同时,加入一定的设计感。
例如这是StableDiffusion生成的“FROG”设计,FRO仍然是原本字体的形状,只有G变成一只跳出去的小青蛙:
安全团队:OVR项目Discord服务器遭到攻击:金色财经消息,据CertiK监测,OVR项目Discord服务器遭到攻击。请社区用户不要点击、铸造或批准任何交易。[2022/8/26 12:50:23]
如果用StableDiffusion2进一步进行后期处理的话,还能进一步实现上色功能,显得更加生动:
生成LOGO的风格也能随着原本设计字体的变化,而产生不一样的变化。
例如这是8种字体下生成的不同瑜伽LOGO,每种风格都不一样:
相比之下,其他AI模型在生成字体的时候,倒是更喜欢保留自己的风格:
那么,这种神奇的字体设计AI是怎么做出来的?
02用贝塞尔曲线调整字母形状
为了一定程度上保留原本字体的风格、以及只改变单词中的某几个字母,作者们想出一种“微调”字母形状的方法——
那就是让AI学会用贝塞尔曲线,对不同字体的字母进行小幅度变形。
具体控制点数量,则根据字母复杂度和字体风格进行迭代变换,直到设计出来的字母符合要求,其中橙色是初始点,蓝色是后续增加的控制点:
控制点数量对生成效果影响有多大?
例如这是不同数量的控制点生成字母的效果,如果数量太少,会看不清设计的图像形状;但数量过多又容易扭曲字体原本的形状:
基于这种核心设计思路,作者们结合StableDiffusion和CLIP,设计出了一整个字体设计AI模型:
其中,ACAP损失函数基于德劳内三角形剖分算法,对字母形状进一步进行了约束。
例如这是PANTS在变形前和变形之后的形态,可以看见ACAP在保留裤子形态的同时,也保留了字体的效果:
与此同时,为了进一步保留字体形态,作者们采用了一个低通滤波器,保证调整后的字母不与原始字母偏离太多。例如这是Bear中的B调整后的形态:
应用这套模型,生成每个字母的速度也还不错。
在一块RTX2080GPU上,生成单个字母的LOGO设计大约需要5分钟。
03作者介绍
虽然作者们放到项目主页上的论文是匿名的:
不过在arXiv上,作者们的名字倒是已经公开了,他们分别来自以色列特拉维夫大学、ReichmanUniversity,以及伦敦大学金史密斯学院:
共同一作ShirIluz,特拉维夫大学电子与电气工程理学硕士,目前的研究方向是生成AI,感兴趣的方向是深度学习与计算机视觉。
共同一作YaelVinker,特拉维夫大学计算机视觉博士生,曾经在以色列希伯来大学获得计算机科学本科与硕士学位,目前研究方向同样是深度学习与计算机视觉。
这么看来,雷军当年设计小米LOGO的200万元花早了啊?
论文地址:https://arxiv.org/abs/2303.01818
项目地址:https://wordasimage.github.io/Word-As-Image-Page/
巴比特园区开放合作啦!
中文推特:https://twitter.com/8BTC_OFFICIAL
英文推特:https://twitter.com/btcinchinaDiscord社区:https://discord.gg/defidao电报频道:https://t.me/Mute_8btc电报社区:https://t.me/news_8btc
自香港发布虚拟资产发展政策宣言以来,发布了一系列加密友好政策,积极拥抱Web3,使香港迅速成为新一个Web3圣地,在此聚集了大量Web3人才,引发了大量对加密浪潮的的思考.
1900/1/1 0:00:00主流媒体认为ETH未来定将超越BTC,ETH的社区强大的无法被击败的观点是我不能认可的。我指的不是那些所谓的新公链可以替代ETH,很多同学还是有疑问,我尝试用大白话把其中的结构理清楚,毋庸置疑的.
1900/1/1 0:00:00虽是BNB链上的龙头,PancakeSwap在DEX的对比中却经常被忽视,实际上它的流动性仅次于Curve和Uniswap,截至3月9日,TVL为25亿美元.
1900/1/1 0:00:00图为YugaLabs发行的TwelveFold系列1号NFT,价值15万美元现在正是比特币发展最微妙的时候.
1900/1/1 0:00:00注:本文来自@balajis推特,MarsBit整理如下:你怎么在网上拉响火灾警报?你怎么证明这不是虚惊一场?我正在设置BitSignal。100万美元的比特币提醒我们隐形金融危机.
1900/1/1 0:00:00以太坊或将在一个月内完成其转向权益证明的最终阶段。在即将到来的「Shapella」升级后,超过1600万枚质押在信标链上的ETH将能够被提款.
1900/1/1 0:00:00