当前位置:首页 > 谈天说地

原画师惊到:爆火AI真把梦境画成现实了!下载APP人人可用

34资源网2022-04-28448

没想到,平常都是我拿着最新ai的demo到处去安利。

这回竟然被美术圈的朋友安利了一个ai绘画app???

话不多说先看效果:

这摩登又玄幻的画面,一上来就冲击到我了。

抽象的线条兼具了美感和想象力,同时还传递出未来城市的感觉。

要不是被剧透,我还真不一定能立刻猜出来这是出自ai之手。

而且除了能对照片进行二改,这个ai还能根据文字命题、凭自己想象作画。

比如输入落日飞车四个字,在ai的“想象”中会是这样:

另外还可以画出不同画风,目前已支持20种。

还真是能满足你提出的所有需求,怪不得能征服美术设计圈(doge)。

ai画完后,甚至可以一键保存成手机壁纸。

在微信公众号后台回复“wombo”,可开盲盒获得随机壁纸,总共5款哦~

过去几天,这款app还在apple store图形和设计区霸榜多日(安卓版本也有)。

要知道,过去美术圈、艺术圈可是有不少人吐槽ai生成的内容没得灵魂。。。

结果现在纷纷在社交平台上po自己的作品,还有设计区大v要专门聊聊这个事儿。

但更让我震惊的是,这个app背后公司的故事。

公司创始人现在只有25岁,为了创业,他直接从多伦多大学退学。

公司首次推出的app(wombo.ai),能让照片对口型唱歌。

没错,就是那个此前在抖音上爆火、席卷全球互联网的魔性特效。

凭借着这款app,这家公司估值直冲4000万美元(折合人民币约2.5亿)。

而他们最初的启动资金,只有6万美元。

这不禁让人好奇,到底是怎样的一伙人,能凭借ai一次又一次做出全球爆火的app?

25岁辍学创业,公司估值4000万美元

先从小哥的公司wombo创办说起。

wombo是一家加拿大公司,创始人及ceo名叫ben-zion benkhin,今年25岁。

(接下来我们暂时用“小本哥”来称呼他)

小本哥本来是多伦多大学数学与哲学专业的一位学生。

在学校的时候,他组建过一个人工智能兴趣社团,自己对deepfake也十分感兴趣。

2020年8月的一个夏夜,小本哥和他的室友在公寓屋顶上吹风,突然灵光一现:

为什么没有人做一个app,可以把一张普通的照片变成搞笑视频?

△wombo效果

在经过4个小时的讨论之后,wombo的雏形轮廓逐渐清晰了起来。

虽然当时吹风的时候小本哥还顺带飞了点叶子(doge),但是他对这个想法还真不是一时上头。

为此,他选择辍学完成创业。

同时还拉来了自己做管理顾问的朋友paul pavel一起“搞事”,并在多伦多大学招募了一些学生。

其中angad arneja放弃了全额奖学金,选择和小本哥一样辍学,现在他是wombo的人力主管。

公司最初启动资金有6万美元,主要依靠各位创始人的父母慷慨解囊。

小本哥说这些钱主要用在了买电脑、招募开发人员和品牌推广上。

大约半年以后,2021年2月28日,wombo就准备好发布了。

小本哥和其他公司创始人们把这个应用发给了大约10个人。

一周之内,wombo的下载量就达到了50万次。

第二周,这个数字跃升到了900万。

由此,wombo也引起了各方投资人的关注,顺利拿到了由global founders capital和sofreh capital共同领投600万美元天使轮。

现在估值达到了4000万美元。

值得一提的是,wombo在爆火前,曾被200多家vc拒绝过。

所以这一波下来,真正赢麻了的是最初提供启动资金的家长们。

比如paul pavel的父母就是资助2万美元,最终换来了数十万美元的股票。

目前,wombo旗下的两个app下载量已经达到了8400万+,月活用户超过1000万。

wombo上的创作量已经达到10亿,dream by wombo这一数据也达到了1.8亿。

由此带来的收入也非常可观,去年wombo上线4个多月,依靠内部广告和免费歌曲库获得了数十万美元的收入。

dream by wombo支持用户购买自己用ai生成的作品。

20美元可定制一张海报,加边框的价格则从45美元起算。

这个ai是怎么画画的?

让ai根据文字作画,了解ai的朋友会知道这属于多模态生成。

模态,指的是文本、图像、声音等不同的信息表现形式。

多模态,则是把不同类型的信息结合起来。

如果给每个图片标上文字描述组成一对,用大量这种图文对去训练ai,就能让它理解到图文之间的对应关系。

openai开源的clip就是这个原理,wombo工程师也曾在一次采访中透露过,他们的算法中就使用了clip。

clip使用了4亿组从网上收集的图文对做训练,可以理解颜色和形状,日常物品或建筑物,甚至抽象的艺术风格比如“印象派”或“赛博朋克”。

△clip训练数据示例

接下来,还要解决图像生成的部分。

没错,又要请出gan了,而且这次gan要接受clip的指挥。

整个流程是这样的:

首先生成一张平平无奇的随机图像当种子。

让clip给图像与文字描述的相似度打分,反馈给gan,gan以提升分数为目标不断迭代。

整个迭代过程可以在app中直观地看到。

其中的随机性意味着ai几乎不可能两次生成同样的图像。

如果第一次结果不满意,还可以点击按钮用相同配置再试一次。

至于wombo的算法具体使用了哪种gan,并未公开。

但在招聘信息里,高级机器学习工程师的岗位描述中写着,有dc-gan经验的优先。

dc-gan最早于2015年提出,是第一个使用深度卷积网络生成图像的gan变体。

意味着wombo的算法大概率是以此为基础改进而来。

wombo选择卷积网络而不是transformer的理由也不难猜。

要做成移动app给全球玩家使用,而且生成的是高分辨率图像,卷积在效率上要占优势。

clip+gan结合成ai画家的方法并非wombo首创。

clip于2021年1月发布,第二天网友@advadnoun就开始试验其与各种生成模型的组合。

最终他选择了biggan,将代码发布为colab笔记the big sleep

早期the big sleep生成的画,怎么说呢,总是带点精神污染,分辨率也不高。

(建议不要去翻@advadnoun的早期分享,真的有毒)

后来西班牙玩家katherine crowson在此基础上发布了clip+vqgan的版本。

vqgan是cvpr 2021 oral入选论文,将cnn的高效率和transformer的高性能结合起来,生成的图像质量更高。

这一版colab笔记真正流行了起来,不少人开始分享ai创作的画,还开发出各种技巧。

比如文字提示中加入虚幻引擎或者光线追踪,画质还能大幅提升。

围绕clip+vqgan开始形成社区,代码不断有人做优化改进,还有了专门收集发布ai画作的账号。

而最早的先驱@advadnoun还顺利入职adobe担任研究员。

但这一波ai作画浪潮的玩家主要还是技术爱好者。

毕竟在colab上排队申请gpu、运行代码训练ai,时不时还要处理一下报错,门槛还是有点高了。

直到dream by wombo的出现,改变了一切。

ai作画开始被认真对待

实际上,这几年已经浮现出不少让ai作画的技术工具。

最早是谷歌在2015年推出的deepdream。

后来,除了前面提到的以外,还有英伟达的gaugan、openai的dall·e,开源的disco diffusion等。

凭借着独一无二还惊艳众人的特点,ai作画影响到的圈层也越来越广泛,比较典型的有美术圈、艺术收藏圈以及nft领域。

首先来看美术圈,他们接触更多的是disco diffusion。

这款ai用扩散模型代替了gan,生成图像的质量更高,几乎达到了原画级。

尽管要在colab上自己运行代码,门槛不低,但还是大受欢迎,甚至出现了专门收集提示词的共享文档。

知乎上最近也有一个与之相关的热门话题。

ai绘画会对美术行业产生什么样的影响呢?

在这个讨论中,大部分人都觉得,ai对当下美术圈的影响还比较有限。

但是未来呢?大家的观点不尽相同。

有人认为ai可以成为创作者的辅助工具;有人却觉得ai能直接取代画师。

知乎答主@画画的花噎菜认为,ai绘画依旧淘汰不了绘画行业。

往远了说,照相机没有淘汰写实油画;往近了说3d辅助也没有淘汰写实数绘。……如果你还是怕被抢了饭碗,那不妨让自己画得好一点。因为不论什么行业,高端的市场都是最难被淘汰的。

@鱼一般也觉得,ai将会是专业画师手中一个很好的工具,可以提供很多灵感,也可以当做底稿使用。

@liuuzaki虽然也赞同ai在想象力上是长板,但他认为,ai有一天会取代与之工作方式相似的从业者。

ai并不擅长逻辑,只擅长美感。它是天生的艺术家,而不是工程师。

这种工作方式很像现在的一些美术工作者。

而如果再把目光延伸到艺术收藏圈来看,ai作画在这几年已经带来了一些肉眼可见的影响。

2018年,一幅由ai创作出的肖像画在纽约佳士得拍卖会上以43.2万美元成交。

这一价格也是该场拍卖会的最高成交价,甚至超过了同场拍卖的毕加索作品。

这幅画最大的噱头,便是用gan作画所带来的的独一无二性。

one more thing

最后,ai作画还影响到了同样在冲击艺术圈的nft。

此前有人推出了一个平台eponym。

它能够利用ai将文本转化为图画,然后再将这些作品直接铸造到最大的nft市场opensea。

在这个平台上,每个文本只能生成一幅画作。

由它推出第一批nft(3500个),在opensea上一夜售罄。

△eponym生成的作品

关于ai作画将成为nft领域的下一个趋势,也成为最近圈内热议的话题。

实际上,wombo也有进军nft领域的打算。

去年年底,有位网友在推特上向他们发问:

你们是否把用户生成的画作铸造成了nft?

对此官方给出回应:目前还没有铸造,但是正在考虑这一计划!

这事儿,你怎么看呢?

(别忘了在微信公众号后台回复“wombo”,可开盲盒获得随机壁纸~)

ai绘图灵感共享库:https://docs.qq.com/sheet/dwfr0vmpqa3ztbxda

thebigsleep:https://colab.research.google.com/drive/1nccex2mbikoslad_o7iu7na9uskkn5wr

clip+vqgan:https://ljvmiranda921.github.io/notebook/2021/08/11/vqgan-list/

disco diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/disco_diffusion.ipynb

参考链接:

[1]https://www.theglobeandmail.com/business/article-making-it-by-faking-it-how-torontos-wombo-became-canadas-fastest/

[2]https://www.8btc.com/article/6722724

[3]https://artthescience.com/magazine/2022/02/16/features-wombo-dream-and-ai-art-with-salman-shahid/

[4]https://weibo.com/u/5619550614?is_hot=1

[5]https://www.zhihu.com/question/528563685/answer/2447959396

[6]https://www.zhihu.com/question/528563685/answer/2445286621

[7]https://www.zhihu.com/question/528563685/answer/2445279372

看完文章,还可以扫描下面的二维码下载快手极速版领4元红包

快手极速版二维码

快手极速版新人见面礼

除了扫码领红包之外,大家还可以在快手极速版做签到,看视频,做任务,参与抽奖,邀请好友赚钱)。

邀请两个好友奖最高196元,如下图所示:

快手极速版邀请好友奖励

扫描二维码推送至手机访问。

版权声明:本文由34楼发布,如需转载请注明出处。

本文链接:https://www.34l.com/post/13981.html

分享给朋友:

相关文章

2021年创业的话,试试这几个点子行不行

2021年创业的话,试试这几个点子行不行

想要在平淡的生活工作中发现一些好的创业项目还真没那么容易。2019年即将过去一半,那么大家有没有发现什么2019年最新创业点子呢?哪些项目的市场前景以及利润可观呢?下面跟随快马小编一起来看看吧。说不定能够激发你的创业灵感!…

抖音如果让我遇见你而你正当年轻是什么歌曲?

抖音如果让我遇见你而你正当年轻是什么歌曲?

《抖音》短视频平台上有不少老歌经过翻唱火了,可能刚好歌词传递的情感引起了网友们的共鸣,而最近比较火的一首歌歌词大概是如果让我遇见你而你正当年轻,好多网友不知道首是什么歌曲?小编刚开始也不知道,后来经过搜索得知这是一首老歌《怨苍天变了心》,是…

抖音传话筒项目(傻瓜式复制粘贴轻松月入3000+)

抖音传话筒项目(傻瓜式复制粘贴轻松月入3000+)

可能你觉得你写不出优秀的文案,可能你觉得你没办法配音,可能你觉得不好意思露脸,但又想通过抖音来赚钱,那么今天给大家来说说这个抖音传话筒项目,只需要复制粘贴,一个月轻松赚到3000+,无需露脸配音,更加不需要写文案。…

引流文案微信推广(微商引流推广文案模板)

引流文案微信推广(微商引流推广文案模板)

大家好啊!今天又跟大家分享小技巧啦~往下看↓↓↓ 首先说一下什么样的文案是引流型的?实际上,一句话是将公共域流量定向到您的私有域流量池。其目的是先引流然后慢慢进行信任激活变现。 在标题方面,通常有以下几种类型,今天为大家详细描述一下。 一…

抖音长视频怎么开通?抖音开通长视频的权限分享

抖音长视频怎么开通?抖音开通长视频的权限分享

经常玩抖音的朋友来说开通抖音1分钟长视频已经不是一件难事了。大家都知道抖音默认视频长度为15秒。只有达到一定要求才可以获得长视频权限。但是现在我们发现能发抖音长视频的朋友越来越多了。他们是怎么做到的呢?抖音怎么发长1分钟视频呢?抖音长视频是…

这家带有ESG基因的SaaS公司,如何定义未来的服装行业?

这家带有ESG基因的SaaS公司,如何定义未来的服装行业?

编者按:本文转自GGV纪源资本,创业邦经授权转载。 随着新一轮科技革命和产业变革,服装行业进行数智化转型升级已经成为了行业共识,但是多数企业对服装智能制造转型升级系统性认识不足,传统大批量流水线的生产方式无法满足市场“多款式”、“小批量”、…