- +1
文本一鍵生成圖像?OpenAI發(fā)布新模型,吳恩達前來點贊
過去的2020年,人工智能研究組織OpenAI打造的1750億參數(shù)文本生成器GPT-3火爆全球。用它撰寫的博客文章成功欺騙了很多人類讀者。不少業(yè)內(nèi)人士認為,GPT-3對AI行業(yè)具有顛覆力量??梢钥吹?,自然語言處理的神經(jīng)網(wǎng)絡(luò)規(guī)模越來越大,功能也越來越豐富。
當?shù)貢r間2021年1月5日,OpenAI又放出大招,在官方博客公布最新人工智能神經(jīng)網(wǎng)絡(luò)“DALL·E”。OpenAI稱其可以通過自然語言文本直接生成對應(yīng)圖像,意味著“通過語言文字操縱視覺概念現(xiàn)在已經(jīng)觸手可及?!?/p>
OpenAI 的這項最新成果引來不少AI大牛的關(guān)注。Coursera 創(chuàng)始人、斯坦福大學(xué)教授吳恩達就在社交媒體表示祝賀,還選出一則他認為“非??帷钡腛penAI文字生成圖像示例——由AI生成的藍色襯衫搭配黑色長褲圖像。

吳恩達對OpenAI表示祝賀。
據(jù)OpenAI介紹,DALL·E基于120億參數(shù)版本的GPT-3模型,使用文本-圖像對的數(shù)據(jù)集,能夠通過文字描述生成圖像。OpenAI研究人員發(fā)現(xiàn),DALL·E有一系列不同功能,例如創(chuàng)建動物或物體的擬人化版本、以合理的方式組合不相關(guān)的概念、文字渲染以及對已有圖像進行變換等等。
“DALL·E”的名字來自藝術(shù)家薩爾瓦多·達利(Salvador Dali )和皮克斯的機器人WALL-E。

從文本“穿著芭蕾舞裙的蘿卜寶寶在遛狗”生成的圖像。
在他們給出的第一批示例里,文本“穿著芭蕾舞裙的蘿卜寶寶在遛狗”被擬人化地呈現(xiàn)在圖像上。類似的例子還有“一只模仿烏龜?shù)拈L頸鹿”、“一杯被戀愛沖昏頭腦的波霸奶茶”等。從這些案例中,研究人員發(fā)現(xiàn),DALL·E能夠?qū)⑷祟惢顒雍鸵挛?,甚至情緒遷移到動物和無生命物體上。

由文字生成的長頸鹿和奶茶圖像
DALL·E的第二個功能是以合理的方式組合不相關(guān)的概念。譬如,“一把牛油果形狀的扶手椅”,這一天馬行空的描述,也被DALL·E以看似合理的方式呈現(xiàn)在圖像中。

從文本“一把牛油果形狀的扶手椅”生成的圖像。
第三大功能更為實用——文字渲染。研究人員發(fā)現(xiàn),DALL·E能夠在圖像中呈現(xiàn)文字,并使文字的字體風(fēng)格適應(yīng)周圍環(huán)境。不過,這類功能只能在少量字符下使用,輸入的字數(shù)越多,成功率越低。

從文本“一家門前寫有‘OPENAI’的商店”生成的圖像。
除了以上這些功能,DALL·E還可以對動物照片進行多種圖像變換。下圖就是它為同一只(不存在的)貓畫的多幅草圖。

從文本“上面一排一樣的貓,下面是它們的草圖” 生成的圖像。
2020年6月,Open AI發(fā)布大型生成式語言模型GPT-3,全稱Generative Pre-training Transformer-3。通過對不同的書面材料集與長篇連載文本的預(yù)訓(xùn)練,GPT-3獲取了大量知識,有 1750 億參數(shù),遠超此前類似語言模型,參數(shù)量較2019年2月發(fā)布的GPT-2高兩個數(shù)量級。
自發(fā)布之日起,GPT-3因強大功能和令人驚嘆的測試結(jié)果備受關(guān)注。它可以實現(xiàn)的功能包括:輸入一句自然語言后,模型自動完成編程;對模型描述一種病癥,它可以指出是什么疾病并開出藥方;甚至詢問一些關(guān)于人生信仰的問題,模型也可以做出回答。
從專注文本任務(wù)的GPT-3到最新的DALL·E,OpenAI表示:GPT-3證明了語言可以指導(dǎo)大型神經(jīng)網(wǎng)絡(luò)執(zhí)行各種文本生成任務(wù);而Image GPT表明,同樣類型的神經(jīng)網(wǎng)絡(luò)也可以用來生成高保真的圖像?!斑@些發(fā)現(xiàn)說明,通過語言文字操縱視覺概念現(xiàn)在已經(jīng)觸手可及。”
OpenAI成立于2015年,是一家以研發(fā)通用人工智能為目標的公司。公司官網(wǎng)稱,其使命是確保通用人工智能(AGI),即一種高度自主且在大多數(shù)具有經(jīng)濟價值的工作上超越人類的系統(tǒng),將為全人類帶來福祉。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




