圖片來源:VentureBeat,使用BFL Playground生成

由Stable Diffusion熱門模型創(chuàng)造者創(chuàng)立的初創(chuàng)公司Black Forest Labs(BFL)近日推出了名為FLUX.1 Kontext的新圖像生成模型。該模型不僅能生成和編輯照片,還允許用戶通過文字和其他圖像進(jìn)行修改。

該公司還宣布推出全新的BFL Playground平臺(tái),用戶可在企業(yè)應(yīng)用前先行體驗(yàn)BFL的模型。

BFL發(fā)布了該模型的兩個(gè)版本:FLUX.1 Kontext [pro]和FLUX.1 Kontext [max]。第三個(gè)版本FLUX.1 Kontext [dev]將作為私有測(cè)試版發(fā)布。Pro和Max版本現(xiàn)已登陸KreaAI、Freepik、Lightricks、OpenArt和LeonardoAI等平臺(tái),助力企業(yè)創(chuàng)意團(tuán)隊(duì)和開發(fā)者實(shí)現(xiàn)精準(zhǔn)高效的圖像編輯。

FLUX.1 Kontext支持上下文生成技術(shù),意味著模型可根據(jù)提供的參考素材或場(chǎng)景進(jìn)行創(chuàng)作,而非完全從零開始生成。

該公司在X平臺(tái)的推文中指出Kontext的四大特性:

角色一致性:跨場(chǎng)景保持元素連貫

局部編輯:精準(zhǔn)修改特定區(qū)域不影響整體

風(fēng)格參考:基于現(xiàn)有風(fēng)格生成場(chǎng)景

極低延遲

開發(fā)者可通過BFL Playground測(cè)試用例并體驗(yàn)?zāi)P停俳尤胪暾鸅FL API。

Pro與Max版本解析

企業(yè)用戶可使用Pro版本進(jìn)行快速迭代編輯。該版本支持文字與參考圖像雙重輸入及局部修改。BFL表示Kontext [pro]的運(yùn)行速度"比現(xiàn)有先進(jìn)模型快一個(gè)數(shù)量級(jí)",且是首批支持多輪編輯的模型之一。

FLUX.1 Kontext [max]則是性能更強(qiáng)的極速版本,在保持響應(yīng)速度的同時(shí),能更精準(zhǔn)遵循指令、優(yōu)化文字可讀性并確保編輯一致性。

當(dāng)前市場(chǎng)上,MidJourney的AI圖像編輯器和Adobe Firefly等工具同樣支持基于參考圖的區(qū)域編輯功能。

FLUX.1 Kontext [dev]作為該系列第三個(gè)版本,是參數(shù)達(dá)120億的開源權(quán)重模型。

生成式流技術(shù)

BFL表示FLUX.1 Kontext采用流模型架構(gòu),使其能更靈活完成上述任務(wù)。這種模型通過持續(xù)數(shù)據(jù)流學(xué)習(xí),在噪聲數(shù)據(jù)與有效信息間建立路徑,不同于Stability AI、MidJourney乃至OpenAI Sora等采用的"去噪"擴(kuò)散模型。

BFL在博客中強(qiáng)調(diào):"FLUX.1 Kontext突破了文生圖局限。相較于僅支持純文本生成的流模型,它能理解現(xiàn)有圖像并據(jù)此創(chuàng)作。用戶通過簡(jiǎn)單文字指令即可修改輸入圖像,無需復(fù)雜調(diào)參或編輯流程。"

在文生圖基準(zhǔn)測(cè)試中,BFL宣稱FLUX.1 Kontext在美學(xué)表現(xiàn)、指令遵循、真實(shí)感及文字處理方面均可媲美主流模型。

市場(chǎng)反響

BFL去年十月已發(fā)布文生圖模型Flux 1.1 Pro及配套API。目前通過BFL Playground體驗(yàn)Kontext模型的用戶反饋積極。

當(dāng)然,該模型仍需與持續(xù)迭代的成熟圖像生成工具展開競(jìng)爭(zhēng)。

精選文章:

Z世代希望AI發(fā)揮其實(shí)用性,而非噱頭

諾曼·福斯特:如何成就建筑史上最輝煌的職業(yè)生涯

首爾攝影藝術(shù)博物館啟幕:以扭曲動(dòng)感立面重塑城市景觀

AI虛擬網(wǎng)紅正在重塑Z世代的消費(fèi)選擇

埃及創(chuàng)意人為何集體回歸書法藝術(shù)?