圖片來源:VentureBeat,使用BFL Playground生成
由Stable Diffusion熱門模型創(chuàng)造者創(chuàng)立的初創(chuàng)公司Black Forest Labs(BFL)近日推出了名為FLUX.1 Kontext的新圖像生成模型。該模型不僅能生成和編輯照片,還允許用戶通過文字和其他圖像進(jìn)行修改。
該公司還宣布推出全新的BFL Playground平臺(tái),用戶可在企業(yè)應(yīng)用前先行體驗(yàn)BFL的模型。
BFL發(fā)布了該模型的兩個(gè)版本:FLUX.1 Kontext [pro]和FLUX.1 Kontext [max]。第三個(gè)版本FLUX.1 Kontext [dev]將作為私有測(cè)試版發(fā)布。Pro和Max版本現(xiàn)已登陸KreaAI、Freepik、Lightricks、OpenArt和LeonardoAI等平臺(tái),助力企業(yè)創(chuàng)意團(tuán)隊(duì)和開發(fā)者實(shí)現(xiàn)精準(zhǔn)高效的圖像編輯。
FLUX.1 Kontext支持上下文生成技術(shù),意味著模型可根據(jù)提供的參考素材或場(chǎng)景進(jìn)行創(chuàng)作,而非完全從零開始生成。
該公司在X平臺(tái)的推文中指出Kontext的四大特性:
角色一致性:跨場(chǎng)景保持元素連貫
局部編輯:精準(zhǔn)修改特定區(qū)域不影響整體
風(fēng)格參考:基于現(xiàn)有風(fēng)格生成場(chǎng)景
極低延遲
開發(fā)者可通過BFL Playground測(cè)試用例并體驗(yàn)?zāi)P停俳尤胪暾鸅FL API。
Pro與Max版本解析
企業(yè)用戶可使用Pro版本進(jìn)行快速迭代編輯。該版本支持文字與參考圖像雙重輸入及局部修改。BFL表示Kontext [pro]的運(yùn)行速度"比現(xiàn)有先進(jìn)模型快一個(gè)數(shù)量級(jí)",且是首批支持多輪編輯的模型之一。
FLUX.1 Kontext [max]則是性能更強(qiáng)的極速版本,在保持響應(yīng)速度的同時(shí),能更精準(zhǔn)遵循指令、優(yōu)化文字可讀性并確保編輯一致性。
當(dāng)前市場(chǎng)上,MidJourney的AI圖像編輯器和Adobe Firefly等工具同樣支持基于參考圖的區(qū)域編輯功能。
FLUX.1 Kontext [dev]作為該系列第三個(gè)版本,是參數(shù)達(dá)120億的開源權(quán)重模型。
生成式流技術(shù)
BFL表示FLUX.1 Kontext采用流模型架構(gòu),使其能更靈活完成上述任務(wù)。這種模型通過持續(xù)數(shù)據(jù)流學(xué)習(xí),在噪聲數(shù)據(jù)與有效信息間建立路徑,不同于Stability AI、MidJourney乃至OpenAI Sora等采用的"去噪"擴(kuò)散模型。
BFL在博客中強(qiáng)調(diào):"FLUX.1 Kontext突破了文生圖局限。相較于僅支持純文本生成的流模型,它能理解現(xiàn)有圖像并據(jù)此創(chuàng)作。用戶通過簡(jiǎn)單文字指令即可修改輸入圖像,無需復(fù)雜調(diào)參或編輯流程。"
在文生圖基準(zhǔn)測(cè)試中,BFL宣稱FLUX.1 Kontext在美學(xué)表現(xiàn)、指令遵循、真實(shí)感及文字處理方面均可媲美主流模型。
市場(chǎng)反響
BFL去年十月已發(fā)布文生圖模型Flux 1.1 Pro及配套API。目前通過BFL Playground體驗(yàn)Kontext模型的用戶反饋積極。
當(dāng)然,該模型仍需與持續(xù)迭代的成熟圖像生成工具展開競(jìng)爭(zhēng)。
精選文章: