Freepik公司推出全新文生圖模型"F Lite",該模型僅采用版權(quán)安全素材訓(xùn)練,旨在成為Midjourney等爭議性生成器的合法替代品,為研究領(lǐng)域提供法律保障。
這款最新生成式AI模型擁有約100億參數(shù),其訓(xùn)練數(shù)據(jù)完全來自Freepik自有圖庫的商業(yè)授權(quán)圖片。據(jù)官方宣稱,F(xiàn) Lite是首個(gè)完全基于"安全內(nèi)容"構(gòu)建的公開可用大規(guī)模模型。
F Lite由Freepik與AI初創(chuàng)公司Fal.ai合作開發(fā),在64塊NVIDIA H100 GPU上歷時(shí)兩月完成訓(xùn)練,所用內(nèi)部數(shù)據(jù)集包含約8000萬張圖片。
隨著Adobe、Getty Images和Shutterstock等公司相繼推出基于合法審核數(shù)據(jù)的圖像生成器,F(xiàn)reepik也加入了這一行列。這場"版權(quán)安全訓(xùn)練集"運(yùn)動(dòng)興起之際,OpenAI和Midjourney等公司正因使用網(wǎng)絡(luò)爬取圖像面臨訴訟浪潮。
與部分競品不同,F(xiàn)reepik將F Lite定位為開發(fā)者可二次開發(fā)的開放模型。GitHub倉庫已公開代碼(需配備24GB顯存GPU運(yùn)行),同時(shí)提供Hugging Face體驗(yàn)版。
人類反饋優(yōu)化圖像質(zhì)量
得益于Freepik圖庫的訓(xùn)練數(shù)據(jù),F(xiàn) Lite在生成插畫和矢量風(fēng)格作品時(shí)表現(xiàn)優(yōu)異。但在處理照片級(jí)寫實(shí)圖像時(shí),該模型仍存在明顯缺陷:皮膚紋理、織物細(xì)節(jié)經(jīng)常缺失,復(fù)雜解剖結(jié)構(gòu)易出現(xiàn)失真。由于主要使用長文本描述訓(xùn)練,模型對(duì)簡短提示詞響應(yīng)不佳,圖像內(nèi)文字渲染仍是當(dāng)前技術(shù)難點(diǎn)。
相同提示詞在Midjourney中生成的圖像具有藝術(shù)質(zhì)感,幾乎看不出AI痕跡 | 圖片來源:THE DECODER測(cè)試生成
公司表示這些局限源于訓(xùn)練數(shù)據(jù)集規(guī)模與算力投入。根據(jù)擴(kuò)散模型的規(guī)模效應(yīng)定律,圖像質(zhì)量與細(xì)節(jié)表現(xiàn)將隨數(shù)據(jù)量和訓(xùn)練時(shí)長顯著提升。
Freepik的素材庫與AI工具布局
這家西班牙公司專注為設(shè)計(jì)師、企業(yè)和創(chuàng)意人士提供授權(quán)數(shù)字素材,其平臺(tái)包含矢量圖、照片、插畫、圖標(biāo)及演示模板等海量資源,部分內(nèi)容可免費(fèi)使用。近年Freepik持續(xù)加碼AI工具研發(fā),已推出自動(dòng)圖像編輯、內(nèi)容生成等功能,如今又新增合成圖像生成服務(wù)。
精選文章:
偉大的認(rèn)知遷移:人工智能如何重塑人類的目的、工作和意義