Flux : AI 圖片生成新王 – LionAI




Midjourney 也得站着敬酒,AI 图片生成新王 Flux 怎么这么强?-36氪

Midjourney 也得”站着敬酒,AI 圖片生成新王 Flux 怎麼這麼強?-36氪

江山代有模型出,一代更比一代強。就當人們以為 AI 圖片生成領域的戰爭已經基本結束時,又有一個新的模型團隊出現,用自家產品將 Midjourney、DALL-E 挑落馬下。

Flux 橫空出世即走紅

8 月初,初創公司 Black Forest Labs 發布了擁有 120 億參數的文本生成圖像模型 Flux,迅速走紅,被譽為 Stable Diffusion 的繼承者,並與 Midjourney 直接對打。從网上曝光的圖片能看出,Flux 在生成人物,尤其是真實人物的場景中,圖像已經非常接近真人實拍的效果。無論是人物的表情、皮膚光澤、發型、人物配飾等細節方面,都做到了接近完美。更重要的是,Flux 開源其系列的一些模型,可以在配置不錯的筆記本電腦上運行,這也意味著它會像 Stable Diffusion 一樣,可以在多模型平台上找到並使用。Black Forest Labs 宣稱,Flux 的模型在圖像質量和對文本提示的遵循度等方面超越了現有的主流選擇如 Midjourney 和 DALL-E。

Flux,橫空出世即走紅

Flux 來自 AI 初創公司 Black Forest Labs,這家新公司由一些開發了 Stable Diffusion 背後技術並發明了潛在擴散技術的研究人員創立,總部位於德國。今年 8 月 1 日,Black Forest Labs 才對外正式宣布成立,迅速打響名聲。他們發布了 Flux.1 文本生成圖像模型套件,稱在圖像細節、提示響應、風格多樣性和場景複雜性方面定義了文本生成圖像的新前沿。Flux.1 提供了三個版本:Pro、Dev 和 Schnell,都是文本生成圖像模型,大小依次遞減。其中,Flux.1 Pro 版是通過 API 提供的閉源版本,提供最先進的圖像生成性能,可以通過 API 註冊訪問,適用於商業應用。Flux.1 Dev 版是開源版本,具有非商業許可,供社區開發,直接從 Pro 版本「蒸餾」而來,據稱有類似的質量和提示響應能力。同時,Flux.1 Schnell 版是速度最快的版本,開源源代碼,適用於本地開發和個人使用。

當前 AI 圖片生成市場的競爭

過去兩年中,在 AI 圖像生成市場,Midjourney、DALL-E 和 Stable Diffusion、Adobe Firefly 等一直在激烈競爭。Black Forest Labs 的 Flux.1 發布距 Stability AI 在 6 月中旬發布的 Stable Diffusion 3 Medium 版本僅七週,該版本遭到廣泛批評。Flux.1 的發布時機對開源 AI 來說具有一定意義。目前市面上至少已經有幾十款 AI 圖像生成器,提供各種選項、功能和風格。這些工具包含 Midjourney、DALL-E、Adobe Firefly 等,但與這些對手相比,Black Forest Labs 的 Flux 與市面上的 AI 圖像生成工具主要不同,在於其開源特性,並且對模型能力和圖像質量的追求。

展望未來

Black Forest Labs 稱,他們已經在開發一個文本生成視頻模型,承諾將提供高質量輸出並以開源形式發布。這意味著未來他們可能將與 OpenAI 的 Sora、Runway 的 Gen-3 Alpha 等產生競爭,Midjourney 也有類似的計劃。

Summary:
大家好,我係阿布。早前,初創公司 Black Forest Labs 推出了全新AI 圖片生成模型Flux,迅速走紅,被譽為新一代的AI 圖片生成王者。在短短時間內,他們憑借其高達120億參數的強大性能,受到了各界關注。Flux不僅可以生成接近真人效果的圖像,而且開源的特性使得它具備了廣泛的應用潛力。開源版本更適合社區開發和個人使用,並且可以在一台配置不錯的筆記本電腦上運行。較於Midjourney 和DALL-E,Flux在圖像質量和對文本提示的遵循度等方面都有明顯優勢。Flux的成功標誌著AI 圖片生成技術的新高峰,未來還可能在視頻生成領域有所突破。大家好,我係阿布。

重點:
– Flux 圖像生成模型憑借120億參數性能迅速走紅
– Flux 提供開源版本,方便社區和個人使用
– 圖像質量和對文本提示的精確度超越現有主流模型
– 未來計劃推出文本生成視頻模型