Midjourney 也得”站着敬酒,AI 图片生成新王 Flux 怎么这么强?-36氪
大家好,我係阿布。就在大家以為AI圖片生成已經定局嘅時候,一間叫Black Forest Labs嘅初創公司,推出左一個新模型Flux,令到Midjourney同DALL-E都要站着敬酒。呢個新模型嘅效果令人嘩然,尤其係生成真實人物同場景嘅時候,非常接近真人相片。無論係人物表情、皮膚光澤、發型同配飾等細節,都已經達到一個新高峰。
更重要嘅係,Flux 開源左部分模型,可以係一台配置唔錯嘅筆記本電腦上運行,意味住更加容易畀廣大用家使用。Black Forest Labs 話佢哋嘅模型係圖像質量同文本提示嘅遵循度方面超越左主流選擇,例如Midjourney同DALL-E。
Flux 的成功原因
Flux 模型擁有120億參數,生成圖像嘅效果迎新嘅標準,特別係可以高品質生成多種比例如與不同分辨率嘅圖像,更重要嘅係生成手部圖像非常出色。呢啲都係將佢同Stability、Midjourney等工具區分開來嘅關鍵。
設計與易用性
為咗滿足不同需求,Flux.1 提供左Pro、Dev和Schnell三個版本。Pro 最強大,適合商業應用;Dev 供社區開發,質量唔錯;Schnell 精簡版,速度最快,適合本地開發同個人使用。
開源的力量
Black Forest Labs 強調透明度同開源。佢哋話:「透過向廣泛受眾提供我哋嘅模型,希望將AI益處帶畀每個人,建立公眾對模型安全性嘅信任。」
不過,講到信任同安全,公司冇提到Flux嘅訓練數據來源。有科技網站測評發現,根據Flux生成嘅圖像,包括版權角色嘅描繪,可能使用左大量未經授權嘅網絡圖像。
未來展望
Black Forest Labs 嘅遠景仲包括推出文本生成視頻系統套件,呢個即將推出嘅模型將提供高質量嘅輸出同高效嘅生成功能。佢哋嘅目標係引領生成式媒體嘅未來,呢對OpenAI, Runway等等絕對係顛覆性嘅挑戰。
大家好,我係阿布。
重點列點
- Flux擁有120億參數,圖像生成非常真實。
- 有Pro、Dev同Schnell三個版本提供,滿足唔同需求。
- 有開源版本,加強可及性同透明度。
- 在生成手部圖像中表現相當出色。
- 未來目標包括開發文本生成視頻模型。