本文經授權轉載自白鯨出海
作者:趙思堯
2022 年年末,OpenAI 推出 ChatGPT,人們對于 AI 的認知受到巨大沖擊,從此大量資源和資金涌入這個行業。想起前兩個月和做 AI 識別的創業者聊天,他說“AIGC 這一波熱潮,除了激發新一波的創業,更調動起了甲方老板們的積極性,好像自己不擁抱 AIGC,就要下牌桌了一般”。
舉一個比較典型的例子,前段時間,某全球知名化妝品集團“全網”尋找一家體量不大的公司,問到了我們這里來,而打聽一圈下來我們發現,這家服務商好像忙到沒時間回消息。
被“追逐”的主角是 zmo.ai,2020 年成立。成立時間雖短,卻已經獲得不少優質投資機構背書。CrunchBase 顯示,zmo.ai 最近一次融資在 2022 年 5 月,獲得高瓴創投領投的 800 萬美元,紀源資本和金沙江創投也有參與。
而 zmo.ai 被打聽最多的服務就是利用 AI 幫助時尚品牌生成高質量產品圖片。之所以有這么多品牌想積極嘗試 AI 成圖,與商拍成本不低且流程繁瑣直接相關。
一個品牌如果要制作效果不錯且有模特出鏡的產品圖,需要根據風格和主題提前招募挑選模特、預約拍攝地點和設備,拍攝后需要后期處理、挑選、審核圖片,流程上需要幾天到幾周不等。一年中這樣的拍攝可能得有好幾次。
而根據品牌對成片的要求,費用波動也很大。一家提供 AI 商拍工具的企業 weshop.ai 業務負責人吳海波告訴筆者,行業內部有這樣一個大概認知,一個品牌每年在素材準備中的花費大約會在年 GMV 的 2%-5%。如果按照這個區間,一個電商賣家一年的 GMV 如果是 200 萬美元,那么每年在素材上的花費大約會是 4-10 萬美元,也就是 30-70 萬人民幣,其實也是一筆不小的支出。
按道理,一個 AI 生圖的服務,如果成片能夠同等代替原來素材,且訂閱費用低于原來的素材拍攝花費,應該是能在市場上跑通的。事實又是怎樣的呢?zmo.ai 被品牌追捧,是個例還是普遍現象?
于是我們打算從 AI 商拍產品切入,以窺行業一角。
靜態產品圖生成功能已經開卷
筆者測試了 6 款提供 AI 商拍工具的產品,其中 2 款效果不佳,這里不多著筆墨。
多數產品會提供 3 類功能,靜態產品圖生成、真人模特換臉、基于產品/假模生成模特圖。其中靜態產品圖生成功能難度最低,每一款產品在細分功能上都已經做得比較成熟。而假模生成模特圖功能有的暫未開放,有的需要直接聯系銷售或加入候補名單。
生成靜態產品圖功能的使用路徑基本相同,“上傳圖片——摳產品——選擇背景參考模板生成新背景/輸入 prompt 生成新背景”。
筆者在 4 款產品中上傳了相同的“手托酒瓶”圖片。
zmo.ai:
zmo.ai 只支持自動摳圖(自動識別產品邊框后摳圖),因此筆者被迫保留了手的部分,但對于電商賣家來說,這是個挺大的 bug。在生成新背景環節,zmo.ai 提供了 3 個功能,選擇背景模板、輸入 prompt 生成背景、上傳參考背景圖后 zmo.ai 根據參考圖生成類似背景。對比下來,zmo.ai 的可選模板不算多,但根據參考圖變形的功能十分好用。
輸入prompt 生成的產品圖(prompt 大意:身著比基尼的女生躺在沙灘上,身旁的桌上放著產品。//可以看到背后的比基尼女生已經變成了畢加索風格)
參考背景圖(左)和上傳參考背景圖生成的產品圖(右)
在生成圖片后,zmo.ai 支持用戶調節圖片參數,使成圖效果更自然和有質感。
WeShop:
WeShop 會將用戶上傳的原圖分為多個色塊,用戶可以勾選想要保留的區域,或者上傳一張蒙版圖。雖然色塊被切割得很細,但筆者在只勾選酒瓶部分后,生成的圖片里還是會看到原圖手部的影子。了解后得知,是 WeShop 為了讓生成圖中商品與背景融合得更好,在 AI 生成時會以原背景作為生成基礎,在筆者測試 WeShop 的真人圖和人臺圖時也會發現相同的情況,這里建議 WeShop 上線一個摳圖后清除背景的功能,更加方便用戶使用~
在生成新背景步驟,WeShop 也提供 3 個功能,背景模板、輸入 prompt 生成背景、高級自定義。前 2 個功能與 zmo.ai 類似。高級自定義功能則是讓用戶輸入正反向咒語,也就是背景圖中希望出現的元素和不希望出現的元素,通過正反向咒語讓 WeShop 更快生成符合用戶期待的圖片。
輸入 prompt 生成的圖片 輸入正反向咒語生成的圖片(反向prompt:sea,希望成圖中有沙灘但沒有海)
xiangji.ai:
在筆者看來,摳圖這一步做得最好的是 xiangji.ai,因為 xiangji.ai 在智能摳圖外支持精細摳圖,通過原圖上描點的方式選定保留或去除的部分,在 4 個工具的試用過程中,只有用 xiangji.ai 生成的圖片完全看不到原圖手部的影子。
這里有兩個點值得說一下,首先對于商用來說,賣家在拍產品圖的時候,大概會降低“手”這類影響元素,所以是否能手動摳圖可能并不是特別一個嚴重的問題。
另外,其實很多修圖 App 的摳圖功能,已經能做到和 xiangji.ai 同等水平、甚至更好。
在背景生成環節,用戶可以通過選擇模板并添加線稿圖(即選擇添加希望出現的元素)來控制背景生成,此外也可以調節圖片參數,讓成圖效果更好。
強行修改 prompt 內容后生成的圖片沒有出現爆米花每選擇一個模板或線稿圖元素(類似于一朵花),prompt 輸入框中就會自動加入標簽。筆者雖然可以強硬修改標簽內容,例如我將“優雅餐具在側”改寫成“爆米花在側”,但系統似乎并不會執行改變后的指令,所以 xiangji.ai 的場景融繪框大概率只起到展示用戶選擇的內容的作用,并不支持輸入 prompt 生成背景。
nolibox.com:
nolibox.com 的靜態產品圖生成功能基本融合了上述 3 款產品的功能,支持選擇背景模板、輸入 prompt 生成背景,可以像 zmo.ai 一樣 2 張圖變形后合成新圖、調整圖片參數,也可以像 xiangji.ai 一樣添加線稿元素。
產品與背景合成后成圖(左)和選擇背景模板并添加線稿后成圖(右)
不難看出,在靜態產品圖生成這一功能上,由于操作步驟大差不差,服務商們已經開始在細節上做文章,這就要看誰更能洞察到電商從業者們的細節需求了。
而事實上,廠商要做出生成靜態產品圖這樣的功能,門檻似乎也不在技術層面。
從產生 idea到第一版產品落地只需 1 個月
為了弄清 AI To 電商的應用現狀,我們聯系到了 WeShop 的負責人吳海波,吳海波告訴筆者,“要推出底層模型需要足夠的人力和資金,所以你看到這些廠商會是 OpenAI、Midjourney。而多數廠商并沒有能力搭建模型,包括我們。WeShop 的團隊不到 20 人,所以我們采用了擁抱開源的方式”。
WeShop 現階段采用了開源的 Stable Diffusion(以下簡稱 SD)作為底層模型。從底層模型到 WeShop 1.0 版本只需要兩步走。
吳海波介紹,“2022 年 10 月的時候 Stability AI 推出了 SD 1.5 版本,之后其實也陸續推出了幾個新的版本,但大家都認為不及 1.5 版本好用。是因為 GitHub 社區中有大量的人才已經基于 SD 1.5、針對不同場景優化出了更好用的模型。SD 1.5 的生態是非常豐富的,你基本可以在社區上找到任何能想到的針對某一特定功能優化過的新模型,比如優化人像、比如提升動漫效果”。
WeShop 團隊已經明確了要做 AI 商拍圖的目標,因此可以很輕易地確定需要優化的功能,并在社區中找到在這一分支上優于 SD 1.5 的最好的模型(check point)。“而只要是基于 SD 1.5 的模型,經過測試和調參,就可以很好地 mix。這是我們的第一步,產品類似于一個縫合怪,但耗時非常短”。
而即便是站在人才們的肩膀上做縫合,也還只是一個普適的產品,無法完全滿足電商需求。例如,利用 AI 生成圖片過程中,成圖和原圖如果出現服裝紋理、材質的變化,在學術上是被允許的,但在電商領域,就變成了貨不對版的嚴重錯誤。要讓產品符合電商從業者的需求,還需要做進一步優化。
吳海波介紹,“SD 1.5 的底層模型是基于 20 億圖片訓練出來的,我們在第二階段則是用了 20 億的百分之幾的數據量級去對模型做了微調”。
筆者對技術一竅不通,聽到幾十倍的數據投喂量級差距,首先會覺得太少了。對此吳海波解釋,“投喂的數據自然是越多越好,但挑選數據、打標和審核需要很長時間,要先保證數據質量”。
WeShop 被投喂的數據基本來自蘑菇街近年在電商領域積累到的圖片,例如運營社區時從賣家處獲得的圖片、從簽約的 KOL 處獲得的圖片、在國內外收集到的全品類產品圖等等。這些前期準備也使 WeShop 的落地時間控制在了 1 個多月,大概比真正從 0-1 的廠商用時會短一些。
不過再怎么看,這項生意的技術壁壘都不算高。更早起步,通過不斷投喂優質數據、以及用戶交互之后帶來的技術迭代和功能優化,可能是這場競賽中比較重要的一環。
吳海波從做產品的角度,則認為“在 AIGC 應用層面的創業,技術甚至不是最重要的,最重要的是對產業需求的理解。互聯網行業就有非常多的例子,比如說算法推薦不是字節發明的,但是字節系的產品把這項技術與內容產業結合到了極致。WeShop 是切商拍場景的工具,對這個需求的洞察源于過去 12 年蘑菇街在電商領域的積累。我們了解商家需要什么樣的商拍圖、甚至我們可以教那些中小商家怎么用 WeShop 把商品圖做得比原來更好,這些對產業的理解倒推我們在非常多的細節上去滿足客戶的需求。所以這波 AI 創業,真正的競爭壁壘在于去滿足用戶甚至自己都沒意識到的需求,把每一個細節做到極致”。
不論是從上面的初步測試結果、還是產品的研發周期,都會發現,大家的確是都在跑步入場,平臺功能現階段可能并不完善,市面上的同類產品也是如此。在模特換臉圖和假模生圖功能上,這種功能不成熟更加明顯。
模特圖生成功能:缺乏絕對強者
由于 xiangji.ai 和 nolibox.com 的模特換臉功能無法體驗,筆者只測試了 zmo.ai 和 WeShop。
筆者上傳了冷臉女孩展示黑色 T-恤的圖片。
在選定變化區域后,zmo.ai 直接讓用戶通過輸入 prompt 自由發揮,但出圖效果很不錯。
WeShop 則進一步降低了用戶的使用門檻,用戶可以從模板中選擇人種和場景快速成圖。
而對從業者最友好的則是筆者測試期間 WeShop 新推出的“復刻任務”功能,用戶可以直接將已經完成的任務用在新任務上。有了這個功能,商家可以制作同個模特不同姿勢角度的組圖。不過吳海波告訴筆者,盡管這一直是賣家們呼聲很高的功能,但因為人臉固定存在隱私及版權風險,因此直到現在才推出。“我們團隊近期剛剛通過技術方案解決這個問題,即限制用戶只能使用 WeShop 生成的人臉固定模特面容,無法使用外部肖像。這樣能規避肖像隱私問題和肖像版權問題。”
復制任務操作界面
復制任務生成的圖片
從靜態產品圖到模特換臉再到基于產品生成模特圖,難度逐層加高。目前 zmo.ai 和 nolibox.com 的 AI 時尚模特功能無法直接體驗,因此筆者只測試了 WeShop。
準確地來說,WeShop 需要用戶上傳產品的人臺圖(真人比例的假人模特穿上產品的圖片)。筆者嘗試上傳了一套女裝和一套男裝的人臺圖,生成的圖片效果不太穩定,有時會出現服裝與產品不符(男裝)或 AI 模特的身體部位不真實的情況,需要多試幾次,才會有效果不錯的成圖出現。
WeShop 生成的效果不好
(肩帶變形)(上)與效果好(下)
由于沒有更多測試對象,因此在模特圖生成功能對比上可能存在偏頗,但僅從現有的產品出圖效果可以看出,這一功能還有很多地方亟待加強。不過,即便是當前不夠成熟的產品,也已經有用戶能夠有效用起來了。
AI 商拍圖工具涌現,首先最大化利用的是中小出海賣家
“現在市場利好的一面是,所有人都對 AI 充滿熱情,所以樂于嘗試的從業者不少,包括一些體量很大的國內和出海品牌都會來咨詢”,吳海波透露。
一位了解不少服裝出海品牌的從業者 Bruce 也說,“一些企業其實缺少一個既懂業務、又了解 AI 的高管,這導致它們雖然急著結合 AI,但不知道具體怎么做,所以市面上出現一個什么產品就會去先了解一下,獲得一些思路”。
而大企業要真正融合 AI 產品并不是容易的事,已經將市面上這些 AI 商拍圖產品用于業務中的主要用戶其實并非大廠。
吳海波告訴筆者,“結合 WeShop 現在的產品力,我們發現,將 WeShop 利用得最好的人群有 2 類,一類是做跨境的中小賣家,另一類是國內位于經銷鏈路起點的檔口賣家,后者所占的比例最近明顯上升”。
進一步具象這些人群時,吳海波解釋道“體量小的跨境賣家,機動性反而高。且對于年 GMV 幾百萬元的賣家,他的 SKU 不會很多,每個月花費 298 元購買基礎套餐就足夠了,并不需要付出很大的成本。
國內市場的電商鏈路更成熟,相關服務成本更低,所以目標市場在國內的這部分賣家他們在選購 AI 商拍圖產品時其實更看重生圖效果,價格反而不是首要考慮因素了。為了滿足用戶需求,我們常常得一天迭代好幾個新版本”。
這里附上各產品的會員價格(從上至下:zmo.ai、weshop.ai 海外、weshop.com 國內、xiangji.ai)(WeShop 國內及海外版本收費不同)
大量的同類產品一起競爭,雖然在功能有些許細微差異下,但疊加并不高的服務價格和當下中國的 SaaS 環境,廠商們依然需要繼續往前探索。而放大視角去看,我們發現上述產品背后的廠商在做的事情并不完全相同。
根據官網介紹,zmo.ai 希望利用 AI 改變內容創作的方式,未來大概率也不會只聚焦于電商。xiangji.ai 本身有象寄翻譯、AI 文案撰寫等矩陣產品,似乎是打算基于 AI 為電商從業者提供更多類型的工具。nolibox.com 目前已經推出了AI 繪畫、AI 商品圖以及智能設計產品,目標用戶看上去和 zmo.ai 交集更大。
關于 WeShop,吳海波則告訴筆者,“AI 不斷進步,我認為未來會有很多公司將 AI 視為自己的員工,發展出新的工作模式。那個時候 AI 和人類員工各自的業務流如何構建和協同就會變成一個亟待解決的問題。WeShop 是我們探索新型工作流的起點”。
在筆者成稿期間,又陸續發現了不少提供類似功能的產品,但距離這一細分領域出現寡頭恐怕還要很久很久。更優的底層模型出現、產品功能和定價模式優化以及企業本身指定的發展方向都可能改變競爭格局,入局者可以做的還有很多。
封面圖源 | 圖蟲創意
(來源:雨果網的朋友們)
以上內容僅代表作者本人觀點,不代表雨果跨境立場!如有關于作品內容、版權或其它問題請于作品發表后的30日內與雨果跨境取得聯系。