阿里AI技術(shù)專攻服裝局部抄襲現(xiàn)象
【YKK拉鏈行業(yè)新聞】
面前的思路是基于服裝區(qū)域性表達(dá)的檢索模型,對(duì)圖像中的服裝進(jìn)行區(qū)域化的相似性學(xué)習(xí)和度量。該研究效果已被CVPR2020收錄,并被選為Oral論文。
阿里平安圖靈實(shí)驗(yàn)室表示,該工作將用到阿里原創(chuàng)保護(hù)平臺(tái),淘寶、天貓等阿里系電商平臺(tái)上線,提供侵權(quán)檢測能力。
精細(xì)化剽竊魔高一尺,打假道怎么高一丈?
就服裝領(lǐng)域而言,雖然打假一直不時(shí),但盜版剽竊問題依舊普遍存在而且從線上到線下,剽竊手段越來越刁鉆,打假難度逐年提高。目前來看,服裝領(lǐng)域的剽竊只有有三類。
第一類集中在圖片盜用上。盜版者通常未經(jīng)授權(quán),拿正版品牌的商品圖使用或修改使用,無錫ykk拉鏈比方在圖上添加自己店鋪的水印,或進(jìn)行一些圖像處理(反轉(zhuǎn)、縮放、拼接等)
這一類侵權(quán)剽竊利息很低,但很容易被平臺(tái)的圖片檢索系統(tǒng)鎖定,然后快速“治理”
第二類是創(chuàng)意盜用,不良商家直接剽竊原創(chuàng)商家的整體商品設(shè)計(jì)和創(chuàng)意,制作同款或者仿款。
這類侵權(quán)的利息稍高一些,但基于商品整體相似度度量的同款檢索算法,可以對(duì)它進(jìn)行召回和治理。
第三類是盜用是對(duì)服裝的某些局部區(qū)域進(jìn)行修改,像是洗稿,比如改變領(lǐng)口的設(shè)計(jì)款式、或者胸前印花的布局,甚至改變服裝的款型等。
但如下圖所示,仍然是剽竊正版品牌服裝的風(fēng)格和設(shè)計(jì)元素(左側(cè)為正版,右側(cè)為盜版)甚至還當(dāng)做“明星同款”來賣。
這類盜版的利息最高,并不易被傳統(tǒng)的基于商品同款檢索的算法鎖定。通常情況下,電商平臺(tái)只能通過人工審核來發(fā)現(xiàn),打假利息很高。
那有沒有一種方法,能夠讓系統(tǒng)自動(dòng)鎖定此類剽竊現(xiàn)象?這就是阿里平安圖靈實(shí)驗(yàn)室最新研究的方向。
此前,基于屬性感知細(xì)粒度相似度學(xué)習(xí)方法,提出服飾版權(quán)算法來鎖定局部剽竊,被AA A I2020收錄。
現(xiàn)在又提出了一個(gè)新思路,基于服裝區(qū)域性表達(dá)的檢索模型,對(duì)圖像中的服裝進(jìn)行區(qū)域化的相似性學(xué)習(xí)和度量,從而實(shí)現(xiàn)更有效打假。
精確到袖子、領(lǐng)子的盜版服裝圖像”檢索算法
盜版服裝”定義,整體上剽竊原版服裝設(shè)計(jì)和風(fēng)格,并在一兩個(gè)區(qū)域進(jìn)行修改,以逃避現(xiàn)有同款服裝檢索模型篩查的服裝樣本。
算法設(shè)計(jì)上,提出了一種服裝關(guān)鍵點(diǎn)引導(dǎo)的區(qū)域注意力機(jī)制。
首先利用服裝關(guān)鍵點(diǎn)估計(jì)分支來預(yù)測服裝的關(guān)鍵點(diǎn),即分布在服裝圖像各個(gè)關(guān)鍵位置的點(diǎn)位,如領(lǐng)口、袖口、肩部、腋下等。
每類服裝的關(guān)鍵點(diǎn)數(shù)量和分布有一定差異,點(diǎn)數(shù)在每件25-40個(gè)左右。根據(jù)這些關(guān)鍵點(diǎn),算法可對(duì)服裝圖片進(jìn)行多個(gè)區(qū)域的劃分,如領(lǐng)子、袖子、胸部、腰部區(qū)域等。
區(qū)域劃分信息通過基于ROIPool思想的方式引入,一體化的服裝圖像特征被解耦為多個(gè)區(qū)域化的特征表達(dá),以獨(dú)立地進(jìn)行特征相似度的學(xué)習(xí)和度量。
同時(shí),服裝關(guān)鍵點(diǎn)結(jié)合區(qū)域化的表達(dá)可作為一種注意力機(jī)制,引入到圖像檢索網(wǎng)絡(luò)上,關(guān)鍵部位的特征權(quán)重被提升,非關(guān)鍵部位的權(quán)重被削減,以提升模型對(duì)關(guān)鍵部位的判別力。
服裝關(guān)鍵點(diǎn)估計(jì)分支和圖像檢索分支使用相同的HR-Net主干網(wǎng)絡(luò),其多級(jí)并聯(lián)結(jié)構(gòu)在獲取多尺度特征的同時(shí)堅(jiān)持了高分辨率。
損失函數(shù)的選擇上,關(guān)鍵點(diǎn)估計(jì)分支采用了均方差損失函數(shù),
檢索分支采用了區(qū)域化設(shè)計(jì)的Triplet損失函數(shù)。而損失函數(shù)的數(shù)值不再是整個(gè)圖片范圍的特征triplet差值,而是各個(gè)區(qū)域特征差值的累加結(jié)果。
文中方法的框架如下圖所示,網(wǎng)絡(luò)可分為服裝關(guān)鍵點(diǎn)估計(jì)分支和服裝檢索分支,其中檢索網(wǎng)絡(luò)包括同款服裝檢索和盜版服裝檢索兩種輸出形式:
通過對(duì)平臺(tái)侵權(quán)服裝樣本的分析,阿里研究人員發(fā)現(xiàn),不同類別服裝易被盜版的區(qū)域是不一樣的因此只將服裝圖像特征的相似度度量過程解耦是不夠的還需要為每類服裝的多個(gè)區(qū)域設(shè)定差異化的權(quán)值,進(jìn)行加權(quán)的區(qū)域相似性計(jì)算,以召回更多的盜版服裝樣本。
為此,基于平臺(tái)盜版服裝數(shù)據(jù),建立了一個(gè)名為“FashionPlagiarDataset數(shù)據(jù)集,該數(shù)據(jù)集中,每組“原版服裝”queri圖像對(duì)應(yīng)galleri中多個(gè)“盜版服裝”圖像,數(shù)據(jù)覆蓋短袖T恤、長袖上衣、外套、連衣裙四類樣本。
該數(shù)據(jù)集上,對(duì)在Deepfashion2數(shù)據(jù)集上預(yù)訓(xùn)練過的檢索網(wǎng)絡(luò)進(jìn)行FineTune訓(xùn)練,用CoordinAscent算法對(duì)不同服裝類別的各區(qū)域權(quán)值進(jìn)行迭代優(yōu)化,以降低損失函數(shù)數(shù)值。
盜版服裝”檢索訓(xùn)練過程的損失函數(shù),同樣基于Triplet損失函數(shù)設(shè)計(jì)。最終,訓(xùn)練后的盜版檢索網(wǎng)絡(luò)可以基于上圖中的Input服裝圖像召回Output中綠框內(nèi)的盜版服裝樣本。
打假效果怎么樣?不輸、甚至逾越此前SOTA
論文的實(shí)驗(yàn)局部,阿里研究人員首先在FashionPlagiarDataset上對(duì)算法的盜版服裝圖像”檢索能力進(jìn)行了評(píng)估。
除了論文所提出的方法外,還設(shè)定了兩種方法進(jìn)行對(duì)比:一種是激進(jìn)檢索方法,使用相同的backbon網(wǎng)絡(luò)和Triplet損失函數(shù),但是不包括區(qū)域化特征學(xué)習(xí)和表達(dá)機(jī)制;另一種是包括區(qū)域化特征表達(dá)機(jī)制,但是使用非FineTune訓(xùn)練得到區(qū)域權(quán)重,評(píng)價(jià)指標(biāo)為mA P
從表中結(jié)果可以看出,論文所用方法在各個(gè)服裝類別都取得了最佳效果。
除上述“盜版服裝檢索”評(píng)價(jià)實(shí)驗(yàn)外,還在Deepfashion系列數(shù)據(jù)集上進(jìn)行了服裝關(guān)鍵點(diǎn)估計(jì),和同款服裝圖像檢索任務(wù)的實(shí)驗(yàn)。
服裝關(guān)鍵點(diǎn)估計(jì)局部,阿里研究人員在目前復(fù)雜度最高的Deepfashion2數(shù)據(jù)集上進(jìn)行了評(píng)測,與現(xiàn)有Match-RCNN,CPN,Simple-Baselin等方法相比,服裝關(guān)鍵點(diǎn)估計(jì)模型在各個(gè)子集上都取得了最高的mA P結(jié)果:
同款服裝檢索實(shí)驗(yàn)中,選用了FashionNet,Match-RCNN,PCB等方法作為對(duì)比,Deepfashion和Deepfashion2上分別進(jìn)行了實(shí)驗(yàn)。
其中,Deepfashion主要針對(duì)In-shop檢索場景,Deepfashion2則針對(duì)于Consumer-to-shop場景。評(píng)價(jià)指標(biāo)分別為Top-Nrecal和Top-Naccuraci
結(jié)果如下圖所示,阿里的方法在Deepfashion數(shù)據(jù)集上取得了與SOTA 方法相近的效果,Deepfashion2數(shù)據(jù)集上的結(jié)果要明顯優(yōu)于現(xiàn)有baselin方法。
一共有5名研究人員參與了這項(xiàng)研究,分別來自阿里巴巴、浙江工商大學(xué)和 阿里巴巴-浙江大學(xué)前沿技術(shù)聯(lián)合研究中心。
文章第一作者YineLang第二作者YuanHe第三作者FanYang來自阿里平安圖靈實(shí)驗(yàn)室。阿里平安圖靈實(shí)驗(yàn)室負(fù)責(zé)人薛暉,文章的通訊作者。浙江工商大學(xué)JianfengDong也是論文作者之一。
阿里平安圖靈實(shí)驗(yàn)室正式成立于2016年,前身是阿里平安基礎(chǔ)算法團(tuán)隊(duì),主要從事平安與風(fēng)險(xiǎn)方面的AI系統(tǒng)研發(fā),核心技術(shù)包括計(jì)算機(jī)視覺、自然語言處置、生物特征識(shí)別、圖計(jì)算以及異常檢測和分析等,截止到2018年,已申請(qǐng)50多項(xiàng)專利。
- 上一篇:格力擬投10億進(jìn)軍醫(yī)療產(chǎn)業(yè) 2020/3/17
- 下一篇:時(shí)尚行業(yè)受疫情影響最大,整個(gè)行業(yè)在思考如何破局 2020/3/16