高新波：異質圖像合成與識別（3）

發布人：深度學習大講堂時間：2020-11-12 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

首先利用貪婪學習算法生成初始的畫像，然后利用照片和畫像，分別使畫像和畫像匹配去尋找K近鄰，基于照片和照片匹配去尋找K近鄰，基于照片和畫像匹配去尋找K近鄰，由于畫像和照片它的高頻分量比較吻合，利用它做先驗知識來選擇一個最佳的K近鄰然后進行合成，最終進行迭代以后仍然可以得到好的結果。

上圖是我們生成的結果。

上圖是我們利用給定風格的畫像（一張），可以將給定的測試照片合成出對應風格的畫像分。

同樣地，對于非人臉圖像的其他圖像來說，也可以生成如給定的人臉圖像風格一樣的畫像來。上圖中分別展示了根據動漫風格、簡單素描、復雜素描風格進行合成的畫像。

當然我們還可以合成不同年齡的人臉。如果小孩走丟的時候是7、8歲，現在已經17、18歲，我們可以根據年齡的遷移合成不同年齡段的畫像。以上主要講的是由照片生成畫像，當然也可以實現由畫像生成照片，因為該過程是可逆的。

接下來是基于概率圖模型的異質圖像合成方法。

基于概率圖模型的方法實際上可以用最大后驗概率的方法尋找k近鄰。當然，最大后驗概率可以分解成最大似然函數和先驗概率的情況。

上圖是我們在2007年的時候提出的嵌入式模型合成方法。把畫像和照片看成是觀測序列，同時存在一個隱含狀態和狀態轉移空間，利用狀態轉移矩陣得到合成模型，然后基于該模型實現畫像或照片的合成。2014年在IJCV上我們對它做了新的解釋，完全可以用最大后驗概率或者概率圖模型進行解釋，這樣我們就把它統一到概率圖模型的框架上去。

09年在PAMI上有上圖所示的王曉剛教授的一個工作，提出了利用馬爾科夫隨機場理論來進行畫像的合成。過去我們生成畫像塊的時候只是利用照片和畫像之間的關系，其實要生成畫像的話，相鄰畫像塊之間也有約束關系，為此提出了嵌入式的馬爾科夫模型。這里面就有兩個似然函數，一個表示畫像和照片之間的關聯性，一個表示畫像塊之間的兼容性。

上圖是香港科技大學學者在CVPR2012提出馬爾科夫加權隨機場模型。在考慮塊和塊之間的關系時，把每一塊又使用k近鄰來表示，變成k近鄰和k近鄰之間的約束關系，同樣分為畫像和照片之間的關系和照片和照片之間的關系。

如上圖所示，馬爾科夫隨機場實際上是找最近鄰，而馬爾科夫加權隨機場實際上是利用k近鄰來合成。

我們在此基礎上又提出上圖所示的新的基于直推式學習的方法。上圖是一個非常簡單的圖模型，這個圖上照片和畫像都只有一個葉節點，由一個共同的根節點來控制，這個節點就是它們加權生成的加權矩陣W。現在如果來一個照片以后如何得到它的畫像呢？過去是訓練好以后再進行處理，現在要把訓練和測試樣本放在一起學習，就變成直推式的學習，這樣我們來推導最大后驗概率。實際上這個最大后驗概率的計算可以基于概率圖模型進行簡化，當給定W的時候兩個葉節點之間相互獨立，可以把模型簡化成上圖中兩個似然函數和一個先驗概率的情況。