信息摘要:
由于深度學習在計算機視覺領域得到了非常好的效果,做上下料機器人的自然也會嘗試把 DL 用到上下料機器人的物體識別中。
由于深度學習在計算機視覺領域得到了非常好的效果,做上下料機器人的自然也會嘗試把 DL 用到上下料機器人的物體識別中。
首先,對于物體識別,這個就可以照搬 DL 的研究成果了,各種 CNN 拿過來用就好了。在 2016 年的『亞馬遜抓取大賽』中,很多隊伍都采用了 DL 作為物體識別算法。
然而, 在這個比賽中,雖然很多人采用 DL 進行物體識別,但在物體位姿估計方面都還是使用比較簡單、或者傳統的算法。似乎并未廣泛采用 DL。這里一般是采用 semantic segmentation network 在彩色圖像上進行物體分割,之后,將分割出的部分點云與物體 3D 模型進行 ICP 匹配。
當然,直接用神經網絡做位姿估計的工作也是有的,如這篇:
Doumanoglou, Andreas, et al. "Recovering 6d object pose and predicting next-best-view in the crowd." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.
它的方法大概是這樣:對于一個物體,取很多小塊 RGB-D 數據(只關心一個patch,用局部特征可以應對遮擋);每小塊有一個坐標(相對于物體坐標系);然后,首先用一個自編碼器對數據進行降維;之后,用將降維后的特征用于訓練Hough Forest。