notes

課程簡介

計算機視覺演進的經過了三階段從匹配整個圖片 -> 取特徵匹配 -> 用資料讓機器自行找出規則

一開始是找出整個圖片完全相同的部分再來是透過找出每個物體不變的特徵，代表為 SIFT SIFT 最後則是透過大量資料讓機器自行找出規則以機器學習為代表

這門課主要以使用 CNN 做圖像分類、物件偵測及圖像摘要為主

CNN 並不是最近才出現的新技術，然而卻在 2011 年才有了重大突破 ImageNet Loss by Russakovsky et al. arXiv, 2014

其原因是因為數據 + 計算資源使深度學習興起

儘管最近取得了重大進展，然而依然有許多是我們力所未逮的例如這張圖片的人物在做啥? 能夠理解立體環境又或者隨著新興技術如 VR MR AR 等等的出現，會有更多挑戰接二連三的出現

例如我們很難很好的做到如同下面這張圖片的效果影像辨識的樹狀圖

因此我們距離能夠實現深刻理解圖片的 AI 還有一段很長的路要走

因為數據 + 計算資源使深度學習興起，使得目前以用資料讓機器自行找出規則較為盛行，且效果也比較好