英文版: http://cs231n.stanford.edu/2017/syllabus
中文版: http://study.163.com/course/courseMain.htm?courseId=1004697005
計算機視覺演進的經過了三階段 從匹配整個圖片 -> 取特徵匹配 -> 用資料讓機器自行找出規則
一開始是找出整個圖片完全相同的部分 再來是透過找出每個物體不變的特徵,代表為 SIFT 最後則是透過大量資料讓機器自行找出規則 以機器學習為代表
這門課主要以使用 CNN 做圖像分類、物件偵測及圖像摘要為主
CNN 並不是最近才出現的新技術,然而卻在 2011 年才有了重大突破 by Russakovsky et al. arXiv, 2014
其原因是因為 數據 + 計算資源使 深度學習 興起
儘管最近取得了重大進展,然而依然有許多是我們力所未逮的 例如 這張圖片的人物在做啥? 能夠理解立體環境 又或者隨著新興技術如 VR MR AR 等等的出現,會有更多挑戰接二連三的出現
例如我們很難很好的做到如同下面這張圖片的效果
因此我們距離能夠實現深刻理解圖片的 AI 還有一段很長的路要走
因為 數據 + 計算資源使 深度學習 興起,使得目前以 用資料讓機器自行找出規則 較為盛行,且效果也比較好