notes

課程簡介

目錄

課程資源

英文版: http://cs231n.stanford.edu/2017/syllabus

中文版: http://study.163.com/course/courseMain.htm?courseId=1004697005

計算機視覺歷史與背景

計算機視覺的三階段

計算機視覺演進的經過了三階段 從匹配整個圖片 -> 取特徵匹配 -> 用資料讓機器自行找出規則

一開始是找出整個圖片完全相同的部分 再來是透過找出每個物體不變的特徵,代表為 SIFT SIFT 最後則是透過大量資料讓機器自行找出規則 以機器學習為代表

課程介紹

這門課主要以使用 CNN 做圖像分類、物件偵測及圖像摘要為主 圖像分類 物件偵測 圖像摘要

CNN 並不是最近才出現的新技術,然而卻在 2011 年才有了重大突破 ImageNet Loss by Russakovsky et al. arXiv, 2014

其原因是因為 數據 + 計算資源使 深度學習 興起

儘管最近取得了重大進展,然而依然有許多是我們力所未逮的 例如 這張圖片的人物在做啥? 能夠理解立體環境 又或者隨著新興技術如 VR MR AR 等等的出現,會有更多挑戰接二連三的出現

例如我們很難很好的做到如同下面這張圖片的效果 影像辨識的樹狀圖

因此我們距離能夠實現深刻理解圖片的 AI 還有一段很長的路要走

推薦書籍

deep learning


本章總結

因為 數據 + 計算資源使 深度學習 興起,使得目前以 用資料讓機器自行找出規則 較為盛行,且效果也比較好