computer

課程資料

10-701 - Introduction to Machine Learning (PhD)

開課:Pradeep Ravikumar, Ziv Bar-Joseph

修課年度:2018 Fall

這是一門非常數學的課,基本上就是以數學的角度來介紹機器學習這個領域。

一開始先從機率的角度切入,像是介紹一些 Bayesian Estimation; MLE; MAP 等等基本概念。然後就開始介紹各種機器學習模型:kNN; Kernel regression; Linear regression; Regularized, Polynomial, Logistic Regression; Decision Trees; SVM; Neural networks 還有像是 Ensemble Methods 等等。

上面說的比較多是 supervised learning,但也會提到像是 clustering、PCA、ICA 等等非監督或者是特徵轉換的方法。也有說到一些 learning theory 像是 VC-dimension 不過沒有講的非常深入。

最後則會把重點放在 Graphical models,像是 HMM, CRF, Bayesian network,還有講到一點點的 Reinforcement Learning。

上課方式

因為想修這堂的的人非常多,所以筆者只選到線上版的課程。雖然是線上版,不過還是要在上課時間上網看即時的轉播。講者會在上課途中隨機使用 Piazza 舉辦小測驗,用來計算出席分數,雖然即使答錯也有分數,不過筆者還是很認真的聽講並作答。但有些題目真的也有點困難。影片因為會錄下來,所以事後也可以複習。

上課主要就是使用投影片來講解。這學期是兩個老師合開,所以不同的主題會是不同的老師來教。

除此之外還有 recitation sessions,不過筆者通常沒去。而期中期末考前,會有一起解考古題的複習課程。不過實際上考出來的東西跟考古題根本不太一樣。

Piazza 課程討論區,平常有很多學生發問,助教也通常很快回答。作業則是透過 Gradescope 繳交。

考試作業

除了上課時的隨機小測驗有答有分外,還有一次期中考和一次期末考,是開卷考試。但難度算是相當困難。筆者或許是太久沒考試了,所以在期中考考了非常差的成績。幸好其他的部份還能補的上來。

作業的部份有四個,都是數學證明為主,但也有一些小程式。會提供 LaTeX 模板,然後最後要上傳 PDF。

整體來說程式的部份非常簡單不太花時間,但是數學證明就會花掉大量的時間。而且也頗有難度,所以並不容易拿到滿分。實際上筆者覺得這門課算是作業滿重的。

除了考試作業以外,最後還有一個分組 final project,從一些指定的主題當中選擇。筆者是選了 lip reading。Project 的部份感覺只要有花心力就能拿到基本的分數,並不要求做到有研究價值的 novelty。所以其實筆者在這個分組作業上也沒有花太多的心力。主要是要繳交一份報告,以及製作海報並向助教講解自己所做的東西,而不用繳交實際的程式碼。

結語

說起來筆者一直都沒有非常正式與完整的學習機器學習,當初只有在 Coursera 上上過了幾堂課而已,所以這次算是終於完整的複習了一遍基本的概念。感覺在機率性的解釋上終於有了比較好的理解。

有些部份其實覺得台大的機器學習基石技法講的比較詳細和容易理解,尤其是 SVM 的部份,考試前筆者還是用了以上兩個影片來惡補一番概念。

評分上,跟 Machine Translation 機器翻譯比起來,感覺這是一堂很可以拿到 A+ 的課。只是筆者期中考的太差所以其實也沒有拿到。

因為評分的項目非常的多,加上數學證明也很花時間,所以整體上這門課吃掉的時間應該是比 Machine Translation 還多了不少。