2015年1月19日 星期一

DSP資料科學冬令營@NCCU-Day1

前言


這應該是我開始寫非技術筆記後,第一次寫有關於生活的日記吧!由於之前被室友提醒,生活不只有程式碼吧 XD,你還有生活啊(其實我也沒有多會寫程式QAQ)因此決定以後有什
麼值得紀錄的事情,那就把它記錄下來吧!

What is DSP?


追本朔源的話是由 Code for tomorrow 之前的一個子計畫所延伸而成的一個組織,目的在於讓資料科學這個新領域,經由其組織的倡導及培訓之後,可以有越來越多不只資訊背景的人員參加,而是希望是跨領域的多元組成,如此讓資料科學有更多價值發揮的可能!


Day1課後心得


很高興的可以參與到DSP第一次在學界舉辦的活動,據說之前都是在企業進行培訓課程,而這次特別與ITSA政大社群運算與服務跨校資源中合辦,並在政大社資中心的場地舉行,第一次的合作以跨學科為主,當中不乏資管、應數、新聞、資工、統計等成員,而且大部分都是碩士生,在我的組別裡頭就有兩位新聞碩、兩位資科碩、一位應數系、一位資管系,在討論專案的過程中,因為彼此的專業與觀點不同,有一種前所未有的感覺,大家對於事情的看法都有不同的認知,我想這也是這次的活動用意吧!讓不同領域的意見,對同一個資料,有著不同的見解,進而統整成一個全面完整的提案!

第一天課程主要是讓我們對於資料科學更make sense,DSP講師 - Rafe更花了一個上午,以許多實例使我們對於資料思考(Data Thinking)更加了解。對於資料思考我的體會以流程而言為下:
  1. Ask Right Question - Root Cause
  2. Customer Journey - Represent different touchpoints
  3. Exploratory Data Analysis - Use tools & visualization
在第一部分,強調在於問對問題,在嘗試解決問題之前,確保問題描述是清楚的,也就是在coding與分析前,知道自己要解決什麼問題相當重要,5W1H(甚至是5W2H)方法,下面附贈一句講師引述愛因斯坦,所提過的名言,供大家省思:
If I had an hour to solve a problem and my life depended on it,I would use the first 55 minutes determining the proper questions to ask. - Albert Einstein
在釐清問題點與定義後,必須要確保已經找到所謂的Root cause,也就是最根本或者最重要的問題,尋找的方法稱為Root cause analysis(RCA),當中包含三種常用方法:持續追問法(5 Why's Analysis)、親和力圖(Affinity diagram)、魚骨圖(Fishbone diagram),總之就是期望在發現root cause後避免甚至減少問題的重複發生。

第二部分則是,透過觀察現狀,加上前述的問對問題,在顧客服務流程中,取得確切且對問題解決有幫助的資料,讓分析更加切題且有意義。

最後則是俗稱的 EDA(Exploratory Data Analysis),透過我們平時常用的speadsheet軟體,善用內建的工具與視覺化,幫助我們做分析,透過以上的方式使數據能夠呈現出規律性。

雖然在第一天的課程,並沒有教導R語言的實作與概念,但確實將我們對於資料思考的模式與核心理念,更加強化熟悉。而 DSP 也特別預留一個小時,讓我們每個團隊,運用一天所學,透過三個開放資料,UBike、Weather、房價去想一個專案,並在第四天將它成型,打造MVP(Minimum viable product),討論過程講師群們 CK、Rafe、Alto也都提供他們專業的見解,改善我們的專案方向與提供我們更多資料資源。

總結就是 ... 好期待將下來三天的活動,真的相當充實!

1 則留言: