2015年1月22日 星期四

DSP資料科學冬令營@NCCU-Day4

在 NCCU DSP 資料科學冬令營的最後一天,身體已經習慣了每日早起,並自然反應從忠孝新生到政大的路程,然而不同的是今天是帶著非常非常興奮的心情,因為我非常期待我們小組 - “叫我包租婆” 的專案呈現。


由於前一天我已經將 Rscript 與 PHP 找到介接的方法,因此在撰寫完地址轉經緯度,並計算與最近捷運站之距離功能後,我就早早入睡了,但深知小蜜蜂學長設計網頁介面到深夜,就有點愧疚的感覺 XD

然而在最後一天的整合過程中,我們沒有問到甚麼難關,預測模型組由於兩位強大的組員 - 宗哲與家瑜早早搞定,很早我就已經將 Model 與 PHP介接完成,並帶著輕鬆愜意的節奏在準備下午的報告。

在此來介紹一下我們專案 “叫我包租婆”,其實我們的設計目的很簡單,在於幫助房東訂定租金價格,避免租屋供過於求。而我們的設計流程為下圖:
設計流程
而在選擇預測因素部分,也由新聞所的兩位組員 - 蘊兒及路易斯,透過文獻支持找出了 “影響房價與房租的三個可能因素:住宅特性 、區位特性與總體經濟”,但由於 CPI 在我們資料間並沒有顯著的影響關係,因此我們將此因素移除,然而也因“J-test檢定發現:以【住宅特性】所佔的影響份量最重,超過90%以上”,因此我們的預測模型,所採用的因素大約為住宅特性與區位特性(以捷運站距離為主要因素)。
所採用的住宅特性因素
用R所建立的模型模型完成後,就是搭配為服務啦,採用相當簡易的PHP、Boostrap包裝後,便完成了這個網站服務,並寄宿在小蜜蜂所維護的Server中(據說是偷用XD)!

網頁上線截圖
天下果真沒有不散的宴席,在營隊的四天內,我覺得我好像學習了一學期的課程,不僅資料科學理論與R實作都有擴充外,更重要的是我還認識了一群政大的好朋友,相當感謝 DSP 給予我這個機會,前來學習!在未來希望我能多看看“資料科學”相關議題與文章,並開始動手被資料玩(誤)。

圓滿大結束



沒有留言:

張貼留言