R語言一日上手! 27萬筆數據揭奧運秘辛

發佈日期: 2020-02-18
【校園記者李璨宇採訪報導】想不到透過大數據,可以看出奧運的得獎趨勢!有鑑於「數據分析」成為就業市場的熱門關鍵字,國立中山大學管理學院建置軟硬體兼備、全台管院少有的大數據分析平台。為向民眾進一步推廣商業數據分析,在教育部「智慧創新跨域人才培育聯盟計劃」的協助下,日前舉辦「2020商業智慧日體驗營」,開設大數據分析入門課程,吸引全台19所高中職、90名學生共襄盛舉。活動中讓首度接觸大數據的學生學習使用R程式語言,在一日之內完成數個小程式,並分析超過27萬筆奧運資料,進行分組競賽。

奧運資料中包括運動員性別、獎牌數量等,多達27種參數,學生需從中找出特別的現象,才能脫穎而出。奪得第一名的組別,對於「是不是越富有的國家,越容易在奧運中獲獎?」感到好奇,於是透過R語言將資訊「視覺化」,把冰冷的數字轉變為可互動的統計圖表,從中意外發現GDP高低和獎牌數,其實沒有明確的正相關,打破一般人常有的迷思。被問到處理時間跨度長達120年的資料,對初學者不會太困難嗎?獲獎的三民高中學生黃猷珵表示,自己與組員均缺乏程式背景,但R語言有許多前人製作好的套件(Package),只需輸入一行指令,便能執行複雜的運算,讓初學者能快速上手。

此次活動資訊公開後,僅4天內,便收到超過100件申請表單,報名人數爆滿。平鎮高中學生彭羿莛遠從桃園而來,她表示,數據分析能力是未來求職的一大優勢,因此特地南下參加。活動指導老師、中山大學資訊管理學系助理教授卓雍然也在受訪時強調,在數位化時代,即使非資訊背景學生,也需要具備數據分析能力,《哈佛商業評論》報導也指出「數據分析師是21世紀最性感的職業」。

卓雍然坦言,靠自己寫程式難以一日速成,因此他特別強調,初學程式時,加入「社群」非常重要。無論是高中或大學生,透過同學間的交流,才能持之以恆、教學相長。這次活動由管院碩士班學生教導高中生,並透過分組競賽相互砥礪,「中山大學的學生也可以藉由選修大數據分析相關微學程,達到相同效果。」

中山管院目前架設「商業大數據平台」,非資訊背景學生若有興趣學習數據分析,可線上收看課程錄影,或參考網站推薦的自學資源。有專業學術研究需求者,學校亦擁有全台管院少有的高階運算工具,包括大數據運算和人工智慧深度學習主機等硬體設備及相關的程式範本,可節省師生租用設備、自行完成程式的經費與時間。

(公共事務組編修)