你是否也遇過這些情況?
面對大數據時代的來臨,卻不懂如何分析商業資料?
面對大數據時代的來臨,如何善用免費R語進行資料分析與資料視覺化技術,建置企業智慧服務應用,從大數據之中找出潛在樣式或偵測出異常特性,以做為企業組織策略發展、尋求突破與企業創新服務,將是企業衝量經營績效與提升競爭力的重要基礎。
本課程採用開放原始碼的R語言、免費RStudio軟體為工具。課程先從R語言與RStudio軟體簡介與安裝開始。第二部分是學習R的資料物件操作,包括一維向量的操作、二維矩陣、Excel操作類似的資料框與處理大型資料高效能運算串列資料,掌握資料物件的操作也可打好資料分析之基礎。第三部分是透過資料分析流程簡介與資料分析的【關鍵八步】並將分析結果匯出成文字檔或Excel檔案。
最後部分,強化資料視覺化的應用,使用基礎graphics套件與進階ggplot2套件等套件進行資料視覺化,進而發現數值背後隱藏的潛在樣式(Patterns)、找出重要關鍵項目或異常值(Outliers)與未來發展趨勢(Trends)。
誰需要這門課程?
-
準備使用R語言進行大數據分析與視覺化應用的規劃與執行人員
-
想了解大數據資料分析的標準流程與關鍵八步(匯入、摘要、樞紐、篩選、排序、NA值、轉換、合併)
-
想使用ggplot2視覺化套件技術,進行人力資源績效評估
-
想使用關聯規則視覺化技術,找出商品最佳銷售組合
-
想突破Excel軟體104萬餘筆的限制,提升自我R語言實務應用,建立企業運算思維能力
-
想培養第二專長R語言作為資料分析與視覺化應用的產官學人員
-
想學習R語言並作為未來學習其他大數據程式語言的基礎
為什麼要學R?
也許,你會問「我明明學過Python了,為什麼還要多花時間學習R。」沒錯,在統計學中,Pythone與R為最受歡迎的軟體,前者主要是因為語法益於理理解⽽而被接受, 但後者優勢則是由⼤大量量統計學家研發套件、並有強⼤視覺化的功能易易於做商業分析與預判⽽而受市場肯定,此外,R也是Google和Facebook主要招聘條件之一。
R的優點
商界應用廣泛:許多大企業都要求的基本能力
最強的視覺化:將統計觀念視覺呈現,最容易作出預判與商業分析
強大學術地位:由全球統計學家研發的軟體,將學術引入實務,開發最適商業模型
各行業皆通用:現多利用數據與初級統計學概念做推論,R語言就是因統計而產生
適合商業應用:包含涵蓋廣泛主題的套件,如計量量經濟學,金融學和時間序列
學習目的
面對大數據時代的來臨,如何善用免費R語進行資料分析與資料視覺化技術,建置企業智慧服務應用,從大數據之中找出潛在樣式或偵測出異常特性,以做為企業組織策略發展、尋求突破與企業創新服務,將是企業衝量經營績效與提升競爭力的重要基礎。
本課程採用開放原始碼的R語言、免費RStudio軟體為工具。課程先從R語言與RStudio軟體簡介與安裝開始。第二部分是學習R的資料物件操作,包括一維向量的操作、二維矩陣、Excel操作類似的資料框與處理大型資料高效能運算串列資料,掌握資料物件的操作也可打好資料分析之基礎。第三部分是透過資料分析流程簡介與資料分析的【關鍵八步】並將分析結果匯出成文字檔或Excel檔案。
最後部分,強化資料視覺化的應用,使用基礎graphics套件與進階ggplot2套件等套件進行資料視覺化,進而發現數值背後隱藏的潛在樣式(Patterns)、找出重要關鍵項目或異常值(Outliers)與未來發展趨勢(Trends)。
課程目標
-
鼓勵學員使用R語言做為大數據分析的基礎運用工具
-
學員會使用開放資料或產銷人發財資料,進行企業資料分析與視覺化應用
-
學員具備日期時間資料處理技能
-
提供學員針對銷售資料須進行資料分析與視覺化應用,理解產品與客戶之潛在服務價值
-
提供學員針對人力資源與教育訓練資料進行資料分析與視覺化應用,找出潛在樣式,提供輔助企業決策方案
課程大綱
-
1
第1章 R,RStudio簡介與套件使用
-
2
第2章 認識資料物件
-
3
第3章 資料處理與分析
-
4
第4章 資料視覺化應用
-
5
舊版討論區備份
-
1-1 理解R語言下載、安裝與操作 (11:05) 免費試聽 1-2 熟悉RStudio下載、安裝與操作 (15:05) 1-3 四十套件簡介與安裝 (17:40) 1-4 函數功能查詢 (12:09) 1-5 條件判斷if使用 (9:49) 1-6 迴圈for/while使用 (8:32) 1-7 自行撰寫函數與撰寫風格 (14:04) 第一章課堂範例下載 -
2-1 常用四大資料型態 (6:20) 2-2 一維向量與因子資料物件 (13:11) 2-3 二維矩陣與高維度陣列資料物件 (8:30) 2-4 資料框資料物件 (7:22) 2-5 串列資料物件 (6:13) 2-6 時間序列資料物件 (6:17) 2-7 日期資料處理 (9:31) 2-8 好用的日期時間資料處理zoo, xts套件 (18:54) 第二章課堂範例下載 -
3-1 資料分析流程 (3:58) 3-2 開放資料下載 (9:46) 3-3 資料匯入至R與高效能data.table套件 (16:33) 3-4 資料摘要分析 (9:31) 3-5 資料樞紐分析 (12:16) 3-6 如何進行條件式篩選 (4:29) 3-7 資料排序 (5:35) 3-8 找出NA值與遺漏值處理 (8:32) 3-9 資料轉換 (15:56) 3-10 資料合併 (6:04) 3-11 使用dplyr套件,加速資料處理 (14:18) 3-12 將R資料匯出為CSV/Excel檔案 (19:05) 3-13 練習案例1:人力資源績效評估 (8:24) 第三章課堂範例下載 -
4-1 資料視覺化簡介 (13:48) 4-2 基礎繪圖環境graphics套件 (23:13) 4-3 圖形文法繪圖ggplot2套件 (10:06) 4-4 社會網路圖igraph套件 (14:56) 4-5 地圖應用maps套件 (10:58) 4-6 地理圖資檔shp應用 (18:52) 4-7 樹狀圖(dendrogram)應用 (7:21) 4-8 相關係數視覺化應用 (5:03) 4-9 關聯規則視覺化應用 (15:26) 4-10 練習案例2:銷售資料分析 (27:32) 第四章課堂範例下載 -
舊版討論區備份
課程介紹
第1章 R,RStudio簡介與套件使用
1-1 理解R語言下載、安裝與操作
1-2 熟悉RStudio下載、安裝與操作
1-3 四十套件簡介與安裝
1-4 函數功能查詢
1-5 條件判斷if使用
1-6 迴圈for/while使用
1-7 自行撰寫函數與撰寫風格
第2章 認識資料物件
2-1 常用四大資料型態
2-2 一維向量與因子資料物件
2-3 二維矩陣與高維度陣列資料物件
2-4 資料框資料物件
2-5 串列資料物件
2-6 時間序列資料物件
2-7 日期資料處理
2-8 好用的日期時間資料處理zoo, xts套件
第3章 資料處理與分析
3-1 資料分析流程
3-2 開放資料下載
3-3 資料匯入至R與高效能data.table套件
3-4 資料摘要分析
3-5 資料樞紐分析
3-6 如何進行條件式篩選
3-7 資料排序
3-8 找出NA值與遺漏值處理
3-9 資料轉換
3-10 資料合併
3-11 使用dplyr套件,加速資料處理
3-12 將R資料匯出為CSV/Excel檔案
3-13 練習案例1:人力資源績效評估
第4章 資料視覺化應用
4-1 資料視覺化簡介
4-2 基礎繪圖環境graphics套件
4-3 圖形文法繪圖ggplot2套件
4-4 社會網路圖igraph套件
4-5 地圖應用maps套件
4-6 地理圖資檔shp應用
4-7 樹狀圖(dendrogram)應用
4-8 相關係數視覺化應用
4-9 關聯規則視覺化應用
4-10 練習案例2:銷售資料分析
課程學習地圖
授課講師
-
中華R軟體學會常務理事
李 明昌
李明昌博士擅長於R/Python/Julia/SQL等語言程式設計與應用、資料視覺化、機器學習、統計品管與最佳化等研究方法與應用。不但在國內外知名期刊發表其研究成果,更多次擔任International Journal of Production Research、Transactions on Fuzzy Systems、Journal of the Operational Research Society、International Journal of Advanced Manufacturing Technology、Journal of Cleaner Production等SCI期刊評審委員。為了讓莘莘學子多加認識R等語言及應用,除了擔任教育部補助技專院校研究計畫的R語言程式設計講師,更積極到國內外各大專院校、資策會、工業技術研究院、國家發展委員會、中央氣象局、公平交易委員會、各縣市政府與日本名古屋產業大學等公民營單位演講,在R語言的研究應用方面,更是不遺餘力。
RWEPA網站:http://rwepa.blogspot.com/