資料科學與R語言
1
R語言101
1.1
什麼是R語言
1.2
函數使用
1.3
變數設定
1.4
執行視窗
1.5
資料型態
1.5.1
數值 numeric
1.5.2
字串 character
1.5.3
布林變數 logic
1.5.4
日期 (Date)
1.6
基本運算子
1.6.1
數學基本運算
1.6.2
邏輯運算
1.7
錯誤訊息
1.8
Help
2
R 資料結構
2.1
向量 vector
2.1.1
快速產生向量函數
2.1.2
向量運算
2.2
因子 factor
2.3
列表 list
2.3.1
列表資料擷取
2.3.2
列表資料編輯設定
2.4
矩陣 matrix
2.5
資料框 data.frame
2.6
資料表 data.table
2.7
資料屬性查詢函數
3
控制流程
3.1
條件判斷
3.1.1
if-else敘述
3.1.2
if-else if-else
4
函數
4.1
為什麼需要函數
4.2
函數組成
4.3
函數命名原則
4.4
函數範例
4.5
函式編程Functional programming
4.6
purrr
4.7
map2 family
4.8
參考資料
5
資料讀取與匯出
5.0.1
純文字資料 (無分隔)
5.0.2
其他讀檔注意事項
5.0.3
API (Application programming interfaces)
5.0.4
XML 可延伸標記式語言
5.0.5
網頁爬蟲 Webscraping
5.1
Facebook資料擷取
5.1.1
Graph API in R
5.1.2
Rfacebook package
5.2
資料匯出
5.2.1
文字檔 .txt
5.2.2
CSV檔 .csv
5.2.3
R物件 .rds
6
資料處理與清洗
6.1
Tidy Data
6.2
資料型別轉換處理
6.2.1
資料型別檢查
6.2.2
資料型別轉換
6.3
文字字串處理
6.3.1
基本處理
6.3.2
搜尋字串
6.3.3
正規表示式 (Regular Expression)
6.4
子集Subset
6.4.1
一維資料 (向量)
6.4.2
二維資料
6.5
排序
6.5.1
sort 向量排序
6.5.2
order
6.6
資料組合
6.7
資料結合 (Join)
6.8
長表與寬表
6.9
遺漏值處理
6.10
綜合練習範例Case study
6.10.1
載入資料
6.10.2
資料總覽
6.10.3
資料預覽
6.10.4
資料排序後篩選
6.10.5
欄位值篩選
6.10.6
字串條件搜尋後篩選
7
探索式資料分析
7.1
什麼是探索式資料分析
7.2
data.table
7.2.1
i 觀察值篩選邏輯
7.2.2
j 欄位選擇運算
7.2.3
by 分組依據
7.2.4
參考文件與資源
7.3
dplyr
7.3.1
select()
7.3.2
filter()
7.3.3
mutate()
7.3.4
summarise()
7.3.5
group_by()
7.3.6
arrange()
7.3.7
rename()
7.3.8
參考文件與資源
8
資料視覺化
8.1
資料視覺化的目的
8.2
ggplot2簡介
8.2.1
qplot()
8.2.2
ggplot()
8.3
ggplot2+地圖
8.3.1
Choropleth map面量圖
8.3.2
ggmap()
8.4
Taiwan的面量圖
8.4.1
ggmap+面量圖
8.5
Treemap
8.6
參考文件與資源
9
互動式資料呈現
9.1
ggvis
9.2
Plot.ly
9.3
Shiny簡介
10
資料探勘
10.1
什麼是資料探勘
10.2
Regression 迴歸
10.2.1
Linear Regression 線性迴歸
10.2.2
Logistic Regression 羅吉斯迴歸
10.2.3
最佳模型篩選
10.3
Decision Trees 決策樹
10.4
Clustering 分群
10.4.1
Hierarchical clustering 階層式分群
10.4.2
K-means clustering
10.5
Association Rules 關聯式規則
10.6
Open Source Packages
10.6.1
Prophet
10.6.2
TensorFlow
10.6.3
MXNet
10.7
模型驗證
10.7.1
Regression 迴歸驗證
10.7.2
Logistic Regression 邏輯迴歸驗證
10.7.3
Decision Trees 決策樹驗證
10.8
Case Study
10.9
參考資料
11
從小數據到大數據分析
11.1
R + Hadoop
11.2
RHadoop安裝測試流程 (Cloudera)
11.2.1
系統/軟體版本資訊
11.2.2
參考資料
11.2.3
安裝步驟
11.2.4
測試前,先解決權限問題
11.2.5
測試
11.2.6
安裝RStudio Server
11.3
RHadoop MapReduce: easy word count
11.4
R + Spark
12
軟體安裝介紹
12.1
R安裝
12.2
RStudio安裝
12.3
RStudio使用簡介
12.3.1
專案
12.3.2
RStudio介面
13
教學影片資訊
13.1
教學影片頻道連結
13.2
完整版播放清單
13.3
速成版播放清單
作者資訊
References
Published with bookdown
資料科學與R語言
作者資訊
曾意儒 Yi-Ju Tseng
長庚大學 資訊管理學系
副教授
個人網站
Lab:
數位健康實驗室
歡迎提供
建議與回饋