本書介紹如何使用R語言完成資料讀取 (檔案、透過API擷取或爬蟲)、資料清洗與處理、探索式資料分析、資料視覺化、互動式資料呈現 (搭配Shiny) 與資料探勘等,並介紹R與Hadoop Ecosystems介接方法。

資料探勘章節尚未完成,epub版本格式微調中。

如要一次安裝所有本書會使用到的套件,可在R內執行以下程式碼:

install.packages("devtools")
devtools::install_github("yijutseng/DataAnalyticsWithRBook")

本書為長庚大學資訊管理學系 大數據分析方法課程教學使用書籍

如果您想修改文字或範例,歡迎透過此連結或是透過GitHub issue提供建議與回饋。

本書程式碼執行環境:

sessionInfo()
## R version 3.3.2 (2016-10-31)
## Platform: x86_64-apple-darwin13.4.0 (64-bit)
## Running under: macOS Sierra 10.12.3
## 
## locale:
## [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] backports_1.0.5 bookdown_0.3.9  magrittr_1.5    rprojroot_1.2  
##  [5] tools_3.3.2     htmltools_0.3.5 rstudioapi_0.6  yaml_2.1.14    
##  [9] Rcpp_0.12.9     stringi_1.1.2   rmarkdown_1.3   knitr_1.15.1   
## [13] stringr_1.1.0   digest_0.6.12   evaluate_0.10

本書使用套件版本:

pkgInfo<-lapply(pkg, packageDescription, fields = c("Package", "Version"))
knitr::kable(data.frame(Package=sapply(pkgInfo, `[[`, 1),
  Version=sapply(pkgInfo, `[[`, 2)))
Package Version
ggplot2 2.2.1
dplyr 0.5.0
lubridate 1.6.0
bit64 0.9-5
bookdown 0.3.9
knitr 1.15.1
rmarkdown 1.3
RCurl 1.95-4.8
data.table 1.10.0
stringr 1.1.0
reshape2 1.4.2
SportsAnalytics 0.2
readr 1.0.0
readxl 0.1.1
jsonlite 1.2
XML 3.98-1.5
Rfacebook 0.6.11
rvest 0.3.2
rgdal 1.2-5
rgeos 0.3-22
maptools 0.8-41
ggmap 2.6.1
choroplethr 3.5.3
choroplethrMaps 1.0.1
WDI 2.4
treemapify 0.2.2
shiny 1.0.0
plotly 4.5.6
ggvis 0.4.3
googleVis 0.6.2
rpart 4.1-10
rpart.plot 2.1.0
fields 8.10
arules 1.5-0
datasets 3.3.2
arulesViz 1.2-0
MASS 7.3-45
caret 6.0-73
purrr 0.2.2
treemap 2.4-1

本著作係採用創用 CC 姓名標示-非商業性-禁止改作 3.0 台灣 授權條款授權。