• 資料科學與R語言
  • 1 R語言101
    • 1.1 什麼是R語言
    • 1.2 函數使用
    • 1.3 變數設定
    • 1.4 執行視窗
    • 1.5 資料型態
      • 1.5.1 數值 numeric
      • 1.5.2 字串 character
      • 1.5.3 布林變數 logic
      • 1.5.4 日期 (Date)
    • 1.6 基本運算子
      • 1.6.1 數學基本運算
      • 1.6.2 邏輯運算
    • 1.7 錯誤訊息
    • 1.8 Help
  • 2 R 資料結構
    • 2.1 向量 vector
      • 2.1.1 快速產生向量函數
      • 2.1.2 向量運算
    • 2.2 因子 factor
    • 2.3 列表 list
      • 2.3.1 列表資料擷取
      • 2.3.2 列表資料編輯設定
    • 2.4 矩陣 matrix
    • 2.5 資料框 data.frame
    • 2.6 資料表 data.table
    • 2.7 資料屬性查詢函數
  • 3 控制流程
    • 3.1 條件判斷
      • 3.1.1 if-else敘述
      • 3.1.2 if-else if-else
  • 4 函數
    • 4.1 為什麼需要函數
    • 4.2 函數組成
    • 4.3 函數命名原則
    • 4.4 函數範例
    • 4.5 函式編程Functional programming
    • 4.6 purrr
    • 4.7 map2 family
    • 4.8 參考資料
  • 5 資料讀取與匯出
    • 5.0.1 純文字資料 (無分隔)
    • 5.0.2 其他讀檔注意事項
    • 5.0.3 API (Application programming interfaces)
    • 5.0.4 XML 可延伸標記式語言
    • 5.0.5 網頁爬蟲 Webscraping
    • 5.1 Facebook資料擷取
      • 5.1.1 Graph API in R
      • 5.1.2 Rfacebook package
    • 5.2 資料匯出
      • 5.2.1 文字檔 .txt
      • 5.2.2 CSV檔 .csv
      • 5.2.3 R物件 .rds
  • 6 資料處理與清洗
    • 6.1 Tidy Data
    • 6.2 資料型別轉換處理
      • 6.2.1 資料型別檢查
      • 6.2.2 資料型別轉換
    • 6.3 文字字串處理
      • 6.3.1 基本處理
      • 6.3.2 搜尋字串
      • 6.3.3 正規表示式 (Regular Expression)
    • 6.4 子集Subset
      • 6.4.1 一維資料 (向量)
      • 6.4.2 二維資料
    • 6.5 排序
      • 6.5.1 sort 向量排序
      • 6.5.2 order
    • 6.6 資料組合
    • 6.7 資料結合 (Join)
    • 6.8 長表與寬表
    • 6.9 遺漏值處理
    • 6.10 綜合練習範例Case study
      • 6.10.1 載入資料
      • 6.10.2 資料總覽
      • 6.10.3 資料預覽
      • 6.10.4 資料排序後篩選
      • 6.10.5 欄位值篩選
      • 6.10.6 字串條件搜尋後篩選
  • 7 探索式資料分析
    • 7.1 什麼是探索式資料分析
    • 7.2 data.table
      • 7.2.1 i 觀察值篩選邏輯
      • 7.2.2 j 欄位選擇運算
      • 7.2.3 by 分組依據
      • 7.2.4 參考文件與資源
    • 7.3 dplyr
      • 7.3.1 select()
      • 7.3.2 filter()
      • 7.3.3 mutate()
      • 7.3.4 summarise()
      • 7.3.5 group_by()
      • 7.3.6 arrange()
      • 7.3.7 rename()
      • 7.3.8 參考文件與資源
  • 8 資料視覺化
    • 8.1 資料視覺化的目的
    • 8.2 ggplot2簡介
      • 8.2.1 qplot()
      • 8.2.2 ggplot()
    • 8.3 ggplot2+地圖
      • 8.3.1 Choropleth map面量圖
      • 8.3.2 ggmap()
    • 8.4 Taiwan的面量圖
      • 8.4.1 ggmap+面量圖
    • 8.5 Treemap
    • 8.6 參考文件與資源
  • 9 互動式資料呈現
    • 9.1 ggvis
    • 9.2 Plot.ly
    • 9.3 Shiny簡介
  • 10 資料探勘
    • 10.1 什麼是資料探勘
    • 10.2 Regression 迴歸
      • 10.2.1 Linear Regression 線性迴歸
      • 10.2.2 Logistic Regression 羅吉斯迴歸
      • 10.2.3 最佳模型篩選
    • 10.3 Decision Trees 決策樹
    • 10.4 Clustering 分群
      • 10.4.1 Hierarchical clustering 階層式分群
      • 10.4.2 K-means clustering
    • 10.5 Association Rules 關聯式規則
    • 10.6 Open Source Packages
      • 10.6.1 Prophet
      • 10.6.2 TensorFlow
      • 10.6.3 MXNet
    • 10.7 模型驗證
      • 10.7.1 Regression 迴歸驗證
      • 10.7.2 Logistic Regression 邏輯迴歸驗證
      • 10.7.3 Decision Trees 決策樹驗證
    • 10.8 Case Study
    • 10.9 參考資料
  • 11 從小數據到大數據分析
    • 11.1 R + Hadoop
    • 11.2 RHadoop安裝測試流程 (Cloudera)
      • 11.2.1 系統/軟體版本資訊
      • 11.2.2 參考資料
      • 11.2.3 安裝步驟
      • 11.2.4 測試前,先解決權限問題
      • 11.2.5 測試
      • 11.2.6 安裝RStudio Server
    • 11.3 RHadoop MapReduce: easy word count
    • 11.4 R + Spark
  • 12 軟體安裝介紹
    • 12.1 R安裝
    • 12.2 RStudio安裝
    • 12.3 RStudio使用簡介
      • 12.3.1 專案
      • 12.3.2 RStudio介面
  • 13 教學影片資訊
    • 13.1 教學影片頻道連結
    • 13.2 完整版播放清單
    • 13.3 速成版播放清單
  • 作者資訊
  • References
  • Published with bookdown

資料科學與R語言

13 教學影片資訊

13.1 教學影片頻道連結

資料科學與R語言 YouTube頻道

13.2 完整版播放清單

  1. R 101 & GitHub 101 - [資料科學與R語言]
  2. 資料結構 - [資料科學與R語言]
  3. 控制流程 - [資料科學與R語言]
  4. 資料讀取與匯出 - [資料科學與R語言]
  5. 資料處理與清洗 - [資料科學與R語言]
  6. 探索式資料分析 - [資料科學與R語言]
  7. 資料視覺化 - [資料科學與R語言]
  8. 資料探勘 - [資料科學與R語言]
  9. R Function and Package [資料科學與R語言]

13.3 速成版播放清單

  1. R101與條件判斷 [R資料科學速成]
  2. 資料結構 [R資料科學速成]
  3. 資料匯入與匯出 [R資料科學速成]
  4. 資料處理與清洗 [R資料科學速成]
  5. 資料結合 [R資料科學速成]
  6. 探索式資料分析 [R資料科學速成]