400-888-5228

課程長度:

48課時

 

培訓(xùn)目的:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

課程將介紹數(shù)據(jù)挖掘原理、SPSS Modeler數(shù)據(jù)挖掘軟件的基本操作和環(huán)境;學(xué)習(xí)如何使用SPSS Modeler讀取,處理數(shù)據(jù)

目的

培訓(xùn)人員能夠掌握數(shù)據(jù)挖掘理論和常用的建模技術(shù)、掌握機器學(xué)習(xí)的常見技術(shù),比如神經(jīng)網(wǎng)絡(luò)、決策樹等,并將其應(yīng)用到具體業(yè)務(wù)操作中

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

課程基于SAS工具進行數(shù)據(jù)分析和挖掘

目標(biāo):

將各種類型的數(shù)據(jù)讀入SAS數(shù)據(jù)集中

對SAS數(shù)據(jù)集進行校驗和清洗

創(chuàng)建SAS變量和數(shù)據(jù)子集

合并SAS數(shù)據(jù)集

創(chuàng)建增強列表和總結(jié)報表

 

第三部分 ?R語言實戰(zhàn)

R語言作為一種數(shù)據(jù)分析專業(yè)語言,是當(dāng)今數(shù)據(jù)科學(xué)領(lǐng)域最流行的開源編程語言之一,在數(shù)據(jù)分析與機器學(xué)習(xí)領(lǐng)域已經(jīng)成為一款最重要的工具。精通R語言的數(shù)據(jù)分析師是企業(yè)競相爭搶的高薪人才。

R語言實戰(zhàn)課程采用MBA式的案例教學(xué),結(jié)合統(tǒng)計理論,建模方法論、R語言編程和老師的豐富實際項目經(jīng)驗,力求讓每一個學(xué)生都能夠把學(xué)到的知識運用到實際工作中去。我們精選的案例是目前企業(yè)真實場景下應(yīng)用很廣泛的場景,集合了互聯(lián)網(wǎng)用戶分析、精準(zhǔn)營銷、風(fēng)險評估、BI設(shè)計與實施等領(lǐng)域的數(shù)據(jù)挖掘?qū)嵗瑢δ鷱氖抡嬲臄?shù)據(jù)分析工作有針對性的指導(dǎo)與幫助。

 

目標(biāo):

  1. 深度學(xué)習(xí)R語言和數(shù)據(jù)挖掘的前沿算法
  2. 理解企業(yè)真實業(yè)務(wù)場景的建模流程
  3. 熟練使用R語言進行建模和實操
  4. 成為有多種技能并能融會貫通的復(fù)合型數(shù)據(jù)分析人才

培訓(xùn)大綱:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

  • 數(shù)據(jù)挖掘簡介
  • CRISP-DM方法論
  • SPSS Modeler簡介
  • SPSS Modeler的C/S架構(gòu)和界面介紹
  • SPSS Modeler可視化程序的使用基礎(chǔ)
  • 讀取數(shù)據(jù)文件
  • SPSS Modeler可以讀取的數(shù)據(jù)格式
  • 讀取文本數(shù)據(jù)與查看數(shù)據(jù)、SPSS數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)(SDAP)
  • SPSS Modeler中的字段類型、字段方向
  • 保存SPSS Modeler流
  • 數(shù)據(jù)理解---數(shù)據(jù)質(zhì)量評估
  • 數(shù)據(jù)理解
  • 缺失值定義
  • 數(shù)據(jù)審核節(jié)點介紹
  • 分布圖節(jié)點----初步理解字符型字段的分
  • 直方圖/統(tǒng)計節(jié)點----初步理解數(shù)值型字段的分布
  • 簡單數(shù)據(jù)整理
  • Clem語言簡介
  • 選擇節(jié)點,過濾節(jié)點和導(dǎo)出節(jié)點介紹
  • 自動生成操作節(jié)點
  • 尋找數(shù)據(jù)中的關(guān)系
  • 矩陣節(jié)點、網(wǎng)絡(luò)圖節(jié)點、統(tǒng)計節(jié)點、散點圖節(jié)點、直方圖節(jié)點
  • SPSS Modeler中的數(shù)據(jù)建模技術(shù)
  • 神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納模型、模型比較
  • 聚類分析、關(guān)聯(lián)規(guī)則、序列檢測

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

  • Base SAS基礎(chǔ)
  • SAS 系統(tǒng)簡介
  • 啟動SAS 軟件
  • SAS 窗口環(huán)境
  • SAS 文件和邏輯庫
  • 一個簡單的SAS 程序
  • 讀取外部數(shù)據(jù)到SAS數(shù)據(jù)集
  • SAS 編程基本概念
  • 通過DATA 步讀取數(shù)據(jù)
  • 通過IMPORT 過程讀取外部文件數(shù)據(jù)
  • 訪問關(guān)系型數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)
  • SAS 程序錯誤及處理
  • 對單個數(shù)據(jù)集的處理
  • 選取部分變量
  • 操作數(shù)據(jù)集的觀測
  • 創(chuàng)建新變量
  • 循環(huán)和數(shù)組
  • SAS常用函數(shù)
  • 將數(shù)據(jù)集寫出到外部文件
  • 對多個數(shù)據(jù)集的處理
  • 數(shù)據(jù)集的縱向串接
  • 數(shù)據(jù)集的橫向合并
  • 數(shù)據(jù)集的更新
  • 數(shù)據(jù)匯總和展示
  • 通過PRINT過程制作報表
  • 通過TABULATE過程制作匯總報表
  • 通過GPLOT過程制作圖形
  • 通過GCHART過程制作圖形
  • ODS輸出傳送系統(tǒng)
  • 案例解析:PRINT過程操作實例
  • 案例解析:匯總報表實例
  • 案例解析:GPLOT過程制作圖形編程操作
  • 案例解析:GCHART過程繪制圖形編程操作
  • 描述性統(tǒng)計分析
  • 基本概念
  • 描述性統(tǒng)計量
  • MEANS過程的補充
  • 案例解析:利用MEANS過程求各種統(tǒng)計量
  • 案例解析:利用UNIVARIATE過程求各種統(tǒng)計量
  • 案例解析: 頻數(shù)表的生成實例
  • 參數(shù)估計與假設(shè)檢驗
  • 參數(shù)估計
  • 假設(shè)檢驗
  • 非參數(shù)假設(shè)檢驗
  • 分別擬合假設(shè)檢驗
  • 案例解析:TTEST過程的實例數(shù)據(jù)分析
  • 案例解析:總體均值檢驗
  • 案例解析:實驗數(shù)據(jù)的配對T檢驗
  • 案例解析:數(shù)據(jù)比例的顯著性檢驗
  • 案例解析:樣本數(shù)據(jù)的正態(tài)性檢驗實例
  • 回歸分析
  • 變量關(guān)系探索
  • 線性回歸
  • 自變量間的共線性診斷
  • 案例解析:某大型服裝連鎖機構(gòu)門店收入相關(guān)數(shù)據(jù)分析
  • 案例解析:分析可支配收入和消費性支出之間的關(guān)系
  • 案例解析:利用線性回歸分析學(xué)生肺活量及有關(guān)變量的關(guān)系
  • 方差分析
  • 方差分析的基本原理
  • 單因素試驗的方差分析
  • 顯著因素下的水平間差異檢驗
  • 雙因素試驗的方差分析
  • 案例解析:分析四種止痛藥效果之間是否有明顯差異
  • 案例解析:分析三種飼料的營養(yǎng)價值之間有無顯著性差別
  • 案例解析:分析不同實驗室試制的紙張光滑度有無差異
  • 主成分分析與因子分析
  • 主成分分析概述
  • 使用SAS 實現(xiàn)主成分分析
  • 因子分析概述
  • 使用SAS 實現(xiàn)因子分析
  • 案例解析:我國某年經(jīng)濟發(fā)展情況的主成分分析
  • 案例解析:中國房地產(chǎn)經(jīng)濟區(qū)的研究分析
  • 聚類分析和判別分析
  • 聚類分析的概述
  • 劃分法與層次法
  • 判別分析概述
  • 判別分析在SAS中的實現(xiàn)
  • 案例解析:聚類分析在客戶定位中的應(yīng)用研究
  • 案例解析:變量聚類在多指標(biāo)系統(tǒng)評價中的應(yīng)用
  • 案例解析:基于判別分析法的上市公司財務(wù)分析研究
  • LOGISTIC回歸分析
  • 基本原理
  • 運用LOGISTIC過程擬合模型
  • LOGISTIC過程的其他語句
  • 建立模型
  • 案例解析:LOGISTIC回歸用于上市公司ST預(yù)測

 

  • SAS數(shù)據(jù)挖掘流程
  • SAS 數(shù)據(jù)挖掘概述
  • 確定業(yè)務(wù)問題和數(shù)據(jù)準(zhǔn)備
  • 數(shù)據(jù)抽樣、探索與加工
  • 數(shù)據(jù)建模
  • 案例解析:X公司貸款業(yè)務(wù)案例分析
  • 案例解析:關(guān)聯(lián)規(guī)則與購物籃問題分析
  • 案例解析對股票交易數(shù)據(jù)進行聚類分析
  • 案例解析:信用風(fēng)險評分卡的開發(fā)與應(yīng)用

 

第三部分 ?R語言實戰(zhàn)

1.1、數(shù)據(jù)結(jié)構(gòu)概述

1.2、向量

1.3、因子

1.4、矩陣

1.5、數(shù)據(jù)框

1.6、列表和函數(shù)

1.7、向量化計算和apply

2.1、線性回歸的思想

2.2、回歸結(jié)果的檢查

2.3、決定系數(shù) 預(yù)測 和多元線性回歸

2.4、一元線性回歸演示

2.5、多項式回歸演示

2.6、殘差分析演示

2.7、多元線性回歸演示

3.1、關(guān)聯(lián)規(guī)則介紹

3.2、關(guān)聯(lián)規(guī)則演示

4.1、決策樹介紹C4.5

4.2、幾種分類算法介紹

4.3、評價模型準(zhǔn)確性