主講老師: | 傅一航 | |
課時(shí)安排: | 1天/6小時(shí) | |
學(xué)習(xí)費(fèi)用: | 面議 | |
課程預(yù)約: | 隋老師 (微信同號(hào)) | |
課程簡(jiǎn)介: | 本課程的主要目的是,培養(yǎng)學(xué)員的大數(shù)據(jù)意識(shí)和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對(duì)客戶(hù)行為作分析和預(yù)測(cè),提升學(xué)員的數(shù)據(jù)分析綜合能力。 | |
內(nèi)訓(xùn)課程分類(lèi): | 綜合管理 | 人力資源 | 市場(chǎng)營(yíng)銷(xiāo) | 財(cái)務(wù)稅務(wù) | 基層管理 | 中層管理 | 領(lǐng)導(dǎo)力 | 管理溝通 | 薪酬績(jī)效 | 企業(yè)文化 | 團(tuán)隊(duì)管理 | 行政辦公 | 公司治理 | 股權(quán)激勵(lì) | 生產(chǎn)管理 | 采購(gòu)物流 | 項(xiàng)目管理 | 安全管理 | 質(zhì)量管理 | 員工管理 | 班組管理 | 職業(yè)技能 | 互聯(lián)網(wǎng)+ | 新媒體 | TTT培訓(xùn) | 禮儀服務(wù) | 商務(wù)談判 | 演講培訓(xùn) | 宏觀經(jīng)濟(jì) | 趨勢(shì)發(fā)展 | 金融資本 | 商業(yè)模式 | 戰(zhàn)略運(yùn)營(yíng) | 法律風(fēng)險(xiǎn) | 沙盤(pán)模擬 | 國(guó)企改革 | 鄉(xiāng)村振興 | 黨建培訓(xùn) | 保險(xiǎn)培訓(xùn) | 銀行培訓(xùn) | 電信領(lǐng)域 | 房地產(chǎn) | 國(guó)學(xué)智慧 | 心理學(xué) | 情緒管理 | 時(shí)間管理 | 目標(biāo)管理 | 客戶(hù)管理 | 店長(zhǎng)培訓(xùn) | 新能源 | 數(shù)字化轉(zhuǎn)型 | 工業(yè)4.0 | 電力行業(yè) | | |
更新時(shí)間: | 2023-09-01 11:13 |
【課程目標(biāo)】
本課程專(zhuān)注于金融行業(yè)的風(fēng)控模型,面向數(shù)據(jù)分析部等專(zhuān)門(mén)負(fù)責(zé)數(shù)據(jù)分析與建模的人士。
本課程的主要目的是,培養(yǎng)學(xué)員的大數(shù)據(jù)意識(shí)和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對(duì)客戶(hù)行為作分析和預(yù)測(cè),提升學(xué)員的數(shù)據(jù)分析綜合能力。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、 掌握數(shù)據(jù)分析和數(shù)據(jù)建模的基本過(guò)程和步驟
2、 掌握客戶(hù)行為分析中常用的分析方法
3、 掌握業(yè)務(wù)的影響因素分析常用的方法
4、 掌握常用客戶(hù)行為預(yù)測(cè)模型,包括邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、判別分析等等,以及分類(lèi)模型的優(yōu)化
5、 掌握金融行業(yè)信用評(píng)分卡模型,構(gòu)建信用評(píng)分模型
本課程突出數(shù)據(jù)挖掘的實(shí)際應(yīng)用,結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),從實(shí)際問(wèn)題入手,引出相關(guān)知識(shí),進(jìn)行大數(shù)據(jù)的收集與處理;探索數(shù)據(jù)之間的規(guī)律及關(guān)聯(lián)性,幫助學(xué)員掌握系統(tǒng)的數(shù)據(jù)預(yù)處理方法;介紹常用的模型,訓(xùn)練模型,并優(yōu)化模型,以達(dá)到最優(yōu)分析結(jié)果。
【授課時(shí)間】
2-3天時(shí)間(每天6個(gè)小時(shí))
【授課對(duì)象】
風(fēng)險(xiǎn)控制部、業(yè)務(wù)支撐、網(wǎng)絡(luò)中心、IT系統(tǒng)部、數(shù)據(jù)分析部等對(duì)數(shù)據(jù)建模有較高要求的相關(guān)領(lǐng)域人員。
【學(xué)員要求】
1、 每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。
2、 便攜機(jī)中事先安裝好Office Excel 2013版本及以上。
3、 便攜機(jī)中事先安裝好IBM SPSS Statistics v24版本以上軟件。
注:講師可以提供試用版本軟件及分析數(shù)據(jù)源。
【授課方式】
理論精講 + 案例演練 + 實(shí)際業(yè)務(wù)問(wèn)題分析 + SPSS實(shí)際操作
【課程大綱】
問(wèn)題:什么是數(shù)據(jù)思維?大數(shù)據(jù)決策的底層邏輯以及決策依據(jù)是什么?
1、 數(shù)字化五大技術(shù)戰(zhàn)略:ABCDI戰(zhàn)略
? A:人工智能,目的是用機(jī)器模擬人類(lèi)行為
? B:區(qū)塊鏈,構(gòu)建不可篡改的分布記賬系統(tǒng)
? C:云計(jì)算,搭建按需分配的計(jì)算資源平臺(tái)
? D:大數(shù)據(jù),實(shí)現(xiàn)智能化的判斷和決策機(jī)制
? I:物聯(lián)網(wǎng),實(shí)現(xiàn)萬(wàn)物互聯(lián)通信的基礎(chǔ)架構(gòu)
2、 大數(shù)據(jù)的本質(zhì)
? 數(shù)據(jù),是事物發(fā)展和變化過(guò)程中留下的痕跡
? 大數(shù)據(jù)不在于量大,而在于全(多維性)
? 業(yè)務(wù)導(dǎo)向還是技術(shù)導(dǎo)向
3、 大數(shù)據(jù)決策的底層邏輯(即四大核心價(jià)值)
? 探索業(yè)務(wù)規(guī)律,按規(guī)律來(lái)管理決策
案例:客流規(guī)律與排班及最佳營(yíng)銷(xiāo)時(shí)機(jī)
案例:致命交通事故發(fā)生的時(shí)間規(guī)律
? 發(fā)現(xiàn)運(yùn)營(yíng)變化,定短板來(lái)運(yùn)營(yíng)決策
案例:考核周期導(dǎo)致的員工月初懈怠
案例:工序信號(hào)異常監(jiān)測(cè)設(shè)備故障
? 理清要素關(guān)系,找影響因素來(lái)決策
案例:情緒對(duì)于股市漲跌的影響
案例:為何升職反而會(huì)增加離職風(fēng)險(xiǎn)?
? 預(yù)測(cè)未來(lái)趨勢(shì),通過(guò)預(yù)判進(jìn)行決策
案例:惠普預(yù)測(cè)員工離職風(fēng)險(xiǎn)及挽留
案例:保險(xiǎn)公司的車(chē)險(xiǎn)預(yù)測(cè)與個(gè)性化保費(fèi)定價(jià)
4、 大數(shù)據(jù)決策的三個(gè)關(guān)鍵環(huán)節(jié)
? 業(yè)務(wù)數(shù)據(jù)化:將業(yè)務(wù)問(wèn)題轉(zhuǎn)化為數(shù)據(jù)問(wèn)題
? 數(shù)據(jù)信息化:提取數(shù)據(jù)中的業(yè)務(wù)規(guī)律信息
? 信息策略化:基于規(guī)律形成業(yè)務(wù)應(yīng)對(duì)策略
案例:用數(shù)據(jù)來(lái)識(shí)別喜歡賺“差價(jià)”的營(yíng)業(yè)員
1、 數(shù)據(jù)分析的六步曲
2、 步驟1:明確目的,確定分析思路
? 確定分析目的:要解決什么樣的業(yè)務(wù)問(wèn)題
? 確定分析思路:分解業(yè)務(wù)問(wèn)題,構(gòu)建分析框架
3、 步驟2:收集數(shù)據(jù),尋找分析素材
? 明確數(shù)據(jù)范圍
? 確定收集來(lái)源
? 確定收集方法
4、 步驟3:整理數(shù)據(jù),確保數(shù)據(jù)質(zhì)量
? 數(shù)據(jù)質(zhì)量評(píng)估
? 數(shù)據(jù)清洗、數(shù)據(jù)處理和變量處理
? 探索性分析
5、 步驟4:分析數(shù)據(jù),尋找業(yè)務(wù)答案
? 選擇合適的分析方法
? 構(gòu)建合適的分析模型
? 選擇合適的分析工具
6、 步驟5:呈現(xiàn)數(shù),解讀業(yè)務(wù)規(guī)律
? 選擇恰當(dāng)?shù)膱D表
? 選擇合適的可視化工具
? 提煉業(yè)務(wù)含義
7、 步驟6:撰寫(xiě)報(bào)告,形成業(yè)務(wù)策略
? 選擇報(bào)告種類(lèi)
? 完整的報(bào)告結(jié)構(gòu)
演練:產(chǎn)品精準(zhǔn)營(yíng)銷(xiāo)案例分析
? 如何搭建精準(zhǔn)營(yíng)銷(xiāo)分析框架
? 精準(zhǔn)營(yíng)銷(xiāo)分析的過(guò)程和步驟
問(wèn)題:數(shù)據(jù)分析方法的種類(lèi)?分析方法的不同應(yīng)用場(chǎng)景?
1、 業(yè)務(wù)分析的三個(gè)階段
? 現(xiàn)狀分析:通過(guò)企業(yè)運(yùn)營(yíng)指標(biāo)來(lái)發(fā)現(xiàn)規(guī)律及短板
? 原因分析:查找數(shù)據(jù)相關(guān)性,探尋目標(biāo)影響因素
? 預(yù)測(cè)分析:合理配置資源,預(yù)判業(yè)務(wù)未來(lái)的趨勢(shì)
2、 常用的數(shù)據(jù)分析方法種類(lèi)
? 描述性分析法(對(duì)比/分組/結(jié)構(gòu)/趨勢(shì)/交叉…)
? 相關(guān)性分析法(相關(guān)/方差/卡方…)
? 預(yù)測(cè)性分析法(回歸/時(shí)序/決策樹(shù)/神經(jīng)網(wǎng)絡(luò)…)
? 專(zhuān)題性分析法(聚類(lèi)/關(guān)聯(lián)/RFM模型/…)
3、 統(tǒng)計(jì)分析基礎(chǔ)
? 統(tǒng)計(jì)分析兩大關(guān)鍵要素(類(lèi)別、指標(biāo))
? 統(tǒng)計(jì)分析的操作模式(類(lèi)別à指標(biāo))
? 統(tǒng)計(jì)分析三個(gè)操作步驟(統(tǒng)計(jì)、畫(huà)圖、解讀)
? 透視表的三個(gè)組成部分
4、 常用的描述性指標(biāo)
? 集中程度:均值、中位數(shù)、眾數(shù)
? 離散程度:極差、方差/標(biāo)準(zhǔn)差、IQR
? 分布形態(tài):偏度、峰度
5、 基本分析方法及其適用場(chǎng)景
? 對(duì)比分析(查看數(shù)據(jù)差距,發(fā)現(xiàn)事物變化)
演練:尋找用戶(hù)的地域分布特征
演練:分析產(chǎn)品受歡迎情況及貢獻(xiàn)大小
演練:用數(shù)據(jù)來(lái)探索增量不增收困境的解決方案
? 分布分析(查看數(shù)據(jù)分布,探索業(yè)務(wù)層次)
演練:銀行用戶(hù)的消費(fèi)水平和消費(fèi)層次分析
演練:客戶(hù)年齡分布/收入分布分析
案例:通信運(yùn)營(yíng)商的流量套餐劃分合理性的評(píng)估
演練:呼叫中心接聽(tīng)電話(huà)效率分析(呼叫中心)
? 結(jié)構(gòu)分析(查看指標(biāo)構(gòu)成,評(píng)估結(jié)構(gòu)合理性)
案例:增值業(yè)務(wù)收入結(jié)構(gòu)分析(通信)
案例:物流費(fèi)用成本結(jié)構(gòu)分析(物流)
案例:中移動(dòng)用戶(hù)群動(dòng)態(tài)結(jié)構(gòu)分析
演練:財(cái)務(wù)領(lǐng)域的結(jié)構(gòu)瀑布圖、財(cái)務(wù)收支的變化瀑布圖
? 趨勢(shì)分析(發(fā)現(xiàn)事物隨時(shí)間的變化規(guī)律)
案例:破解零售店銷(xiāo)售規(guī)律
案例:手機(jī)銷(xiāo)量的淡旺季分析
案例:微信用戶(hù)的活躍時(shí)間規(guī)律
演練:發(fā)現(xiàn)客流量的時(shí)間規(guī)律
? 交叉分析(從多個(gè)維度的數(shù)據(jù)指標(biāo)分析)
演練:用戶(hù)性別+地域分布分析
演練:不同客戶(hù)的產(chǎn)品偏好分析
演練:不同學(xué)歷用戶(hù)的套餐偏好分析
演練:銀行用戶(hù)的違約影響因素分析
問(wèn)題:如何才能全面/系統(tǒng)地分析而不遺漏?如何分解和細(xì)化業(yè)務(wù)問(wèn)題?
1、 業(yè)務(wù)分析思路和分析框架來(lái)源于業(yè)務(wù)模型
2、 常用的業(yè)務(wù)模型
? 外部環(huán)境分析:PEST
? 業(yè)務(wù)專(zhuān)題分析:5W2H
? 競(jìng)品/競(jìng)爭(zhēng)分析:SWOT、波特五力
? 營(yíng)銷(xiāo)市場(chǎng)專(zhuān)題分析:4P/4C等
3、 用戶(hù)行為分析(5W2H分析思路和框架)
? WHY:原因(用戶(hù)需求、產(chǎn)品亮點(diǎn)、競(jìng)品優(yōu)劣勢(shì))
? WHAT:產(chǎn)品(產(chǎn)品喜好、產(chǎn)品貢獻(xiàn)、產(chǎn)品功能、產(chǎn)品結(jié)構(gòu))
? WHO:客戶(hù)(基本特征、消費(fèi)能力、產(chǎn)品偏好)
? WHEN:時(shí)間(淡旺季、活躍時(shí)間、重購(gòu)周期)
? WHERE:區(qū)域/渠道(區(qū)域喜好、渠道偏好)
? HOW:支付/促銷(xiāo)(支付方式、促銷(xiāo)方式有效性評(píng)估等)
? HOW MUCH:價(jià)格(費(fèi)用、成本、利潤(rùn)、收入結(jié)構(gòu)、價(jià)格偏好等)
案例討論:結(jié)合公司情況,搭建用戶(hù)消費(fèi)習(xí)慣的分析框架(5W2H)
1、 預(yù)測(cè)建模六步法
? 選擇模型:基于業(yè)務(wù)選擇恰當(dāng)?shù)臄?shù)據(jù)模型
? 特征工程:選擇對(duì)目標(biāo)變量有顯著影響的屬性來(lái)建模
? 訓(xùn)練模型:采用合適的算法對(duì)模型進(jìn)行訓(xùn)練,尋找到最優(yōu)參數(shù)
? 評(píng)估模型:進(jìn)行評(píng)估模型的質(zhì)量,判斷模型是否可用
? 優(yōu)化模型:如果評(píng)估結(jié)果不理想,則需要對(duì)模型進(jìn)行優(yōu)化
? 應(yīng)用模型:如果評(píng)估結(jié)果滿(mǎn)足要求,則可應(yīng)用模型于業(yè)務(wù)場(chǎng)景
2、 數(shù)據(jù)挖掘常用的模型
? 定量預(yù)測(cè)模型:回歸預(yù)測(cè)、時(shí)序預(yù)測(cè)等
? 定性預(yù)測(cè)模型:邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等
? 市場(chǎng)細(xì)分:聚類(lèi)、RFM、PCA等
? 產(chǎn)品推薦:關(guān)聯(lián)分析、協(xié)同過(guò)濾等
? 產(chǎn)品優(yōu)化:回歸、隨機(jī)效用等
? 產(chǎn)品定價(jià):定價(jià)策略/最優(yōu)定價(jià)等
3、 特征工程/特征選擇/變量降維
? 基于變量本身特征
? 基于相關(guān)性判斷
? 因子合并(PCA等)
? IV值篩選(評(píng)分卡使用)
? 基于信息增益判斷(決策樹(shù)使用)
4、 模型評(píng)估
? 模型質(zhì)量評(píng)估指標(biāo):R^2、正確率/查全率/查準(zhǔn)率/特異性等
? 預(yù)測(cè)值評(píng)估指標(biāo):MAD、MSE/RMSE、MAPE、概率等
? 模型評(píng)估方法:留出法、K拆交叉驗(yàn)證、自助法等
? 其它評(píng)估:過(guò)擬合評(píng)估、殘差檢驗(yàn)
5、 模型優(yōu)化
? 優(yōu)化模型:選擇新模型/修改模型
? 優(yōu)化數(shù)據(jù):新增顯著自變量
? 優(yōu)化公式:采用新的計(jì)算公式
? 集成思想:Bagging/Boosting/Stacking
6、 常用預(yù)測(cè)模型介紹
? 時(shí)序預(yù)測(cè)模型
? 回歸預(yù)測(cè)模型
? 分類(lèi)預(yù)測(cè)模型
問(wèn)題:如何選擇合適的屬性/特征來(lái)建模呢?選擇的依據(jù)是什么?比如價(jià)格是否可用于產(chǎn)品銷(xiāo)量預(yù)測(cè)?
1、 數(shù)據(jù)預(yù)處理vs特征工程
2、 特征工程處理內(nèi)容
? 變量變換
? 變量派生
? 變量精簡(jiǎn)(特征選擇、因子合并)
? 類(lèi)型轉(zhuǎn)換
3、 特征選擇常用方法
? 相關(guān)分析、方差分析、卡方檢驗(yàn)
4、 相關(guān)分析(衡量?jī)蓴?shù)據(jù)型變量的線性相關(guān)性)
? 相關(guān)分析簡(jiǎn)介
? 相關(guān)分析的應(yīng)用場(chǎng)景
? 相關(guān)分析的種類(lèi)
2 簡(jiǎn)單相關(guān)分析
2 偏相關(guān)分析
2 距離相關(guān)分析
? 相關(guān)系數(shù)的三種計(jì)算公式
2 Pearson相關(guān)系數(shù)
2 Spearman相關(guān)系數(shù)
2 Kendall相關(guān)系數(shù)
? 相關(guān)分析的假設(shè)檢驗(yàn)
? 相關(guān)分析的四個(gè)基本步驟
演練:營(yíng)銷(xiāo)費(fèi)用會(huì)影響銷(xiāo)售額嗎?影響程度如何量化?
演練:哪些因素與汽車(chē)銷(xiāo)量有相關(guān)性
演練:影響用戶(hù)消費(fèi)水平的因素會(huì)有哪些
? 偏相關(guān)分析
2 偏相關(guān)原理:排除不可控因素后的兩變量的相關(guān)性
2 偏相關(guān)系數(shù)的計(jì)算公式
2 偏相關(guān)分析的適用場(chǎng)景
? 距離相關(guān)分析
5、 方差分析(衡量類(lèi)別變量與數(shù)值變量間的相關(guān)性)
? 方差分析的應(yīng)用場(chǎng)景
? 方差分析的三個(gè)種類(lèi)
2 單因素方差分析
2 多因素方差分析
2 協(xié)方差分析
? 單因素方差分析的原理
? 方差分析的四個(gè)步驟
? 解讀方差分析結(jié)果的兩個(gè)要點(diǎn)
演練:擺放位置與銷(xiāo)量有關(guān)嗎
演練:客戶(hù)學(xué)歷對(duì)消費(fèi)水平的影響分析
演練:廣告和價(jià)格是影響終端銷(xiāo)量的關(guān)鍵因素嗎
演練:營(yíng)業(yè)員的性別、技能級(jí)別對(duì)產(chǎn)品銷(xiāo)量有影響嗎
演練:尋找影響產(chǎn)品銷(xiāo)量的關(guān)鍵因素
? 多因素方差分析原理
? 多因素方差分析的作用
? 多因素方差結(jié)果的解讀
演練:廣告形式、地區(qū)對(duì)銷(xiāo)量的影響因素分析
? 協(xié)方差分析原理
? 協(xié)方差分析的適用場(chǎng)景
演練:排除產(chǎn)品價(jià)格,收入對(duì)銷(xiāo)量有影響嗎?
6、 列聯(lián)分析/卡方檢驗(yàn)(兩類(lèi)別變量的相關(guān)性分析)
? 交叉表與列聯(lián)表:計(jì)數(shù)值與期望值
? 卡方檢驗(yàn)的原理
? 卡方檢驗(yàn)的幾個(gè)計(jì)算公式
? 列聯(lián)表分析的適用場(chǎng)景
案例:套餐類(lèi)型對(duì)客戶(hù)流失的影響分析
案例:學(xué)歷對(duì)業(yè)務(wù)套餐偏好的影響分析
案例:行業(yè)/規(guī)模對(duì)風(fēng)控的影響分析
問(wèn)題:如何評(píng)估客戶(hù)購(gòu)買(mǎi)產(chǎn)品的可能性?如何預(yù)測(cè)客戶(hù)的購(gòu)買(mǎi)行為?如何提取某類(lèi)客戶(hù)的典型特征?如何向客戶(hù)精準(zhǔn)推薦產(chǎn)品或業(yè)務(wù)?
1、 分類(lèi)模型概述及其應(yīng)用場(chǎng)景
2、 常見(jiàn)分類(lèi)預(yù)測(cè)模型
3、 邏輯回歸(LR)
? 邏輯回歸的適用場(chǎng)景
? 邏輯回歸的模型原理
? 邏輯回歸分類(lèi)的幾何意義
? 邏輯回歸的種類(lèi)
2 二項(xiàng)邏輯回歸
2 多項(xiàng)邏輯回歸
? 如何解讀邏輯回歸方程
? 帶分類(lèi)自變量的邏輯回歸分析
? 多項(xiàng)邏輯回歸/多分類(lèi)邏輯回歸
案例:如何評(píng)估用戶(hù)是否會(huì)購(gòu)買(mǎi)某產(chǎn)品(二項(xiàng)邏輯回歸)
案例:多品牌選擇模型分析(多項(xiàng)邏輯回歸)
4、 分類(lèi)決策樹(shù)(DT)
問(wèn)題:如何預(yù)測(cè)客戶(hù)行為?如何識(shí)別潛在客戶(hù)?
風(fēng)控:如何識(shí)別欠貸者的特征,以及預(yù)測(cè)欠貸概率?
客戶(hù)保有:如何識(shí)別流失客戶(hù)特征,以及預(yù)測(cè)客戶(hù)流失概率?
? 決策樹(shù)分類(lèi)簡(jiǎn)介
案例:美國(guó)零售商(Target)如何預(yù)測(cè)少女懷孕
演練:識(shí)別銀行欠貨風(fēng)險(xiǎn),提取欠貸者的特征
? 決策樹(shù)分類(lèi)的幾何意義
? 構(gòu)建決策樹(shù)的三個(gè)關(guān)鍵問(wèn)題
2 如何選擇最佳屬性來(lái)構(gòu)建節(jié)點(diǎn)
2 如何分裂變量
2 修剪決策樹(shù)
? 選擇最優(yōu)屬性生長(zhǎng)
2 熵、基尼索引、分類(lèi)錯(cuò)誤
2 屬性劃分增益
? 如何分裂變量
2 多元?jiǎng)澐峙c二元?jiǎng)澐?/span>
2 連續(xù)變量離散化(最優(yōu)分割點(diǎn))
? 修剪決策樹(shù)
2 剪枝原則
2 預(yù)剪枝與后剪枝
? 構(gòu)建決策樹(shù)的四個(gè)算法
2 C5.0、CHAID、CART、QUEST
2 各種算法的比較
? 如何選擇最優(yōu)分類(lèi)模型?
案例:商場(chǎng)用戶(hù)的典型特征提取
案例:客戶(hù)流失預(yù)警與客戶(hù)挽留
案例:識(shí)別拖欠銀行貨款者的特征,避免不良貨款
案例:識(shí)別電信詐騙者嘴臉,讓通信更安全
? 多分類(lèi)決策樹(shù)
案例:不同套餐用戶(hù)的典型特征
? 決策樹(shù)模型的保存與應(yīng)用
5、 人工神經(jīng)網(wǎng)絡(luò)(ANN)
? 神經(jīng)網(wǎng)絡(luò)概述
? 神經(jīng)網(wǎng)絡(luò)基本原理
? 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
? 神經(jīng)網(wǎng)絡(luò)分類(lèi)的幾何意義
? 神經(jīng)網(wǎng)絡(luò)的建立步驟
? 神經(jīng)網(wǎng)絡(luò)的關(guān)鍵問(wèn)題
? BP反向傳播網(wǎng)絡(luò)(MLP)
? 徑向基網(wǎng)絡(luò)(RBF)
案例:評(píng)估銀行用戶(hù)拖欠貨款的概率
6、 判別分析(DA)
? 判別分析原理
? 判別分析種類(lèi)
? Fisher線性判別分析
案例:MBA學(xué)生錄取判別分析
案例:上市公司類(lèi)別評(píng)估
7、 最近鄰分類(lèi)(KNN)
? KNN模型的基本原理
? KNN分類(lèi)的幾何意義
? K近鄰的關(guān)鍵問(wèn)題
8、 支持向量機(jī)(SVM)
? SVM基本原理
? 線性可分問(wèn)題:最大邊界超平面
? 線性不可分問(wèn)題:特征空間的轉(zhuǎn)換
? 維災(zāi)難與核函數(shù)
9、 貝葉斯分類(lèi)(NBN)
? 貝葉斯分類(lèi)原理
? 計(jì)算類(lèi)別屬性的條件概率
? 估計(jì)連續(xù)屬性的條件概率
? 預(yù)測(cè)分類(lèi)概率(計(jì)算概率)
? 拉普拉斯修正
案例:評(píng)估銀行用戶(hù)拖欠貨款的概率
1、 模型的評(píng)估指標(biāo)
? 兩大矩陣:混淆矩陣,代價(jià)矩陣
? 六大指標(biāo):Acc,P,R,Spec,F1,lift
? 三條曲線:
2 ROC曲線和AUC
2 PR曲線和BEP
2 KS曲線和KS值
2、 模型的評(píng)估方法
? 原始評(píng)估法
? 留出法(Hold-Out)
? 交叉驗(yàn)證法(k-fold cross validation)
? 自助采樣法(Bootstrapping)
1、 模型的優(yōu)化思路
2、 集成算法基本原理
? 單獨(dú)構(gòu)建多個(gè)弱分類(lèi)器
? 多個(gè)弱分類(lèi)器組合投票,決定預(yù)測(cè)結(jié)果
3、 集成方法的種類(lèi)
? Bagging
? Boosting
? Stacking
4、 Bagging集成
? 數(shù)據(jù)/屬性重抽樣
? 決策依據(jù):少數(shù)服從多數(shù)
? 典型模型:隨機(jī)森林RF
5、 Boosting集成
? 基于誤分?jǐn)?shù)據(jù)建模
? 樣本選擇權(quán)重更新公式
? 決策依據(jù):加權(quán)投票
? 典型模型:AdaBoost模型
1、 信用評(píng)分卡模型簡(jiǎn)介
2、 評(píng)分卡的關(guān)鍵問(wèn)題
3、 信用評(píng)分卡建立過(guò)程
? 篩選重要屬性
? 數(shù)據(jù)集轉(zhuǎn)化
? 建立分類(lèi)模型
? 計(jì)算屬性分值
? 確定審批閾值
4、 篩選重要屬性
? 屬性分段
? 基本概念:WOE、IV
? 屬性重要性評(píng)估
5、 數(shù)據(jù)集轉(zhuǎn)化
? 連續(xù)屬性最優(yōu)分段
? 計(jì)算屬性取值的WOE
6、 建立分類(lèi)模型
? 訓(xùn)練邏輯回歸模型
? 評(píng)估模型
? 得到字段系數(shù)
7、 計(jì)算屬性分值
? 計(jì)算補(bǔ)償與刻度值
? 計(jì)算各字段得分
? 生成評(píng)分卡
8、 確定審批閾值
? 畫(huà)K-S曲線
? 計(jì)算K-S值
? 獲取最優(yōu)閾值
案例:構(gòu)建銀行小額貸款的用戶(hù)信用模型
1、 電信業(yè)客戶(hù)流失預(yù)警和客戶(hù)挽留模型實(shí)戰(zhàn)
2、 銀行欠貸風(fēng)險(xiǎn)預(yù)測(cè)模型實(shí)戰(zhàn)
3、 銀行信用卡評(píng)分模型實(shí)戰(zhàn)
結(jié)束:課程總結(jié)與問(wèn)題答疑。
京公網(wǎng)安備 11011502001314號(hào)