邏輯迴歸模型建模步驟

來源:魅力女性吧 1.08W
邏輯迴歸模型建模步驟

1,構建所需的數據集,根據實驗的窗口,構建邏輯迴歸數據結構,例如 用過去12個月數據 做購買率的模型訓練,這部分包含訓練數據集與測試數據集

2、變量的轉化與預處理。

其中去掉缺失值較多的變量,購買率分佈較集中的變量,即購買概率的變化不隨自變量變化而變化的變量,即數值集中程度較高的變量。與Y不相關的變量。

3、變量的刪選(特徵工程)(caret包)

將高維即數量太龐大的自變量羣,降維致較少的變量組合,(例如降至80以下 或者20左右),這部分步驟主要來降維的同時,期望消去變量之間的共線性,相關性等因素

4、模型的構建(glm 包/step() )

根據實際商業的目的,挑選第三步後剩下的變量,並調參,找到是整個系統平滑穩定的變量組合,例如10個變量,其中每個變量權重期望分佈均勻,且滿足模型其他各項基本指標,如C值 AUC等。

5、模型的評估 與描述

將構建完成的模型,將所有客户的購買率給出,並從高到低排序,總人羣均分為10類 。輸出模型結果 其中理想效果是 :購買率高的客户羣為總體平均購買率人羣的兩倍既兩倍以上,即高的購買率是總體平均購買率的兩倍。

熱門標籤