python - 數據挖掘原理
來源:魅力女性吧 4.89K
數據挖掘是通過對大量數據的清理及處理以發現信息, 並將這原理應用於分類, 推薦系統, 預測等方面的過程。
數據挖掘過程:
1、 數據選擇
在分析業務需求後, 需要選擇應用於需求業務相關的數據. 明確業務需求並選擇好業務針對性的數據是數據挖掘的先決條件。
2、 數據預處理
選擇好的數據會有噪音, 不完整等缺陷, 需要對數據進行清洗, 集成, 轉換以及歸納。
3、 數據轉換
根據選擇的算法, 對預處理好的數據轉換為特定數據挖掘算法的分析模型。
4、 數據挖掘
使用選擇好的數據挖掘算法對數據進行處理後得到信息。
5、 解釋與評價
對數據挖掘後的信息加以分析解釋, 並應用於實際的工作領域。