![统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/26/40868026/b_40868026.jpg)
上QQ阅读APP看书,第一时间看更新
4.3 平滑散点图
平滑散点图是用横纵坐标图发现剔除了异常数据的大数据背后关系的一种合适的图形工具。平滑法可以将相似数值进行求均值处理——去除异常数据,使数据变得更平滑。具体地说,散点图的平滑是分片对X和Y同时取均值[1]。在第3章介绍了平滑散点图的制图六步法。
HI_BALANCE平滑散点图和RECENCY_MOS平滑散点图见图4.2。SM_HI_BALANCE和SM_RECENCY_MOS的值是按分片取,其标签从0到9,见表4.1。可以看到这种隐藏的关系呈现出S型的趋势。这种关系可以用图基的突起规则做进一步分析,详见第10章。
![](https://epubservercos.yuewen.com/F5D3BB/21233234408534806/epubprivate/OEBPS/Images/4a2.jpg?sign=1738798434-HVMd44dFkms1DwFu26k8r2UqOsRSQry4-0-29500045623227b26bdd1482d332933e)
图4.2 RECENCY_MOS和HI_BALANCE的平滑散点图
表4.1 HI_BALANCE和RECENCY_MOS的分片平滑值
![](https://epubservercos.yuewen.com/F5D3BB/21233234408534806/epubprivate/OEBPS/Images/4b1.jpg?sign=1738798434-F2OanEOmZGkntpJVaHg4gymL3XRuyXkU-0-639ec7734140aded0b482fd3c43cebbd)