法国地方研究机构IAURIF

"IAURIF 更精确地对未来交通需求作出预测。"


存在问题

IAURIF,法国一家地方研究机构,需要对大量原本不是为数据挖掘而收集的数据进行分析,预示巴黎将要采用的交通方式,以及采用的原因。

解决方案

IAURIF 采用 SPSS Clementine 的规则归纳算法得到了意想不到的结果,并证明预先单凭经验作出的假设是不正确的。Clementine 快速建模环境揭示出最重要的交通因素,并获得了基于实事的精确结果。


应用效果

分析和预测交通的流动和增长是一个复杂的过程。IAURIF 从现有的包括40万条记录的数据库开始。这是先前从一个详细的巴黎交通调查收集的数据,并不是专门用于数据挖掘的。这意味着一开始任务就非常复杂,因为必须对这些数据先进行预处理。


完成了更精确的交通预测

借助于 Clementine 强大的数据处理功能,IAURIF 首先把总标题下的200个原始字段进行分组,如居住地点和社会经济学类别。然后,分析师为每一组字段选择一个典型变量,并确保各组对交通方式的影响是独立的。经过这一重要的预处理,IAURIF 精选出26个字段作为有关变量的核心,这样就简化了数据挖掘过程,并极大地帮助了数据挖掘的顺利完成。

IAURIF 的分析师然后使用 Clementine 的规则归纳算法来预测一个三分变量:出行采用步行、 驾车或乘坐公共交通工具。利用Clementine 强大的建模技术,分析师发现了每种选择后面的因素。根据经验,IAURIF 首先想到社会学因素,如收入和类别,加上出行目的,将会是最重要的影响因素 。


改进了交通计划

但是,Clementine 发现了一个意想不到的重要结果,证明最重要的影响因素是旅行距离和时间,而不是上面单靠经验而作出的预测。为了确认,IAURIF 用验证数据对分析结果进行检验,结果证明了Clementine 的高度精确性。

作为结论,Clementine 及其新的建模过程提高了IAURIF计划未来交通的能力,同时也增强了 IAURIF 的可信性。

a