关联规则:为什么尿布和啤酒在一起卖?
大家好,我是姚余梁,欢迎来到我的生活中的管理学节目。
今天我给大家讲一讲,为什么尿布和啤酒在一起卖?
我们前面讲到过关于数据挖掘的概念和定义,今天我给大家讲一讲数据挖掘的应用。它就是通过大量的数据分析,然后找到两个或者几个老是同时发生的事件。
关于关联规则,有一个关于沃尔玛的传说。沃尔玛是世界上最大的一个零售商之一,拥有世界上最大的数据仓库系统。为了能够准确地了解顾客在其门店的购买习惯,沃尔玛对其顾客的历史购物行为进行了关联规则分析,想知道顾客经常一起购买的商品有哪些。
沃尔玛的数据仓库里集中了各个门店的原始交易详细数据,在这些原始交易详细数据的基础上,沃尔玛对这些数据进行了分析和挖掘。他们发现了一个很有意义的现象,婴儿尿布和啤酒有很高的相关度。也就是说,跟尿布一起购买最多的商品之一竟然是啤酒。
我们前面说的数据挖掘的四个基本特征,有效、新颖、有用、可以理解。那么这个发现有没有效呢?沃尔玛的数据存储分析肯定都是正确有效的。除了有效,新颖这个指标呢?当然新颖了,在这之前,谁会想到尿布和啤酒会是一起购买最多的商品之一呢?尿布和啤酒是完全两个不搭尬的事情,它们俩会在一起买,这个结论很新颖!