123456网文网 > 时尚阅读 > 猎头局中局 >  上一页    下一页
四十八


  我一边消化一边尝试着重新表述:"也就是说数据仓库所做的一切都是为了让用户更快更方便地查询所需要的信息,提供决策支持。"

  石方点头说:"差不多是这个意思了。实际上它的商业应用十分广泛。我们先点东西吃,如果你有兴趣,我还可以讲多一些给你听。"

  我欣然答应,于是招手叫来了服务员。点了一堆吃的东西后,在等菜的时候,石方讲了一个十分有趣的故事给我听。

  10

  在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量大大增加了。这不是一个笑话,而是发生在美国沃尔玛连锁超市的真实案例,并一直为商家所津津乐道。

  是什么让沃尔玛发现了尿布和啤酒之间的关系呢?正是商家通过对超市一年多原始交易数字进行详细的分析,才发现了这对神奇的组合。

  总部位于美国阿肯色州的世界著名商业零售企业沃尔玛拥有世界上最大的数据仓库系统。为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用NCR数据挖掘工具对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!"

  这是数据挖掘技术对历史数据进行分析的结果,反映数据内在的规律。那么这个结果符合现实情况吗?是否是一个有用的知识?是否有利用价值?于是,沃尔玛派出市场调查人员和分析师对这一数据挖掘结果进行调查分析。大量实际调查和分析揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种消费行为倾向:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

  既然尿布与啤酒在一起被购买的机会会增多,于是沃尔玛就在其一个个门店将尿布与啤酒并排摆放在一起,结果是尿布与啤酒的销售量大大增长。

  我们点的东西陆续送了上来,石方一边夹了一块点心给我,一边总结道:"按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。"

  我若有所思地听着石方的话,用手里的筷子在空中虚点了几下:"如果这个技术用在猎头行业,或者更宽泛一点说,用在人力资源方面的话,恐怕会产生出许多有趣的模型出来。我还没想好,我得好好琢磨琢磨,这里面有机会。"

  我们开始边吃边聊,我继续向石方请教一些细节问题,希望能够帮自己理顺刚才的思路。石方看我兴致盎然,也十分高兴,于是进一步讲起来。

  "数据挖掘是从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从各种数据源中选取和集成用于数据挖掘的数据;规律寻找是用某种方法将数据中的规律找出来;规律表示是用尽可能符合用户习惯的方式(如可视化)将找出的规律表示出来。"

  我忍不住发问:"但在具体实施数据挖掘应用时,是不是还要有一个步骤--结果评价。因为数据算法寻找出来的是数据的规律,其中有些是人们感兴趣的有用的,还有一些可能是人们不感兴趣的没有用的。"

  石方赞许地指指我:"对,一定要对寻找出的规律进行评估。例如要评估跟尿布一起购买最多的商品是啤酒这样一条规律是否有用,这就需要市场调查和评估工程师根据实际情况做出评估判断。这是一个人工步骤,还难以自动化。这也注定了数据仓库在应用方面的专业性要求非常高。"

  禄口机场,石方跟我握手告别。那一瞬间我们都觉得似乎这个分别并不是我们想象的那么短暂,一种不舍和心酸居然在两个男人之间蔓延开来。我们不约而同地说了一句:"再抽根烟吧!"

  相视一笑后,我们为彼此点上了一根烟。但是抽这根烟的工夫居然谁也没有说话,抽完后我们捶了一下对方的肩膀,石方驾车离去。很快,车子消失在公路的远处。我感觉自己的心里空荡荡的,有一扇门悄悄地关上了。


123456网文网(123456ww.com)
上一页 回目录 回首页 下一页