大数据应用:成为大数据电子商务高手
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节
大数据崛起与电子商务变革

一、何谓大数据

大数据(Big Data)一词最早出现在2012年Viktor Mayer-Schönberger与Kenneth Cukier两位的著作《大数据时代:生活、工作与思维的大变革》中。大数据具有“4V”特性,分别是:数据量庞大(volume)、产生速度快(velocity)、形式多样(variety)以及具有价值(value)。

(一)数据量庞大

“volume”原意为有形的物体或容器的容量。例如,某台汽车的油箱容量为60公升,若能够将油箱扩大,那么就可以存放更多的汽油,进而增加汽车的续航能力。在大数据的世界中,volume却是一个抽象的概念,如同一个没有刻度且无具体容量上限的量杯。试想,在这个世界上有多少网站呢?而在这庞大数量网站中往来的全球网络流量又有多少呢?答案必是非常惊人的!在大数据的世界中,volume其实就是指数量庞大的网络数据。对于传统的电子商务而言,或许网络资料仅局限于来自网站的流量,但近年来受惠于移动网络的普及,由移动装置所产生的网络流量也不约而同地加入了贡献volume的行列,近年来流行的物联网也不例外。在万物皆可联网的情况下,它们俨然扮演着额外的网络流量供应者,因此我们也可以把大数据的数量庞大特性视为“浩瀚网络容器中的无限数据”。再举一个生活中常见的例子,大家平常在使用手机上网的时候可能会遇到一种情况,那就是上网流量超出电信合约中的限额。以1G流量来说,若将这些流量使用完毕,等同于自己在智能型手机上阅读了上千本电子书的内容,然而实际上的流量限额不止1G,甚至有不少人采取“吃到饱”的方案,在这种没有限制的情况下所体现的电子书阅读数量恐怕更加难以计算。

(二)产生速度快

可以说一年365天、一天24小时,网络都在不断地产生着数据。若以数据在网络中流动的速度来看,对于简单的LINE对话过程(传信方是上传,收信方是下载),每个人每天发生过几次一来一往的传送与接收数据的过程呢?如果将每个人每天传送数据的频率放眼至全世界的LINE用户,LINE公司的服务器主机每天又要服务于多少用户的传送与接收数据的需求呢?然而,这只是众多数据流动中的一个小案例,日常生活中只要所从事的活动涉及网络,就等同于无时无刻不在发生数据流动,这体现了数据的实时性(real-time)。对于传统的电子商务而言,过去受限于硬件处理能力或是数据分析技术的瓶颈,往往只能通过顾客关系管理系统(Customer Relationship Management, CRM)来将消费者的交易记录进行历史性的分析。例如,服务商可以通过RFM分析来汇总消费者最近一次交易的日期(recency)、交易频率(frequency)以及交易金额(monetary),然而这一切用大数据电子商务的立场来看恐怕都是事后诸葛亮。换句话说,当消费者不断地进行数据传送与接收时,相关服务商有必要以“实时”或是“趋近实时”的做法来回应消费者需求,例如,依据消费者过去的交易记录以及当下的网站访问行为,电子商务服务商可以针对特定的消费者投放实时性的专属优惠信息。

(三)形式多样

日常生活中常见的数据多数属于数字形态的结构化数据,如温湿度、股票交易金额等。然而大数据并非仅局限在数字形态的数据,它还包括许多非结构化的数据,如声音、视觉焦点、脸部表情等。在传统电子商务中,结构化数据是一种较为常见的数据,如顾客交易额、网站访客的浏览次数、网站跳出率等。时至今日,受惠于许多数据获取技术的飞速发展,使得新形态电子商务得以将过去无法捕捉的数据进行“非结构化→结构化”的转换。举例来说,若某电子商务网站想要得知其访客的关注焦点(即访客进站后的重点浏览内容),可以在征求访客同意的前提下,请他们在自己的计算机上安装眼动拍摄仪,借此将这个过程中捕捉到的信息转化为结构化数据,如此电子商务网站经营者便能得知访客是被自己网站的哪些内容所吸引,如图1-2所示。

图1-2 眼动拍摄仪(资料来源:南京思科电子科技)

类似的方式也被应用在新形态的零售业中。知名连锁超市7-11就在各店结账柜台后方安装了液晶荧幕,如图1-3所示。在播放商品广告之余也利用荧幕上的镜头记录顾客观看广告时的眼球活动。此举不但能够有效地缓解顾客排队结账时的烦躁心情,也巧妙地捕捉到了其中的非结构化数据,从而能够针对顾客眼球停留时间与脸部表情识别结果来进行精准的商品推荐。

图1-3 7-11超市的大数据应用案例

(四)具有价值

数据必须经过转化才能具有价值。如同政府所倡导的资源回收一般,把看似无用的垃圾加以分类处理,就可以实现回收再利用。对传统电子商务经营者而言,仅仅针对单一数据的收集与分析较难察觉到其中的价值。例如,某电子商务网站记录了“访客进站次数”,然而此单一数据充其量只能描述一个网站所获得的访客数,无法进一步就此数据进行延伸性的探索。此时若加入其他数据一同探索,那么数据价值即可逐渐明朗。例如,除了“访客进站次数”这个单一数据之外,还记录了“访客进站日期”,若将这两项数据合并探索,也就是“访客进站次数+访客进站时段”,则可以得出图1-4所示的矩阵。如此便能针对四个象限进行更深的探索,因此,数据转化力(data derivability)对于数据价值之影响不可小觑。

图1-4 访客进站矩阵

很遗憾,受大数据特性的影响,数据转化力的培养极其困难。换句话说,如何能够将形式多样且产生速度快的数据转化成有价值的数据是一项艰难的挑战。图1-5为Miller & Mork两位学者于2013年所提出的数据价值链(1)(Data Value Chain, DVC),共分为三大阶段,每个阶段都附带着该阶段应有的数据作为。

图1-5 数据价值链[资料来源:Miller & Mork(2013)]

1.数据探索阶段(data discovery)

数据的来源非常广,而且不同的数据源所呈现的数据形态也不尽相同,数据价值链的首要阶段就是针对不同的数据源建立适合存放数据的场所,同时也要对各种数据源存放场所给予诠释说明。这就好像一个大仓库中有许多小仓库一样,每个小仓库存放不同的器具、原料或工具,也许是固态原料,也许是液态原料,它们有各自合适的存放方式。为了能够在大仓库中快速找到所需的原料,每个小仓库上的标记内容就显得非常重要。除此之外,由于小仓库内容的形态各有不同,因此管理员必须针对不同的内容制定相应的领用规则,如此才能确保大仓库整体的运作,而这正是为了顺利产出数据价值所必须进行的数据探索阶段。

2.数据整合阶段(data integration)

数据整合阶段的任务就是将第一阶段的各式数据源探索结果予以整合,形成一个类似大脑中枢的结构,以便将不同的数据在相同形式下顺利呈现。举例来说,若要让管理员能够有效率地管理大仓库中的每一个小仓库,提供统一且具有综观效果的管理接口是非常必要的。而且这个管理接口除了要能够对外呈现一致的数据表达方式之外,还要能够根据小仓库的内容改变将最实时、最精准的数据呈现给管理员。

3.数据利用阶段(data exploitation)

数据利用阶段的任务就是要把所获得的数据进行正确地分析,并且将分析结果提供给数据需求者。例如,大仓库管理员除了拥有上一阶段所提到的良好的管理接口之外,若能够将各个小仓库内容的变化情况予以汇总并进行数据的预测分析与可视化,那么仓库管理员便能够从分析结果中发现未来小仓库中内容的变化,甚至可以将这些数据结论提供给高阶主管,供其参考,以制定决策。此时仓库管理员受惠于数据的妥善利用,扮演决策者与数据之间的友善之桥,从而让数据价值逐渐浮现。

综合以上叙述可知,大数据可以说是包山包海,几乎任何形式的数据皆可视为大数据的一种。既然大数据的范畴如此广泛,传统电子商务从业者自然不会放过任何可以应用大数据的机会。套用一句阿里巴巴主要创始人马云说过的一句话:“做淘宝不是卖货,而是为了获得数据。”从这句话我们就可以推敲出数据对于电子商务的重要性,就好比鱼要生存不能离开水一般,这也是为什么有些电子商务从业者可以善用数据,从数据里淘金,但有些从业者却无法从中洞察出数据价值与机会。有鉴于此,接下来我们将更具体地介绍大数据能够给电子商务领域带来哪些前所未有的新应用,以及这些新应用对于传统电子商务的影响。