在“中国移动4G+终端产业峰会”上,中国移动在介绍最新产业政策的同时,首次发布了《中国移动终端大数据》,以PPT的形式披露了一组统计信息。
当这组数据发布的时候,几乎所有观众都举起了手机把PPT拍下来,是什么样的信息让这些行业人士如此关注?我们先看图说话:
1、最具“用户基础”的品牌
2、最具“成长性”的品牌
3、区域最“强势”品牌机型
4、最具“忠诚度”的品牌
5、最“耐用”的品牌
6、最“MAN”的品牌
7、最有“用户价值”的品牌
8、最“受欢迎”的APP
比如,用户规模最大的APP还是浏览和即时通信,上升势头很快的视频类排在第三位。
即时通信类APP里,微信仍然没有超过QQ,只能屈居第二;而腾讯在视频类里高居榜首,很大程度源于微信的导流。
这里面值得分析和玩味的东西非常多,篇幅所限,就不多说了。
在此之前,类似的终端统计信息和大数据分析报告已经发布过多次,那么这次由中国移动的终端大数据发布有何不同?下面进入正题。
一、中国移动终端大数据从何而来?
【数据的获取】
中国移动在发布报告的时候强调,无论是终端的信息还是其他数据,都直接取自网内的超过8亿的客户,都是现网真实发生的情况。这些数据都是怎么获取的?
先说说移动是如何获取终端的品牌和机型数据。
从2003年开始,中国移动就开始研究和推进终端数据的采集和分析工作,要求设备供应商在交换机产生的话单中,加入该用户的IMEI(International Mobile Equipment Identity,国际移动设备标识的缩写)信息。
IMEI字段本是可选项,但在中国移动的要求成为入网的必选内容。也就是说,2003年之后在中国移动网上使用的移动交换设备,都必须提供了用户和终端的对应关系,只要用户用新终端打一次电话,运营商侧就能发现。
按照国际规范,IMEI里面包含了厂商、机型、产地、序列号等信息,是手机的唯一识别号码。但在最初的时候,这个号码的准确性并不高,尤其是山寨机盛行的时候,有的厂商根本就没有进行IMEI的设置,有的机型还可以任意变更IMEI代码,识别的准确性不高。系统刚上线时,有超过一半的终端无法进行识别。
后来,运营商的定制机开始出现,IMEI成为终端管理的基础,各方都加大了对IMEI规范性、准确性的管理力度,数据源准了,终端分析的精准度和客观性才有所提高。如今,IMEI的全网准确识别比例已经超过了90%。
客户资料的准确性,也有一个逐渐提升的过程。在实名制全面推行之前,运营商侧对客户的画像往往是分析出来的结果,并不完全准确。而如今,号码和客户的对应关系完全规范化,分析的精准度也进一步提升了。
客户的行为和标签,是另一类主要数据。这些信息主要来自于业务支撑系统记录的用户通信使用记录、网络侧采集的用户活动状况,以及用户在进行通信时产生的上网信息。
为了将这些信息和记录采集、处理、存储,运营商不惜巨资搭建IT支撑系统,以求准确地进行客户分类和画像。
【数据的处理】
要体现数据的价值,前提是将数据处理干净,去除噪音数据。通信网络和设备产生的数据比较原始,玩大数据之前就像淘金一样,必须对数据进行一系列的清洗、转换、加载处理。
有的数据处理是标准化,将各种设备产生的话单转化为标准格式;有的数据处理是过滤,将一些不完整信息或者错误记录进行删除。这些处理是便于后续的存储和分析加工。
有的数据处理是建立数据之间的对应关系,比如:如何认定用户已经换机——也许用户只是临时借用别人的手机,或者个别数据信息出现错漏。只有当客户连续一段时间用同样的新IMEI,才算认定用户换机。
对于移动来说,数据处理环节还包括横向纵向的数据归纳整理。
横向包括各条业务线之间的业务交互和数据汇集,纵向主要指的是省级系统和总部系统之间的数据传输。如果是两级之间的数据交互,还掺杂一些非技术因素,有时候真是在斗智斗勇。
二、中国移动终端大数据优势何在?
【数据的真实性】
首先,从前面介绍的情况可以得知,移动的终端大数据的有关信息中,绝大部分数据是31个省的8亿多客户的真实信息,不仅数据样本量足够大,而且是从网络上直接采集获取。
其次,这些数据的积累并非一朝一夕之功。在此次对外披露前,终端分析等数据的处理分析和展现都是在移动内部,以内部报表或者分析报告形式在小范围传播。不仅内部有数以千计的交叉校验规则来检查数据的真实性,而且经过这么多年的持续积累和分析工作,如果数据有异动,就会有分析人员会同技术人员判断处理。
第三,对于部分没有把握的数据,内部处理原则是宁缺毋滥,宁肯数据样本少一些,也要避免发生”假数据+真分析”的尴尬场景。比如这次分析APP的应用情况,仅选取了部分省公司数据,而不是贪大求全用所有的数据。
【数据的持续性】
绝大部分的分析报告采用某时点的静态数据,这是因为获取数据的成本比较高,难以长时间维持。比如问卷调查要花大量的人力,网络侧抓包采集需要超大规模的存储和预处理。
而用户的各种行为,会在中国移动网上持续地产生,数据的采集、处理和常规分析工作已经完全实现自动化,因此移动的终端大数据可以持续补充新的信息,甚至能根据新的情况和要求,开展针对性地统计和分析。
另一方面,中国移动的资源优势展现得淋漓尽致,拥有海量历史数据,而且这些数据的颗粒度足够细,运算资源也相对充沛,使得历史对比分析成为可能。
【数据与客户信息的关联性】
常规分析方面,中国移动的大数据已经在数据量、数据真实性、持续性等方面占优了,而与客户信息的关联能力,更是独有的竞争优势。
同类的客户在使用不同终端时,其行为特征和消费方面有什么差异;用户有什么行为特征,适合什么样的终端;尤其是对双卡双号客户的分析,在企业内部的实际运营中,终端与客户之间的关联分析远比此次展示的内容多。
基于相关法律的要求,出于保护客户隐私方面的考虑,无论是公开披露数据还是大数据合作,运营商都会按照要求进行数据脱敏处理等操作。但是在企业内部,对客户的个性化数据分析和应用是合法的,而且也是未来的发展趋势。
三、中国移动发布终端发大数据的意义。
在此次4G+终端产业峰会上,中国移动发布了一个重要的产业政策:全网通终端将进入移动定制库。
从某种角度来说,这项政策是被市场逼出来的,移动此举意味着运营商定制机对终端市场的影响力越来越弱。那么如何保持对合作伙伴的影响力,甚至控制力?此时公开发布终端大数据报告,可谓意味深长。
说个有意思的事情,为了不影响股价,此次发布的并非我们提供的分析报告的全部,部分可能影响到合作伙伴股价的内容,被临时撤掉了。
这些数据和分析是客观存在的,而且禁得住质疑和推敲,在如今这个浮夸成性的市场里,真实的数据完全能把某些厂商的脸打得血肉模糊。
另一方面,将原本内部提供的数据分析,包装成为对外公开披露的大数据报告,这在中国移动总部尚属首次。
如今,中国移动总部的集中化经分系统建设已接近尾声,这个大数据平台每天获取的新数据就是几十TB,分析处理能力更是超一流。
如果将来中国移动以更加开放的心态和模式,对外提供包括大数据在内的能力开放,将是一股多么大的推动力量啊!(尚儒客栈-宁宇)
以下为《中国移动终端大数据》PPT全文:
来源:数据观综合自中国移动PPT及尚儒客栈-宁宇稿件
更多阅读: