块数据让大数据实现从混沌到精准
摘要:对于大数据时代,目前人们所讨论的数据几乎都是条数据。条数据是指某个行业或领域呈链条状串起来的数据。与之相比,块数据是在一个物理空间或者行政区域形成的涉及到人、事、物等各类数据的综合,相当于将各类“条数据”解构、交叉、融合。块数据概念的提出和应用,使我们对大数据的挖掘实现了从混沌到精准。
当今世界,正在从数据时代走向大数据时代。然而,我们听到的大数据似乎无所不能,看到的却似乎又混沌不清。全球领先的信息技术研究和顾问公司Gartner数据中心首席分析师张瑾认为,“我们甚至不能将所有大数据解决方案进行分类,用户不清楚自己的问题,也不清楚大数据究竟能解决哪些问题,甚至用户已经知道可以应用何种技术解决大数据问题,但找不到合适的供应商、服务商,提供合适的数学分析模型,提供产品集成,用户自己也没有人才储备,维护系统正常运转。”
对于大数据时代,目前人们所讨论的数据几乎都是条数据。条数据是指某个行业或领域呈链条状串起来的数据。人类生活、生产产出的大数据,无论是搜索引擎、电商、社交平台形成的企业大数据,还是天气预报形成的科学大数据,还是各政府部门形成的行业大数据,都可以定义为“条数据”。这类大数据彼此割裂、互不融通,呈现出一种“混沌”的状态,限制了大数据在经济社会中发挥作用。
与之相比,块数据是在一个物理空间或者行政区域形成的涉及到人、事、物等各类数据的综合,相当于将各类“条数据”解构、交叉、融合。在块数据集合过程中,包含了数据空间的填充、空间数据的重构、集合过程的组构,及组构过程中的集合,同时还有新数据的汇集和原有数据组合后的衍生数据。块数据概念的提出和应用,使我们对大数据的挖掘实现了从混沌到精准。
举例来说,一个百货商场每天都会卖出很多商品,每个商品的原材料、品牌设计、广告营销数据、百货商场卖出商品的数量、种类数据,消费者在商场购物、娱乐的数据,将所有在商场这个物理空间产生的数据求和,得到的就是块数据。而一个数据的变化会带动其他数据发生改变,比如,当商场的影院播放一部聚集人气的影片时,商场的其他产品销量也会上升,这一过程又会衍生出新的数据,随时随地更新的数据能使我们对商场的状况有更精准的把握,进而拿出更具针对性的解决方案。
块数据的价值就在于通过对块数据的挖掘、分析,实现对事物规律的精准定位,甚至能够发现以往未能发现的新规律。通过块数据让以往的“数据孤岛”连成一片,再通过对不同类型、来源信息的集成、挖掘、清洗,极大地改变信息的生产、传播、加工和组织方式,对大数据的挖掘变得精准,这给创新发展带来新的驱动力,将会推动产业彻底变革和再造。可以毫不夸张地说,在这个时代,得“块”者得天下。以往很多数据价值的外部性难题,将可以通过块数据以市场化和行政化手段得到解决。
可以预见,由贵阳市大数据战略重点实验室首创性提出的块数据理论,将标志着我们正步入块数据时代!(祝 卫)