让旅游大数据走向共建共享共赢
位于贵州贵安新区的国家旅游局大数据库灾备中心机房内,有着一根特殊的网络虚拟专线,这条专线跨越了北京与贵州之间2200多公里的距离,实现了国家旅游局北京机房与贵州灾备中心数据的同步传输和异地备份。
7月9日,该大数据库灾备中心在贵州揭牌,这标志着国家旅游局信息中心旅游大数据专项行动第一阶段任务顺利落地,同时也意味着该项目进入了数据分析、研究、使用和协同共享的新阶段。
全国旅游基础数据库:落实“十二五”规划 直面行业发展瓶颈
中国旅游信息化“十二五”规划中明确提出把建设和运行全国旅游基础数据库作为重点项目开展,以带动行业信息化水平的整体提高。2009年,国家旅游局信息中心向发改委申报了中央预算内基建投资项目“旅游基础数据库”,2010年获批准。该项目的总体目标是通过传统结构化数据采集体系的建立,综合应用大数据、云计算、数据挖掘等技术,整合全国旅游数据资源,逐步形成信息齐全、现实性强、覆盖全国的旅游基础数据库。
国家旅游局信息中心该项目负责人说,开展旅游大数据项目,是产业发展到一定规模的必然方向。希望借助数据对动态发展的社会需求做出科学的、理性的反应和理解,简单说来就是通过数据挖掘和分析知道人们的所思、所想,提前了解未来需求的同时也可以看到当下需求与供给之间存在的矛盾,从而为政府、企业等提供科学决策。
当前,随着改革开放的日趋深入,与旅游发达国家相比,我国旅游服务总体水平还不能满足经济社会不断发展和旅游消费者需求日益提高的需要,尤其是在旅游信息服务水平上仍存在较大的差距,旅游信息化发展中累积的一些共性问题严重制约了旅游信息服务水平,其中旅游基础数据服务成为制约旅游信息服务水平提升的瓶颈问题。
今年年初,国家旅游局局长李金早在《2015全国旅游工作报告》中明确指出,要积极主动融入互联网时代,用信息化武装中国旅游业和社会管理,全面革新管理方式,提高管理水平。开展“全国旅游基础数据库”项目,发展旅游大数据产业,是形势之必然,也是行业之所需。
全国旅游基础数据库建设主要包括建立标准体系、开发系统软件和应用系统、搭建硬件平台、建立数据采集和更新渠道、多模式应用等多个部分。数据库的数据来源包括两个:一是整合国家旅游局现有系统的数据,包括饭店、景区、旅行社、导游等信息数据,由国家旅游局相关业务系统负责更新;二是从互联网上抓取,是主动采集,根据需要选定范围和指向抓取所需数据,此类数据类型和范围要远大于传统数据库,且更新渠道顺畅,是数据库的主要数据来源。
灾备中心落户贵州:大数据产业全国领先
“灾备”是指为了应对灾难而设置的备份系统,这里的“灾难”包括了自然灾难、社会灾难和技术灾难三种。作为该项目第一阶段工作计划,国家旅游局大数据库异地灾备中心的建立是整个旅游大数据项目的必然保障,也是未来扩大互联网数据挖掘类型和范围的重要基础。
“旅游信息化发展曾经经历了重硬件轻数据的阶段,随着信息化的发展,特别是随着国家旅游局新机房的启动和数据增量的大幅上涨,目前已达到30T,数据的安全和完整就成为信息系统的重中之重。为了保证数据不因灾难发生而有所损失,最为有效的措施就是制作一模一样的备份放置在另一个安全的地方。” 该项目负责人说。
选择贵州,除了考虑到这里地理环境、风电水能等自然条件优势外,更重要的是贵州省大数据产业发展成熟,前景广阔,全国领先。早在2014年,贵州省就成立了在省政府办公厅领导下的大数据产业发展领导小组,陈敏尔省长任组长,成员包括了发改委、统计局、财政厅等43个省、市、区级部门。2014年,贵州全面启动了包括电子政务、工业、电子商务、智能交通、智慧旅游、食品安全和环保在内的“7+N”云工程建设。除此之外,中国电信、中国移动、中国联通三大电信运营商先后将大数据中心落户贵安新区,总投资150亿元,建成后机柜超10万个,服务器超200万台,形成超过2500PB的裸容量存储能力。
政府引导,上下合力,跨产业联盟,打造基础设施层、系统平台层、云应用平台层、增值服务层、配套端产品层的五个重点任务共同为贵州旅游大数据产业发展保驾护航,这也成为了国家旅游局大数据库灾备中心选址贵州的重要原因。
作为贵州省全面发展大数据产业以来第一个在贵州落地的行业数据灾备中心,该中心的建立不仅完善了数据安全体系,而且借此实现了多级数据融合和社会大数据的共享,探索了旅游大数据共建、共享、共管的新模式,对解决目前旅游大数据发展落地难的问题做了有益的尝试,将对全国范围的旅游大数据建设和应用提供借鉴。
在谈到数据的颗粒度和有效性时,该项目负责人指出:“数据的有效性一定是由数据的多样性决定的,国家旅游局目前最缺乏的是在途游客的行为需求分析数据,而贵州通过与运营商合作,有效的积累了这一内容,二者的合作可以弥补这一缺陷。国家旅游局的数据就像是‘大颗粒’,全面而宏观;贵州省的地方数据如同‘小颗粒’,细微而有针对性,二者相互融合,才能达到数据粗细有度,从而更好地发挥作用。”
旅游数据挖掘:更大融合 更多共享 更实利用
目前,“全国旅游基础数据库”已完成了《全国旅游基础数据库数据采集标准》的制定,并在苏州、安徽等地进行试点。申报了《旅游基础信息资源规范》、《旅游基础资源分类与编码规范》和《旅游信息资源交换系统设计规范》三个行业标准。
通过部署云端数据采集系统,使用机器人及爬虫等互联网技术实现了涉旅行业网站的定向抓取,通过对景区、酒店、旅行社等旅游关键要素的抽取,为基础数据库提供了宝贵的原始数据。目前已完成5星级、4星级酒店以及5A级、4A级景区的要素入库。
在7月9日的揭牌仪式上,国家旅游局、贵州省人民政府和中国联通公司负责人共同签署了《旅游基础数据库灾备中心和大数据应用战略合作协议》,标志着三方在通信服务、旅游云、旅游大数据等领域正式建立战略合作伙伴关系。下一步,国家旅游局将协同贵州省与联通公司利用两地数据中心和运营商数据,探索分析在途游客的行为需求。
“国家旅游局大数据库灾备中心落地贵州是对我们前期工作的肯定,同时更是一个旅游大数据融合开发利用的开始,如何通过政府的数据与我们运营商的数据相结合服务于旅游行业,是我们未来更重要的发展任务。”中国联通公司贵州分公司副总经理俞军方说。
据了解,“全国旅游基础数据库”项目将于今年年底通过验收,届时,该项目将以中国旅游数据分析平台的方式进行展示。项目负责人介绍说,这个平台上将会展示一些有待完善的分析模型,希望通过这个平台吸引更多的地方省市加入进来,一同致力于旅游大数据的完善和开发。
下一步,全国旅游基础数据库的发展建设还将进一步研究各地区在智慧旅游建设中,选择典型的省、市、旅游企业作为旅游大数据应用试点;计划与百度、谷歌、携程等在线旅游服务企业合作,共同建立旅游大数据采集机制和数据模型分析。
项目负责人强调:“关起门来做大数据是做不通的,大数据的未来一定是共建共享共赢的模式,按照行业的需求扎实前进,就一定能够被行业所接受和认同。”(彭艳娇/文)