TAG标签 | 网站地图 现代商业杂志,国内统一刊号:CN11-5392/F,国际标准刊号:ISSN1673-5889,全国中文流通经济类核心期刊
热门搜索:目录 管理会计 发展路径 市场营销 跨境电商 互联网金融 企业管理 企业财务管理 营销策略 构建

商业流通

当前位置:主页 > 文章导读 > 商业流通 >

基于多源融合数据的客流和消费测算方式

2026-02-11 15:34 来源:www.xdsyzzs.com 发布:现代商业 阅读:

魏玥12  蔡晓川12   全欣12   戴珂12  黄达12 

1.江苏省数字文化和智慧旅游发展中心江苏 南京 2100002.文旅消费大数据实验室江苏 南京 210000

摘要:随着文旅行业数字化进程加速文旅客流和消费数据对于文旅行业发展以及主管部门决策有着重要指引作用‌本文以江苏智慧文旅平台数据分析决策系统为研究对象,探讨其自2020年上线后形成的客流与消费测算方法论体系。通过整合手机信令、闸机计数、填报数据等多源信息,构建动态优化的监测模型,提出综合算法解决数据单一性与偏差问题,并在景区清零背景下验证模型鲁棒性。研究成果部分获文旅部认可推广,关键技术已申报国家专利和论文,为文旅行业数字化转型提供实践参考。

关键词:客流监测;消费测算;多源数据;江苏旅游

一、引言

随着数据要素成为第五大生产要素,文旅行业数字化进程加速。稳经济系列政策措施接连出台,宏观经济运行将延续恢复态势,文旅消费需求将进一步释放,文旅市场有望加快复苏、持续回升向好[1-2]2024年以来,  旅部乘势而上促进文旅消费,文旅市场持续升温。文旅消费数据对于文旅行业发展以及主管部门决策有着重要指引作用,但各地存在基础数据互不贯通,行业消费数据存在“横向不可比、纵向不可加”的情况无法用一杆秤、一把尺子衡量各地数据。因此,文旅客流和消费相关的一系列研究刻不容缓。

本文以江苏省为例,阐明主要的客流监测和消费测算方式。江苏省地处中国东部沿海地带,拥有丰富的地理资源和自然景观,是中国全国著名的旅游目的地之一。其13个设区市都是国家历史文化名城,如南京、苏州、扬州,这些城市拥有众多历史文化遗产和自然风光,如夫子庙、中山陵、拙政园、瘦西湖、金鸡湖等,吸引了大量国内外游客前来观光游览。截至2025年6月,江苏省共有266家4A级以上景区。其拥有的26家5A级景区,数量位居全国第一。江苏依托智慧文旅平台建设,实现“一机游江苏、一图览文旅、一键管行业”目标,其数据分析决策中心通过五年迭代形成完整监测体系。江苏智慧文旅平台通过运营商手机信令数据、景区闸机数据、景区计数摄像头数据对其中266家景区进行长期的客流监测,覆盖全省13个设区市。本文旨在系统梳理该平台在客流测算、消费分析领域的创新方法,解析技术难点与解决方案,并提出现存难点和下一步工作建议,为行业标准制定提供理论依据。

、客流监测方法

(一)景区乡村客流监测

近年来国内外研究学者着眼于客流时空分布特征分析、客流监测模型构建、客流管理研究。基于季节性指数、移动平均比率等一系列时空分析指标对景区客流的季节分布规律和空间结构进行研究[3];基于大数据分析旅游流时空分布特征[4-5];基于微博签到大数据研究旅游景区客流波动特征[6];通过挖掘客流量的深层次信息改善经营管理策略、优化人力资源、分配旅游资源[7-10]。应用智能视频分析技术实现景区客流统计[11]。但大多受限于问卷调查的体量、抽样的科学性、统计的滞后性,以及数据源的单一性。在长期监测过程中,发现各数据源均存在一定的优势和不足,仅使用单一渠道来源数据会造成数据整体误差较大。因此,本文推出一种融合多源数据的客流监测方法,以填补这一空白和误差。

本算法在南京大学IIP研究组(南京大学智能信息处理研究组)指导下,综合运营商手机信令、闸机、计数摄像头、社保卡文旅一卡通、景区填报等数据通过对监测点位的分类分级,结合不同场景定制化客流监测算法规则[12-13]。该模型就如同一个“筛子”,从海量的手机信令数据中,筛选出满足各种场景下,符合游客定义条件的数据,从而获得客流数据。具体算法如下:

1.信息采集。在厅资源开发处指导下,通过文旅行业监测点信息采集系统按照统一的景区上报规则由市局统一收集上报监测点位名称、边界范围、开闭园等基础信息

2.景区聚类‌。依托于南京大学智能信息处理研究组能力,利用聚类算法将汇集的基本信息聚类成普通封闭、古村古镇、郊野公园、开放街区等8种类型,不同类型采用不同规则计算。例如:红山森林动物园等普通封闭类景区,此类景区具有明确的地理边界开闭园时间,可配置相对固定的停留时长和停留区间七里山塘等开放街区类景区,无明确地理边界,需配置相对宽松的停留时长和停留区间。

3.识别游客‌。根据停留时间(至少30分钟)、访问频率(非高频次)、游览时段(符合开园时间)等特征,且不为常驻用户(包括工作人员、周边居民),计为1人次同时利用黑名单规则剔除噪声,例如:一个手机号码连续15天且每天大于3小时出现在景区,则会被认为是工作人员。

4.数据扩样。由于存在一人多卡、部分儿童老人无法有效识别等情况,需利用融合了游客客源地情况、不同市县通信运营商用户占比、景区特征等因子的网间结算系数对原始数据进行扩样。

5.数据校准。定期使用闸机、一卡通、景区填报等数据交叉验证,确保结果准确。借助疫情期间景区客流清零的契机对景区客流进行校准。采取抽样调查(对20家景区发放调查问卷,设立23家文旅大数据观测站)、现场勘测(委派专人前往南京、苏州、徐州、无锡、常州等超50家重点景区,扬州、镇江、南京等10余家乡村旅游重点村现场勘测)、会议访谈(联动13市调研266家重点景区、75家乡村旅游重点村客流情况)等方式进行交叉比对,控制客流监测准确率达到90%以上。

(二)文博场馆客流监测

与景区乡村客流监测不同,文博场馆客流监测需要考虑部分文博场馆面积较小存在楼层重叠影响等因素,如:江苏省文化馆处在江苏文化大厦多楼层,信令数据无法区分纵向的边界,无法使用信令进行监测。为解决无法有效使用信令数据进行监测的问题,本算法使用运营商与闸机数据(社保卡文旅一卡通)相结合方式监测在厅博物馆处和南京大学IIP研究组指导下,根据采集的博物馆信息将其聚成三大类:

1.单体建筑。单体建筑具有明确的地理边界隔离和开闭园时间,游客通过固定出入口进出场馆。此时运营商数据和闸机数据无较大偏差,因此,闸机数据稳定且质量高的,优先使用闸机数据闸机数据不稳定或者缺失,自动切换为运营商数据。另外由于部分场馆节假日客流较大,会临时开放侧门、增加进出口,导致闸机统计遗漏。因此会将闸机实时客流和运营商实时客流进行自动匹配,判断是否需要运营商数据进行补位。

2.小型建筑。小型建筑场馆面积较小,使用运营商监测存有较大误差,因此优先选择闸机数据。例如:南京六朝博物馆面积较小且与酒店相邻,优先使用闸机数据。

3.存有室内基站建筑。室内基站通过信号强度、三角定位等技术,可实现3至5米精度的实时定位,因此优先选取运营商监测数据。

(三)去重方法

为了确保旅游监测数据的准确性和科学性,江苏省对全省范围内的A级旅游景区、省级以上乡村旅游重点村、省级以上夜间文旅消费集聚区以及博物馆的游客数据进行‌跨区域、跨类别去重统计可有效避免重复计算,反映真实客流量。如:同一游客可能在假期内游览省内多个景点(上午参观南京博物院、下午游览苏州园林、晚上参与无锡夜间文旅消费活动)。若简单叠加各点位数据,该游客会被重复计算多次。去重处理后,无论游客在省内活动范围多广,均计为‌1人次‌,从而更真实反映全省实际接待的‌独立游客数量,以便精准评估市场吸引力,从而科学指导政策制定与资源配置。去重方法核心是为了‌剔除数据泡沫、还原市场真相。它确保了“游客人次”指标反映的是‌独立个体的实际到访‌,而非“游览次数”,为政策制定、市场分析和资源分配提供‌可靠依据。

‌具体去重方法如下:将江苏省作为整体,对全省A级旅游景区、省级以上乡村旅游重点村、省级以上夜间文旅消费集聚区和博物馆游客进行去重。即,游客在省内无论去过多少个景区、重点村、集聚区、博物馆,满足往返条件的计为1人次。

1.省外游客。以江苏省全域为统计单元,常驻地为省外的游客,当日无论访问省内多少个文旅场所(含跨城市访问),仅计为1个省外人次。例如:在南京参观两个及以上景点的人次最多,因此南京去重游客最多。

2.省内跨城市游客。常驻地为省内城市的游客,在全省范围内跨市访问多个文旅场所,仅计为1个省内跨市人次。

3.本市游客。常驻地为本市游客,在本市范围内访问多个文旅场所,仅计为1个本市人次。

三、游客消费测算方法

(一)景区游客消费测算

近年来国内外研究学者在消费测算方面聚焦于旅游消费的影响因子、变化趋势、经济效益,规模预测。使用通径分析法研究了投资以及消费两个要素对5A级景区经济效益的影响[14];采用均衡比系数、基尼系数对5A级景区的空间分布进行均衡性与经济效益分析[15];发现旅游对区域经济发展的贡献度[16];使用ADF单位根检验、Granger因果关系检验和协整分析研究了碳排放对我国旅游经济增长的影响[17];研究出入境旅游需求的影响因素、空间计量经济分析[18-19];比较国内旅游收入预测模型,对旅游发展规模进行预测[20-21]。但对于旅游吸引物的游客消费测算方式尚未突破,并且无统一的测算标准。因此,本文按照不同类别的旅游吸引物制定不同的游客消费测算方式,以满足不同场景需求。

本算法基于省级重点实验室—文旅消费大数据实验室研究能力,结合银联消费、美团数据,联合南大、东大研究院,自研出游客消费大数据测算方法并投入生产环境[22-23]。具体算法如下:

1.汇集数据。研究消费者选择文旅产品或服务的动机分析消费者的旅游消费习惯。依托美团文旅研究院收集的吃、住、行、游、购、娱旅游六要素等互联网消费数据,银联商务江苏有限公司收集的通过银联支付渠道产生的消费数据、入境消费数据,研究消费者选择旅游产品或服务时最关心的因素,例如价格、目的地、交通方式、住宿条件、活动内容等。汇集景区周边3公里内的各行业的平均消费数据,包括商家名称、人均消费金额、地址、成交数等。

2.消费测算。基于文旅消费大数据实验室自研能力,联合南大、东大研究院,使用运营商和行业消费数据构建消费算法模型,分别测算餐饮、住宿、旅游、购物、娱乐五个方面的消费水平,并对所得结果进行汇总。即,去过景区的游客,在景区周边3公里内,产生的餐饮、门票、娱乐消费,加上在当地产生的住宿、购物消费,均为景区游客消费。

3.交叉验证。在上述模型的基础上,参考产业发展处提供的收入统计数据、23家文旅大数据观测站消费数据、13市消费数据进行比对拟合,使得数据更加符合实际情况

4.拓展延伸。乡村旅游重点村、夜间文旅消费集聚区测算方法参照景区。其中,乡村旅游重点村游客消费测算按照红色旅游康养度假农事休闲亲子研学赏花胜地、文化体验乡村美宿七大类进行分类测算。夜间文旅集聚区消费测算时间段为晚18时至凌晨6时(与文旅部监测时间段一致)。

(二)银联消费测算

在中国旅游研究院专业指导下,银联消费数据与文旅部口径保持一致。全国共有广东、湖南、湖北、四川、重庆、陕西等15个以上省份使用,全省共有南京、无锡、苏州、镇江、泰州5市使用。本算法基于银联商务收单数据,按照吃住行游购娱构建文旅消费测算模型包含支付宝、微信、银联自有渠道三方数据。全省银联渠道异地文旅消费指:使用异地银行账户通过银联支付渠道产生的消费,包括:吃(就餐场所和餐馆等)、住(酒店及服务等)、行(航空、铁路、公路等)、游(景区门票等)、购(购物商店等)、娱(KTV、休闲场所等)、综合(旅行社及相关服务)。银联全省文旅消费包含本地居民消费,异地文旅消费更客观反映游客消费情况。

四、关键技术挑战与突破

(一)数据口径问题

客流数据口径方面,由于江苏智慧文旅平台监测数据属于小口径,部分时间段与财务抽样调查数据在数量级、同比增幅、人均消费等方面出现数据不匹配的情况。主要原因是两个方面:一是监测对象不同。江苏智慧文旅平台侧重景区、博物馆、乡村旅游等文旅场馆游客量;财务处侧重“离开惯常环境10公里且超过6小时”游客位移情况。二是数据来源不同。江苏智慧文旅平台使用电子围栏、票务系统等实时监测的数据;财务处采用抽样调查和景区填报的复合数据源,依赖抽样调查规模和填报数据真实性。

消费数据口径方面,旅游总收入是整个地区“在一定时期内通过销售旅游商品而获取的全部货币收入”,包括了旅游产生的食、宿、行、游、购、娱。但受制于数据源和算力,大数据监测的游客消费不包含出行消费,也不包含景区3公里外的消费。江苏智慧文旅平台仅测算景区、乡村等文旅场馆拉动消费,即游客需去过场馆才纳入消费监测;财务处包含所有游客位移产生的消费,如通勤消费,消费监测范围不同。

(二)数据精度问题

客流数据精度方面,部分监测点位存在扇区匹配度不够、基站扇区存在定位偏差乡村等偏远地区未部署5G基站、儿童无手机等情况运营商数据扩样使用的网间系数更新不及时算法不够精准,制约数据监测精度进一步提升。

消费数据精度方面,现有消费算法仍采用客流量×人均消费方式,忽略部分影响消费的因素,如景区承载力、游客舒适度、餐饮翻台率、酒店入住率、酒店动态定价等实时因素,节假日高峰期可能会影响实际消费规模。这些技术缺陷制约监测准确性,亟需引入边缘计算和动态权重算法升级。

(三)数据源问题

客流数据源方面,能够有效提供客情数据的供应商仅为有限的通信运营商(电信、移动、联通)和位置服务提供商(阿里高德、腾讯地图、百度地图)。腾讯、百度SDK数据精度较高,但价格昂贵(平均每个点位2万元),易受终端品牌偏好影响(常州某充电企业业务调整导致银联交通消费数据骤降,实际为SDK未能及时捕捉用户转向其他支付渠道的行为,暴露单一来源数据风险)。我们采用的运营商数据,价格合适(平均每个点位1000元)且相关因子(停留时长、扇区匹配)均已处于准确稳定状态。

消费数据源方面,OTA平台受限于自有平台主营业务和市场占比,经常出现消费增幅不一致的情况,如携程主营机票和酒店业务、途牛主营团队游业务、美团主营餐饮和娱乐业务,因此在自研消费算法模型中,对于不同因子采取不同入参,如在餐饮消费测算中,选取实力较强的美团餐饮数据作为入参。

五、结论与展望

(一)“政产学研”多方联动

2024年起,基于多源融合数据的客流和消费测算方式所得结果已为旅游总人次和总收入的抽样统计赋能提供过夜率、过夜人数、人均花费等重要参数下一步将充分利用文旅消费大数据实验室相互关系,联动东南大学、南京大学、美团文旅研究院、厅财务处,将财务处的数据作为入参和因子放入算法中,基于实验室强大的测算能力、产学研相互结合的能力,进一步优化客流监测和消费测算模型。构建“政府数据+学术算法+企业资源”的铁三角模式,辅助旅游统计从“抽样估算”到“全量计算”的升级。

(二)迭代优化数据模型

下一步将依托文旅消费大数据实验室及数据观测站,利用多源数据融合方式,结合运营商基站数据与景区GIS坐标,采用AI技术建立动态权重分配模型弥补扇区、反推系数、儿童无手机等问题,提高客流监测和消费测算模型精度在消费测算模型方面,下一步将餐饮翻台率(美团数据)、酒店入住率(OTA数据)、景区承载量(票务系统)等因子融入消费算法模型,提高消费数据精度。

(三)引入新型核心数据源

为进一步完善文旅数据监测体系,提升数据覆盖能力与时效性,下一步将持续引入新型核心数据源。一是以大模型应用为切入点,引入百度、高德和支付宝等数据源,创新算法模型,逐步实现全量游客、旅游收入等数据的实时监测。这是全国范围内,支付宝首次以接口的方式从海量支付数据中剥离文旅相关消费数据,提供地方政府部门使用可有效覆盖景区二消、文创市集等现金交易盲区。二是以文旅消费大数据实验室为切入点,协同银联商务共同研发基于银联渠道数据的实时消费数据模型,为江苏输出小时级的实时消费数据,进一步提升数据的及时性。三是与舆情系统关联,逐步将新兴旅游吸引物、乡村旅游点,以及新型公共文化空间等纳入监测,掌握其发展趋势。

参考文献:

[1]戴斌.加快创新集成完善现代旅游业体系[J].中国国情国力,2024,(11):1.

[2]厉新建,曾博伟,张辉,等.新质生产力与旅游业高质量发展[J].旅游学刊,2024,39(5):15-29.

[3]Tak k, Chi C Y. A Study in the Seasonal Variation of Japanese Tourist Arrivals in the Singapore[J].Tourism Management, 2002,23(4):127-131.

[4]闫闪闪,梁留科,索志辉,等.基于大数据的洛阳市旅游流时空分布特征[J].经济地理,2017,37(8):216-224.

[5]戴文, 丁蕾, 吴晨,等. 基于大数据的旅游流时空分布特征研究——以南京市为例[J]. 现代城市研究, 2019(2):8.

[6]陈晓艳,张子昂,胡小海,等.微博签到大数据中旅游景区客流波动特征分析——以南京市钟山风景名胜区为例[J].经济地理,2018,38(9):206-214.

[7]王永敏.客流分析系统为商业运营添加动力[J].信息与电脑,2006(6):36-38.

[8]刘泽华,张捷,吴小根,等.特殊时段旅游客流时间分布对旅游地理结构响应研究——以北京,黄山,西安TDD黄金周旅游客流为例[J].人文地理,2010(1):129-133.

[9]赵东喜.中国省际入境旅游发展影响因素研究——基于分省面板数据分析[J].旅游学刊,2008(1):41-45.

[10]罗浩,颜钰荛,杨旸.中国各省的旅游增长方式“因地制宜”吗?——中国省际旅游增长要素贡献与旅游资源比较优势研究[J].旅游学刊,2016(3):43-53.

[11]马乐,叶见新,王晖.旅游景区智能客流统计系统应用研究——以玄武湖为例[J].中国科技信息,2013(2):88-89.

[12]尹子茂,黄达,全欣.景区客流的优化监测研究——基于多源融合数据[J].西部旅游,2022(14):1-8.

[13]魏玥,黄达,黄睿,等.新时代背景下江苏省旅游客流时空分布演化分析——基于以运营商手机信令数据为核心的客流大数据[J].现代商业,2024(15):122-126.

[14]袁诚,侯哲灏,陈景祺.中国 5A 级景区分布特征及其经济效应探讨[J].地域研究与开发,2015(4):74-79.

[15]曹彦,纪志荣.中国5A级旅游景区景点系统空间分布特征与经济效应分析[J].福建金融管理干部学院学报,2018(2):38-46.

[16]张帆.旅游对区域经济发展贡献度研究[M].北京:经济科学出版社,2003.

[17]王凯,李娟,席建超.中国旅游经济增长与碳排放的耦合关系研究[J].旅游学刊,2014(6):24-33.

[18]蒋依依,刘祥艳,宋慧林.出境旅游需求的影响因素——兼论发展中经济体与发达经济体的异同[J].旅游学刊,2017(1):12-21.

[19]杨维琼,张华.外国人来华旅游的空间计量经济分析[J].旅游学刊,2015(9):16-24.

[20]关勇,麻永建,朱诚.我国国内旅游需求影响因素分析及规模预测[J].河南科学,2007(3):513-516.

[21]纪成君,何建军.国内旅游收入预测模型的比较[J].辽宁工程技术大学学报(自然科学版),2010,29(5):990-993.

[22]黄达,蔡晓川,魏玥,等.基于分总策略的景区日消费测算探究[J].旅游纵览,2023(14):165-169.

[23][黄达,蔡晓川,李树春,等.融合多源数据的目的地旅游消费全量测算模型[J].西部旅游,2023(24):88-90.

相关内容
发表评论