TAG标签 | 网站地图 现代商业杂志社-国内统一刊号:CN11-5392/F,国际标准刊号:ISSN1673-5889,全国中文流通经济类核心期刊
热门搜索:目录 人力资源管理 企业 人力资源 现代商业杂志 农产品 大数据 影响 影响因素 上市公司

商业流通

当前位置:主页 > 文章导读 > 商业流通 >

生鲜电商顾客网络评价数据的文本挖掘研究

2021-10-14 17:20 来源:www.xdsyzzs.com 发布:现代商业 阅读:

李林凤 孙菁 刘杨 湖南农业大学

基金项目:湖南省教育厅科学研究项目(19C0924);湖南省哲学社会科学基金(18YBQ070);湖南农业大学青年科学基金项目(18QN07);湖南农业大学商学院青年博士支持计划项目。

摘要:在数字乡村发展战略指导下,我国生鲜电商进入了快速发展期。提高顾客转换率和留存率是生鲜电商赖以生存的关键,对顾客评价数据进行情感挖掘,将有助于把握顾客关注重心,优化供给。为此,本文以1号店评价数据为例,通过高频词特征、语义网络和情感分析等方法,深入探究生鲜电商顾客的关注点和情感倾向。研究表明:生鲜电商顾客的关注点在商品特征、物流服务与平台保障三个方面,且对快递和包装方面评价较高也最为重视;分析发现海鲜类商品的顾客评价显著偏低,蔬菜类商品的顾客评价显著偏高,此外,新鲜度的情感得分普遍偏低,是生鲜电商继物流后下一个改进重点。

关键词:生鲜电商;网络评价数据;文本挖掘;情感分析;1号店

一、引言

20195月政府出台的《数字乡村发展战略刚要》指出,政府正在着力打造数字乡村,推进实施互联网+”农产品出村进城工程,并在不断深化电子商务进农村综合示范,培育农产品电商品牌。根据商务部发布20191月~8月电子商务行业主要指标,截至20198月,网上商品总零售额为64393亿元,增速为16.8%,其中农产品网络零售额为1873.6亿元,增速为25.3%,由此可见,中国农产品电商正在脱贫攻坚和乡村振兴国家战略支持和推动下,持续高速发展。2020年初,新型冠状病毒肺炎爆发,隔离病毒同时,也迫使民众开始适应和习惯线上采购生鲜产品,给生鲜电商带来前所未有发展契机。

目前,各大农产品生鲜电商平台发展势头迅猛[1],而风口过后,唯有顾客满意度高的企业才能获得认可,从而实现长期占领市场。然而,由于生鲜电商行业发展仍处于初始市场争霸阶段,整体服务水平仍不稳定,生鲜电商对顾客偏好的了解相对于服装、电器、书籍和食品等大宗商品显著偏少。因此,明确生鲜电商顾客的关注重心和评价现状,是当务之急。

在大数据驱动时代背景下,本文以1号店顾客评论数据为研究案例,利用高频词分析、网络语义分析和情感分析等文本挖掘方法,对评论数据进行抽取、提炼和归类统计,获取顾客的关注点,分析顾客对各关注点的情感倾向,并给出相应管理优化建议,为完善和提升生鲜电商服务管理质量提供参考。

二、文献综述

文本挖掘技术开发与应用,长期以来都是一个备受关注的研究课题。陈晓云(2005)系统而全面介绍了文本挖掘的常用流程和使用领域[2]Ur-Rahman2012)应用文本数据挖掘技术发现有用的知识,应用聚类技术与先验关联规则挖掘,确定文本数据中讨论的关键问题,帮助决策者或知识工作者更好地管理他们未来活动[3]。郭立秀(2015)指出文本挖掘是把文本转化成数据进行分析,最后提取文本中有价值信息[4]。韩培文(2016)编写爬虫算法来挖掘京东书城顾客评论,进而获取影响顾客体验满意度因素[5]Nogueira2018)运用文本挖掘技术从Twitter收集数据,分析得出五个品牌资产维度:品牌意识、品牌忠诚度、感知情绪、感知质量和品牌联想[6]。现存文本挖掘技术的相关研究为其广泛应用奠定了坚实基础。

近年来,随着互联网数字信息化的快速发展,文本挖掘的研究热潮被再次掀起,被应用到各种场景之中。刘芳羽(2019)开始将文本挖掘应用到了家庭医生评价体系中,为家庭医生服务政策实施效果进行评价[7]。李清镇(2019)使用朴素贝叶斯方法和LDA主题模型,对笔记本电脑的评论数据进行文本挖掘分析[8]。赵春艳(2019)以携程网游客点评文本为数据来源,利用文本内容分析法分析古镇游客满意度影响因素及其优化对策[9]Lu2019)利用台湾中央研究院中文知识与资讯处理组开发的文字挖掘技术与中文分词程式,分析14家电子商务公司的脸书帖子,揭示了影响社交媒体帖子吸引消费者注意力的关键因素[10]Jung2019)利用文本挖掘技术在35063份在线员工评价中确定了工作满意度因素[11]Buzova2019)使用文本挖掘技术研究指出,游轮旅客对旅游感到高兴的主要主题包括导游表现、旅游安排以及游轮目的地观光[12]Sezgen2019)为研究顾客对全方位服务和低成本航空公司以及经济舱和高级舱满意和不满意的主要驱动因素,采用文本挖掘和分类技术,分析在线用户生成的50家航空公司5000多条乘客评论,倾听顾客的声音[13]Filipa2020)随机抽取美国7个城市的3877份餐馆评论,采用文本挖掘技术,基于先前验证量表,提出一个特定品牌真实性、消费者品牌参与度和相关结构的聚合词典,该词典有助于实现更为多方面的功能分析[14]

生鲜电商作为电商巨头近期激烈抢占的新战场,与之相关的研究也随之获得广泛重视。胡天石(2005)系统分析了农产品在产品特点、交易特点及市场特点等方面与网络的适应性[15]。梁文卓(2012)从网购农产品种类、品质保证、消费风险及品牌树立四方面来分析网购农产品特点[16]。谭本艳(2016)指出为推动中国生鲜农产品电商发展,企业要积极创新电商模式,政府也要在冷链物流、农产品质量标准化体系建设等方面加大扶持力度[17]。王鹏远(2017)从生鲜农产品电子商务目前发展现状入手,分析了当前生鲜农产品电子商务的主要问题[18]。聂昌腾(2019)运用科学计量可视化软件CiteSpace对农产品电商文献进行计量分析,为国内学者进一步深入研究生鲜农产品电商提供借鉴[19]。孙宇(2019)以稻米产品在线评论数据为基础,研究得出影响顾客满意度的物流因素[20]。然而,挖掘顾客反馈和需求作为生鲜电商持续稳定发展的关键环节,现存生鲜电商相关研究中却鲜有涉及。

综上所述,现存文本挖掘和生鲜电商相关文献为研究提供了理论与方法基础,但将文本挖掘技术与顾客评价相结合的方法应用到生鲜电商场景里的研究还十分有限,有待深入探索。

三、研究对象与数据

(一)案例对象选择

由于我国生鲜电商兴起时间尚短,许多电商平台的用户评论数据数量和完整度不足,因此,本文特选取开创中国电子商务行业网上超市先河的1号店作为案例对象。1号店顾客评论数据量大,且涉及范围广,能够反映生鲜电商顾客的总体需求,具有代表性。

(二)研究数据

本文采用八抓鱼数据采集器,在采集器中根据京东和1号店网页特点编制相应操作循环,进行数据采集。数据采集时间主要集中在1031日至1130日,共抓取了451182条,关于海鲜水产、蔬菜、水果与肉类四种生鲜农产品的顾客评论数据。

四、研究过程

(一)基于高频词分析的关注点挖掘

将爬取到的1号店所有评论数据导入BDP数据处理器中,BDP处理器会自动对数据进行去重处理形成工作表,在工作表基础上创建图表,选中词云图功能创建出1号店所有评论数据词云,然后以表格形式导出。表格中包含排名前100高频词,本文选取排名前60高频词做展示,见表1

1 顾客评论文本中的高频词统计表

表1 顾客评论文本中的高频词统计表

通过对表1中高频词进行整理归纳,可得生鲜电商顾客评价的关注点主要集中在商品特征、物流服务和平台保障,具体分析如下:

1.商品特征。包括产品质量、新鲜度、外观、口感和性价比。相关具体评论有肉质,口感不错,值得购买,真正是价廉物美”“非常美味,价格实惠,我天天都可以吃牛排了”“牛排肉质鲜嫩,孩子非常喜欢吃等,该类特征词主要关注商品本身所具备的特征,说明顾客在生鲜电商平台购物满意与否,很大程度与商品本身特征是否满足顾客期望有关。

2.物流服务。包括快递效率、包装合理性与完好度和配送服务。相关评论主要有保温做的非常好,保温箱+冰袋,快递早上给打电话送件,因正在上班,下班后晚上才去取快递”“快递速度很快,包装的很好没有损坏,好评”“收到箱子都开口了,可能有漏掉的,斤数少了!等。维持产品新鲜度,生鲜农产品常用物流配送方式是冷链物流,配送服务质量是顾客的关注重点。

3.平台保障。包括网店信誉与客服。具体评论有客服十分细心周到!”“收到的货和这网上完全一样,希望商家诚信经营,不要误导消费者,顾客至上,最讨厌被骗”“和照片中有太大差距,不是特别新鲜,向是陈的土豆等。平台保障水平对顾客购物体验有着至关重要的影响,而顾客购物感知效用又直接作用于顾客满意度和重复购买意愿,因此,顾客对于网店信誉和客服表现也非常重视。

2 顾客评论关注点提取

表2 顾客评论关注点提取

2所列关注点,已另用京东生鲜评论数据进行检验,提取结果与表2分类基本一致,证明表2分类具有一定代表性。

(二)网络语义分析

在对1号店顾客评论高频词进行归纳整理后,为进一步了解顾客的关注重心,还需要探究各高频词之间存在的内在关联特征。本文采用由武汉大学开发数据分析软件ROST CM6“功能性分析社会网络和语义网络分析模块来统计网络评论语义关联词频并制作出1号店顾客评价语义关系图,见图1

图1 网络语义图

1 网络语义图

根据1号店顾客评价语义关联词频表可以看出,物流”“新鲜”“包装”“味道这几个词出现频率较高,在1号店顾客评价语义图中包装”“很快”“快递成为整个与语义图的关键节点。下面,对1号店的网络语义图进行详细分析:

1.包装。与包装相联系高频评论词主要有满意”“新鲜”“口感”“个头”“完好等,说明顾客在评论所购生鲜产品包装是否满意时,通常会考虑收到产品新鲜度、质量与包装物规格以及包装完好度等方面。在与包装相联系的高频词中包含如满意等正向评价词,说明顾客对于1号店生鲜产品包装总体较为满意。

2.快递。与快递联系形成网络高频评论词主要有下单”“送货”“好吃”“态度”“服务等。说明顾客在平台下单成功后,就会着重关注自己产品物流状态,快递从下单到送达所需时间会在很大程度上影响顾客对此次购物满意度。物流配送正式结束是在顾客签收时,在这一过程中,顾客感知不仅来源于快递速度,还关乎物流配送服务,例如快递小哥服务态度等,因此,配送服务也成为影响顾客关注的重点。

3.很快。与很快关联高频评论词主要有送货”“收到”“物流”“速度服务等。很快是正面评论词,可见1号店生鲜专区大部分顾客对该平台物流运输速度较为认可。

物流服务是生鲜电商提供服务的必备质量,即服务质量好不加分,而服务质量不好则会引起顾客的强烈不满。根据本小节的网络语义分析可知,生鲜电商顾客目前最重视物流服务,同时,也对该环节表现较为满意。

(三)情感分析

为进一步考察顾客对生鲜电商服务关注点的服务认可度,本小节采用ROSTCM6情感分析功能对1号店爬取数据进行情感分析。

首先,进行总体测算,得到积极情绪占比80.88%,消极情绪占比10.61%,中性情绪占比8.5%,可见顾客总体评价的情感倾向偏积极,但仍有较大优化空间。

然后,利用断点回归统计对不同品类的情感倾向得分进行对比分析,统计结果如表3所示,断点回归拟合曲线图如图2所示。可见,1号店的海鲜情感得分相较于其他品类最低,而蔬菜相较于其他品类情感得分显著最高。1号店的水果和肉类的情感得分则显著优于海鲜而低于蔬菜,但相互之间的差别不显著。

各品类情感得分断点回归统计

表3各品类情感得分断点回归统计
图2  四种品类情感得分断点回归统计拟合图

2  四种品类情感得分断点回归统计拟合图

接着,为考察不同关注点的情感倾向,则把1号店总体数据按照关注点进行划分,利用情感分析工具统计出顾客对于不同类目关注点的情感分布,见图3

图3 顾客关注点的情感分布比较图

3 顾客关注点的情感分布比较图

1号店不同关注点的情绪占比分布来看,客服与新鲜度两个因素积极情绪占比相对较低,说明顾客在1号店生鲜平台购物时,对客服依然存在较多不满情绪,同时,尽管物流配送速度较快,但商品新鲜度仍未达到理想水平,还有较大提升空间。

最后,为进一步深入挖掘各品类关注点的用户情感倾向,分别对1号店海鲜水产类、蔬菜类、水果类与猪牛羊肉类评论数据,按照各品类下的关注点进行积极情绪占比对比分析,统计结果见图4

图4 四种生鲜品类积极情感占比对比图

4 四种生鲜品类积极情感占比对比图

根据图4统计结果进行分析,详细描述如下:

1.海鲜水产。海鲜品类表现最为均衡,其中,在新鲜度和网店信誉两方面积极情绪占比最为突出,说明1号店海鲜水产品类具较强市场竞争力,属于生鲜大类下拳头产品。而海鲜水产品类外观因素表现最差,说明海鲜水产产品在外观上给消费者直观感受与网络宣传存在一定差距。由于海鲜产品利润相对其他生鲜品类高,且相对于线下销售有着不受地域限制的天然优势,因此,1号店应该加大海鲜水产产品运营投入,探求保鲜保形技术,满足消费者对海鲜外观的展示需求。

2.蔬菜。蔬菜品类新鲜度和性价比积极情绪得分较低,说明影响1号店蔬菜品类满意度主要因素在于性价比偏低。蔬菜保鲜难度大,利润相对微薄,性价比与线下超市和菜市场无法抗衡,因此,1号店在蔬菜品类方面应该更加关注具有地方特色和品种特色菜品,通过突出差异化来提升产品性价比。

3.水果。水果品类表现波动较大,外观、口感、性价比、快递效率和配送服务积极情绪占比都最为突出,与此同时,质量、包装设计和网店信誉积极情绪占比又相对偏低,说明1号店水果品类应该更加注重包装设计,以减少运输途中对水果品质可能造成的伤害,从而通过提升水果到达顾客手里的完好率,提升总体质量,提高1号店在水果品类信誉。

4.肉类。肉类品类新鲜度、口感、包装设计和客服积极情绪得分占比最低,快递效率和网点信誉积极情绪得分占比也显著偏低,说明1号店肉类产品在口感上还不能满足消费者需求。肉类产品口感随存放时间增加而显著下降,因此肉类产品快递效率和包装设计尤为重要。同时,肉类产品与线下超市和菜市场竞争较为激烈,民众对肉类产品口感要求也各不相同,这就需要1号店在肉类产品销售中,要更加注重口感方面描述,将不同肉类产品在口感上的区别更加准确的呈现给消费者,以减少消费者期望误差。

由此可见,生鲜电商顾客对不同品类下的关注点满意度具有较大差异,需要电商企业采取针对性的改进方案,逐一提升。

五、总结与建议

(一)研究结论

本文以1号店生鲜顾客评价数据为输入,首先通过高频词特征分析,得出商品特征、物流服务与平台保障三个方面为顾客的核心关注点。然后,通过网络语义分析得出了包装快递很快三个关键节点,指出生鲜电商顾客最为注重物流服务和配送速度,且目前对此较为满意。最后,通过情感分析方法发现,生鲜利润较高的海鲜类产品顾客评价偏低,而蔬菜品类表现较优;分别对关注点进行情感倾向分析发现,尽管生鲜电商在快递和包装方面表现较为成熟和完善,但在客服和新鲜度方面依然有很大的提升空间,是继以后的优化重点;四大品类生鲜商品在不同顾客关注点的情感倾向得分也不尽相同,需要进行有针对性的优化调整。

(二)对策建议

本文基于以上研究对生鲜电商运营管理优化提出以下建议:

从商品特征角度,在保障商品采购质量前提下,应重点关注生鲜产品新鲜度,以及外观与描述的一致性,提升生鲜商品品质标准化程度。

从物流服务角度,应加快完善冷链物流全覆盖,加强包装设计,减少由配送造成的品质损耗。

从平台保障角度,应进一步提升和完善客户服务建设,及时准确的响应用户咨询和反馈,避免顾客与企业之间产生心理疏离,降低顾客在生鲜电商消费的感知风险。同时,应进一步完善商家认证和担保机制,从平台角度为顾客把关,保障顾客权益,降低顾客线下向线上的转移成本。

从商品品类资源投入角度,生鲜电商现阶段应侧重于发展海鲜和水果两大附加值高的生鲜品类,充分发挥物流配送和精选产地采购优势,而针对蔬菜和肉蛋两大品类,则应根据市场细分提供与线下形成差异化的产品和服务。

生鲜电商未来发展充满机遇与挑战,谨以此研究为其发展提供参考和借鉴。

参考文献:

[1]洪勇.我国农村电商发展的制约因素与促进政策[J].商业经济研究,2016(04):171-173.

[2]陈晓云.文本挖掘若干关键技术研究[D].上海:复旦大学,2005.

[3]Ur-Rahman N, Harding J A. Textual Data Mining for Industrial Knowledge Management and Text Classification: A Business Oriented Approach [J]. Expert Systems with Applications, 2012, 39(5):4729-4739.

[4]郭立秀.基于文本挖掘的生鲜电商顾客满意度研究[D].成都:西南交通大学,2018.

[5]韩培文.基于文本挖掘技术的顾客体验满意度研究[D].哈尔滨:黑龙江大学,2016.

[6]Nogueira E, Tsunoda D F. A Proposed Model for Consumer-Based Brand Equity Analysis on Social Media Using Data Mining and Social Network Analysis [J]. Journal Relationship Marketing, 2018, 17(2): 95-117.

[7]刘芳羽,赵静,李泽,黄敏婷,赵秉元.运用文本挖掘法探索北京市家庭医生评价体系的建立[J].中国全科医学,2019-11-28.

[8]李清镇.基于文本挖掘的笔记本电脑网评分析[D].兰州:兰州财经大学,2019.

[9]赵春艳,陈美爱.基于网络文本分析的游客满意度影响因素分析[J].统计与决策,2019,35(13):115-118.

[10]Lu R S, Tsao H Y, Koong Lin H C, et al. Sentiment Analysis of Brand Personality Positioning Through Text Mining [J]. Journal of Information Technology Research, 2019, 12(3):93-103.

[11]Jung Y, Suh Y. Mining the Voice of Employees: A Text Mining Approach to Identifying and Analyzing Job Satisfaction Factors from Online Employee Reviews [J]. Decision Support Systems, 2019, 123: 542-550.

[12]Buzova D, Sanz-Blas S, Cervera-Taulet A. 'Tour Me Onshore': Understanding Cruise Tourists' Evaluation of Shore Excursions Through Text Mining[J]. Journal of tourism and cultural change, 2019, 17(3):356-373.

[13]Sezgen E, Mason K J, Mayer R. Voice of Airline Passenger: A Text Mining Approach to Understand Customer Satisfaction[J]. Journal of Air Transport Management, 2019, 77(6): 65-74.

[14]Filipa R P, Sandra M C L, Ricardo G B. How Brand Authenticity and Consumer Brand Engagement Can Be Expressed in Reviews: A Text Mining Approach [J]. Journal of Promotion Management, 2020, 26(4): 457-480.

[15]胡天石.中国农产品电子商务模式研究[D].长沙:中国农业科学院,2005.

[16]梁文卓,侯云先,葛冉.我国网购农产品特征分析[J].农业经济问题,2012,33(04):40-43.

[17]谭本艳,文雅.中国生鲜农产品电商发展的现状与对策[J].世界农业,2016(03):181-184.

[18]王鹏远.生鲜农产品电商发展探析[N].科学导报,2017-05-09.

[19]聂昌腾,杜小玲.国内农产品电商研究的分布与前沿趋势——基于CiteSpace的计量分析[J].武汉商学院学报,2019,33(01):31-36.

[20]孙宇.基于稻米产品在线评论的顾客满意度物流影响因素研究[D].哈尔滨:东北农业大学,2019.

相关内容
发表评论