地理研究 2017 , 36 (6): 1091-1105 https://doi.org/10.11821/dlyj201706008

Orginal Article

基于大数据的旅游目的地情感评价方法探究

刘逸, 保继刚, 朱毅玲

中山大学旅游学院,广州 510275

Exploring emotion methods of tourism destination evaluation: A big-data approach

LIU Yi, BAO Jigang, ZHU Yiling

School of Tourism Management, Sun Yat-sen University, Guangzhou 510275, China

通讯作者: 保继刚（1964- ）,男,云南个旧人,教授,博士生导师,研究方向为区域发展与旅游规划。E-mail: eesbjg@mail.sysu.edu.cn

收稿日期: 2017-01-4

修回日期: 2017-04-6

网络出版日期: 2017-06-30

基金资助: 教育部人文社会科学研究青年基金项目（14YJC790083）国家自然科学基金项目（41571137）

作者简介:

作者简介：刘逸（1980- ）,男,广东汕头人,讲师,研究方向为旅游价值链与大数据。 E-mail: liuyi89@mail.sysu.edu.cn

展开

摘要

基于情绪分类取向,通过界定三个旅游文本情感分析的过滤参数：旅游专属词库、语义逻辑规则和情感乘数,构建基于网络大数据的旅游目的地情感评价模型。基于该模型,抓取了120731条游客评论对8个旅游目的地进行评价,并以联合国世界旅游组织旅游可持续发展监测数据作为标准数据进行校验。研究证实三个过滤参数具有一定的科学性,能够较为准确地捕捉到游客对目的地评价的总体情感意象;经过单年度和多年度校验,六类规则的准确度依次为：C2>C1>C3>B>评分法>A,即规则C2下的评价结果与监测结果最为吻合。结论证实了旅游大数据的可用性,为后续的理论推进和实践应用提供了科学依据。

关键词： 大数据 ; 旅游目的地 ; 情感评价模型 ; 情感意象

Abstract

The contemporary studies of tourism big data are not sufficient to utilize online tourist-generated contents for evaluating tourism destinations, while the content-analysis studies in linguistic studies have yet to have qualified technics for conducting tourism research. In order to bridge this gap between these, this paper constructs an emotion model for evaluating tourism destinations based on tourists' online reviews. This model is composed of three emotional filtering factors including tourism lexicon, grammatical logics and emotional multipliers. The tourism lexicon contains 3507 positive emotional words and 3365 negative emotional words. It is used to depict the general emotional image of a tourist online review by calculating positive and negative words within the review. Every emotional word will be counted as one score, either positive or negative. Grammatical logics contain 13 rules which adjust the positive or negative scores and give the final emotional score of the review. Emotional multiplier in this study is set from three to five. It is used to correct the deviation of exaggerated positive emotions due to the existing pro-positive preference in human emotional expression. This paper collects 120731 pieces of tourists' online reviews among eight tourist destinations (Yangshuo, Zhangjiajie, Huangshan, Chengdu, Luoyang, Kanas, Jiaozuo and Xishuangbanna) and uses this model to evaluate the overall emotional images of these destinations. The result is compared to the questionnaire-based survey data conducted by UNWTO (United Nation, World Tourism Organization) among these destinations from 2013 to 2015. The verification proves that the three emotional filtering factors are effective in mapping emotional images of tourists' online reviews. Based on both single and multiple-year verification, the accuracy of the proposed six sub-models is ranged from high to low as follows: C2>C1>C3>B>Direct Scores>A. This outcome means that the model-based result is the closest to the UNWTO result under the C2 that emotional multiplier is set at 4 and the tourism lexicon and grammatical logics are applied. This paper contributes to the literature by paving alternative ways of destination evaluation and proves the usefulness of tourism big data in geographical studies. This effort will underpin subsequent theoretical and empirical studies in tourism geography.

Keywords： big data ; tourism destination ; emotional evaluation model ; emotional image

PDF (1481KB) 元数据多维度评价相关文章收藏文章

本文引用格式导出 EndNote Ris Bibtex

刘逸, 保继刚, 朱毅玲. 基于大数据的旅游目的地情感评价方法探究[J]. , 2017, 36(6): 1091-1105 https://doi.org/10.11821/dlyj201706008

LIU Yi, BAO Jigang, ZHU Yiling. Exploring emotion methods of tourism destination evaluation: A big-data approach[J]. 地理研究, 2017, 36(6): 1091-1105 https://doi.org/10.11821/dlyj201706008

1 引言

当前旅游者越来越多地利用网络在智能移动终端进行预订旅游产品、撰写游记点评、相互交流等活动,由此产生海量的非结构性、碎片化数据,这便是旅游业中的“大数据”。当下基于大数据的旅游研究主要围绕三个主题开展。第一类是对网络文本进行较为直接的内容分析,从而了解旅游目的地或游客的感知特征和用户体验以及之间的因果关系^[1-3]。第二类是采用语言学中的文本分析方法结合计算机技术进行数据挖掘,如采用自然语言处理工具,对旅游网站中文本数据进行抓取和分析,根据词频统计、相关词聚类,发现网站内容中蕴含的问题^[4]。第三类是通过收集特定专属数据,如通信数据或电子支付数据等,构建数学模型分析游客出行和消费特征^[5,6]。旅游从业者可以通过这些数据挖掘,分析游客满意度和预测市场需求,从而改进服务和营销策略^[7]。然而,当前研究主要集中在市场营销和商业管理等研究领域,研究所应用的对象主要是旅游企业（如酒店和旅行社）,尚未从企业层面拓展到空间层面,无法适用于旅游目的地的整体评价。本文由此出发,探索如何使用旅游大数据进行方法创新,建立旅游目的地整体评价模型。

传统的旅游目的地的相关评价主要依靠定量模型,数据来源主要由问卷调查和统计数据这两个渠道构成^[8,9]。在当前大数据研究背景下,地理学者们开始采用GIS和GPS等新的空间技术,有针对性地采集个体时空行为和其他信息,从而获得群体性的空间规律和综合评价^[10,11]。但是如何解决大数据的尺度、精度、信度的界定以及多源数据的整合利用问题;如何利用游客在互联网中产生的海量数据捕捉游客的偏好、愉悦度、满意度等情感信息,继而获得游客对旅游目的地的整体评价,是地理学者们尚未解决的问题^[12,13]。针对这个问题,当前旅游大数据和情感分析的研究领域也缺乏科学的解决方法。首先,尽管当前研究在大数据收集、挖掘和分析方法上已经有所进展,但是没有专门针对处于“非惯常状态”下的旅游活动的分析词库和方法。同时,当前旅游大数据研究的议题较为应用导向型,多集中在游客感知和满意度这两个方面,而尚未从深层次探讨游客情绪的捕捉方法和情感表达的基本逻辑。再者,当前旅游大数据的分析和评估模型尚未成熟,需要创新的方法和数据来校验这些大数据模型能否科学地反映游客需求和偏好。

基于上述考虑,拟构建专属于旅游研究的情感分析模型,利用游客在旅游网站和社交媒体上发布的旅游评论,分析游客的情感基本特征,从而探索旅游目的地评价的新方法。在此基础上,利用第三方数据,对所采用的模型进行校验,以增加该模型可信度和说服力。

2 基于旅游大数据的情感分析

传统的旅游调查往往采取问卷调查和访谈等方法,虽然信息精准,但是信息丰富程度、数量均比较有限。同时,因为关联到受访者的个体信息,回答过程私密性不足,其可信度存在一定局限。与之相比,游客在旅游活动的过程中发表的评论,正成为了解游客偏好、评估旅游服务质量和满意度的新素材。特别是游客在旅游活动结束后针对景区和旅游目的地发表的文字短评论,具有数量多、内容精炼等特点,而且大部分在文字评论的同时还给予评分。这些海量数据,日渐成为旅游服务研究和咨询领域关注的重点信息源^[14,15]。但是,在线网站的旅游评分是否能真实反映游客心理,如何从海量的、非/半结构化的旅游评论中准确地提取旅游者情感特征信息,是当前旅游大数据研究的新挑战。解决这个问题需要从心理学的情感理论研究出发,并借助当前语言学中的在线文本分析技术,来构建适用于游客情感评价的分析模型。本节针对情绪理论、在线文本分析和游客情感研究这三个领域进行评述,提出研究的切入点（图1）。

显示原图| 下载原图ZIP| 生成PPT

图1 基于大数据的游客情感分析研究进展

Fig. 1 Literature of tourist emotional analysis based on big-data approach

2.1 情感分析的理论基础

情绪是人对外界事物感知过程中产生的即时的、感性的心理反应。情绪具有情境性和不稳定性,会随身边事物的变化而变化。经过多次情绪体验的叠加之后,人会对某一事物形成较为理性的、有组织的、较为稳定的体验态度,称之为情感。从这个层面上理解,通过文字语言表达的旅游评论,是介于情绪与情感之间的心理态度的表达,比较接近于情感,但是由于体验时间较短,也没有长时间的重复叠加,不能完全等同于情感。因此,本文将旅游评论理解为游客在旅游活动开展或者结束后产生的综合情绪叠加之后形成的体验态度的一种情感表达。

当前心理学的情绪理论有两大取向,包括分类取向（categorical approach）和维度取向（dimensional approach）。分类取向启蒙于达尔文的进化论,认为情绪有基本情绪和复杂情绪之分。基本情绪是天生的,主要包括快乐、悲伤、愤怒、厌恶、恐惧、惊讶等六个类别。分析人的情绪（emotion）、情感（affection）到情操（sentiment）,都需要从这六个基本类型出发。在日常生活的影响下,基本情绪会发生叠加和演化,从而衍生出复杂情绪,即后者由前者构成^[16]。维度取向认为情绪不是由基本情绪和复杂情绪构成,而是取决于三个矢量维度的影响：效价（valence）、活力（arousal）和力量。Mehrahian等据此提出了PAD模型：愉悦度（pleasure）、唤醒度（arousal）和支配度（dominance）,认为人的各种情绪都是由这三个维度在不用程度的作用下形成的^[17,18]。维度取向与分类取向的差别在于,维度取向认为情绪不存在基本类型,也没有绝对的分类标准。相比而言,分类取向的研究较为浅显易懂,操作起来比较方便可行,但是究竟情绪应该分为几个类别,至今仍未有定论。而且分类取向所界定的情绪类型中,有许多情绪存在高度相关性,例如焦虑与抑郁,这也成为分类取向研究当前受到质疑的原因之一。

尽管关于情绪应该从分类取向还是从维度取向来认知,当前还处于争论中,但学者们已经从两个取向分别开发出相应的量表,用来捕捉情绪的内容和程度;在研究的初期大多将情绪分为正面、负面或者消极、积极来测度,而随着研究的深入逐渐增加新的情绪类型^[19,20]。这些研究在当前已经初步应用到网络文本的情绪测量中,例如谷歌开发的心境量表（GPOMS）可以在线测量六种不同的网络情绪。LIWC（linguistic inquiry and word count,LIWC）软件是当前较为主流的在线文本情感分析软件,它通过分词和词性匹配功能,可用于海量文本的情绪测度,最多可以捕捉十余种情绪。研究者可根据不同研究目的确立的情绪词汇表,然后制定合理的情绪叠加逻辑,就可以计算出文本中蕴含的情绪类型。LIWC所用的这种分析逻辑,应该归属于分类取向,即预先对情绪的类型做出理论判断,再进行词汇匹配。对于处理海量非结构化数据,这种做法比较具有合理性。相对而言,维度取向的情绪量表难以应用到海量网络文本中,因为它需要依赖大量的结构化问题对情绪进行捕捉和刻画,才能判断出情绪的类型。本研究的目的在于利用海量网络数据来探索旅游目的地的评估方法,故分析逻辑与LIWC基本一致,均是预先设计好要分析的情绪类型,再进行词频捕捉。

2.2 在线文本情感分析研究进展

情感分析的理论基础来源于心理学,而分析技术正逐渐从传统的社会学走向情报信息科学。早在20世纪90年代末,情报信息科学已经尝试对文学作品中的主观意见、情感、主张等进行语义判断或极性分析^[21]。早期主要对带有情感倾向的词语进行分词和计算。随着越来越多带有情感倾向和主观意见的文本出现,相关研究也逐渐从简单的计算,演变到对词语进行情感分析,进阶到更加复杂的对句子、段落、文章进行情感分析^[22]。当前主要的研究目标是判断点评者对点评对象的观点是赞成或反对,立场是肯定或否定,因此大部分研究只考虑正面、负面两类概括性情感^[23]。

根据文本的层次,情感分析可分为文档、句子和词汇三个水平,其中文本情感分析的基础是词汇所表达的情绪,其情绪特征对于句子和文档的情感倾向具有极高的贡献率^[24]。根据分析的深度,可以分为粗粒度和细粒度两种方式。粗粒度的情感分析方式一般用于判断文本整体的情感极性,而细粒度的分析方法则多被用于判断作者对评论对象中某具体属性或维度的情感^[23]。关于情感分析的步骤,王祖辉等总结了两个重要步骤,第一是从评论中抽取确切表达情感约束的特征,在当前应用中主要是过滤词库的构建;第二是建立情感分析评价的技术模型,对文本的整体情绪进行计量统计分析^[25]。当前情感分析技术主要有三种,包括自然语言处理技术、机器学习技术、词汇匹配技术,早期的研究大多使用自然语言分词方法,即人工或者通过计算机对文本进行分词,然后统计出词汇类型和频度,从而判断文本的情感特征^[26]。但自然语言分词方法效率较低,需要大量的人工判读。因此研究的主流方法逐渐转向机器学习和词汇匹配。

Ye等使用朴素贝叶斯、支持向量机、N-gram三种算法进行旅游博客文本的情感分类,研究发现前两种算法的效果较好,当训练数据库足够大时,三种方法没有显著差别,与网友点评给分相比,准确率都能达到80%左右^[27]。林江豪等通过构建朴素贝叶斯分类器,对热门话题微博和酒店评论进行文本情感倾向性分类,实验发现,将包含程度副词的句法路径,替换成了不包含程度副词的简单路径,能够降低分析的复杂度^[28]。杨鼎等以携程网上北京、上海、广州的宾馆评论作为情感语料库,基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法,但是实验发现,将情感词库作为特征选择进行情绪过滤,反而更能提高文本情感分类的效果^[29]。

词汇匹配技术主要通过建立词库,然后通过计算机自动进行情绪词匹配,从而获得文本的情感特征^[24]。例如Stone等归纳的General Inquirer词库,还有由CNKI（知网）发布的Hownet词典。词库本身也可以通过自动或半自动的方法建立。首先找到一系列典型的正、负面词汇作为种子词,随后利用特定的词汇资源,从中找到这些种子词的同义词或反义词,并且计算新词与种子词之间的联系,从而自动或半自动地建立词库^[30,31]。

2.3 游客情感研究

游客情感的研究起源于20世纪90年代,学者们的研究主要集中在基本维度和因素的界定之上。Price等揭示游客在旅游过程中同时经历着正面情感与负面情感,两者相互交织,互为进退^[32]。Hosany等阐明了游客对于旅游经历的情绪反应是其消费后行为的基本决定因素,消费后行为包括游客满意度、行为意向、态度判断和选择等^[33]。Babin等将顾客满意度也当作游客情感的一种,并认为满意度可以代表旅游者整体的情感意象,但是评估的内容包括不确定性,也受制于评估者的感知性能等因素^[34]。进入21世纪之后,游客情感研究在方法论和机制探索上日渐成熟。Hosany等通过探索性与验证性（confirmatory）因子分析,识别了3个突出的情感维度来代表旅游目的地的情感量表,分别是：快乐、爱和惊喜。学者们根据因子分析探索了从负面到正面维度的情感意象的分布,以满意度为核心变量,由高至低分别确定了5个类型的情感意象是：高兴的、激昂的、混合的、冷漠的、负面的,其中“负面的”这一组表现为不满意^[35]。在影响游客情感的因素研究方面,学者们发现旅游目的地存在认知形象和情感形象的双重感知^[36]。游客在旅游过程中感知的服务质量,是游客愉悦度的决定性因素。而旅游对公共服务的感知往往对最终的整体满意度有着显著的影响^[37,38]。基于台湾的研究,旅游体验的质量,直接决定了满意度,其影响的过程为：“体验质量→感知价值→满意度→行为意图”^[39]。Radojevic等抓取了欧洲47个首都城市共6768家酒店的206万条在线评论,研究证实酒店的星级评论是影响顾客满意度最显著的因素,并识别出8个与以往研究不同的因素^[40]。Ye等的研究表明酒店在线评论与销售预订量之间具有显著的相关关系,并量化地指出在线评论每增加10%,酒店的网络预订将提高5%以上。但是,这些研究主要聚焦于酒店住宿业,尚未拓展到对目的地的研究尺度^[27]。

上述研究为游客情感研究奠定了基本框架,但是这些研究获取游客情绪倾向的方法基本都是依靠问卷调查方式,无法直接套用于大数据分析。虽然这些研究发现了游客情感与服务质量、旅游活动过程和旅游体验内容等因素的关联,但由于内在逻辑尚未明晰,这种关联的理论意义不大,因为旅游体验是游客情感的综合积累而成的态度,必然存在着正相关关系。

综上所述,本文认为当前基于大数据的游客情感研究领域中,研究方法尚不成熟,需要基于现有的文本分析、数据挖掘技术以及旅游学科的特性进行改进。当前未有足够理论基础,可以开展对游客情绪产生和演变机制的研究,需要先解决三个关键问题。第一,现有基于大数据的游客情感分析的研究方法缺乏校验,多数使用机器学习技术,以网站上的正、负面评分作为学习语料的参照标准。但这些评分有可能因为大众的“社交积极倾向”^（一般而言,大众在社交网络上的表达都有目的性,当个体想获得社会尊重和安全感之时,会倾向于较为温和和委婉的表达方式,即用较多的词汇表达正面情绪,而用较少的词汇表达同等程度的负面词汇。^）,而产生过度乐观的评价^[41]。同时,这些网络评分与网络评论均来源于同一个游客,存在着一定的循环论证。所校验的是评论与评分之间的相关关系,并不能校验这些评论/评分与旅游目的地的综合满意度之间的关系。而且机器学习法还存在一个重大的局限性,其建模方式主要依靠计算机自动编译算法获得判别模型,其结果只能用于整体判断,内在逻辑是一个无从得知的黑箱。第二,现有研究普遍使用的情感词库均是现有的较为完整的公共词库,尚未有专门针对旅游的情感词库,无法准确捕捉在“非惯常环境下”行为的情感特征,所采用的游客情感分类方法与别的情感分类方法无异,忽视了旅游活动的特点。例如在一般词库中,“刺激”一词往往与负面情绪中的“惊讶”相关联,但实际上在旅游活动中,“刺激”大多数是正面情绪中的“兴奋”的表达。第三,当前对于文本情感极性分类的研究较多,但由于这些研究中均没有加入语义逻辑和情感强度的分析变量,普遍没有考虑语言表达中副词、连词等虚词对于情感表达的影响,容易造成误判,对情感强度的把握也不够准确。

3 研究方法

构建科学的游客情感分析模型,需要具备一个可以校验的数据参照系,同时建立旅游情感专属词库,并考虑语义逻辑和情感表达倾向因素。选定国内8个旅游目的地作为数据采集点,分别是成都、黄山、焦作、喀纳斯、洛阳、西双版纳、阳朔、张家界。这些旅游目的地均为联合国世界旅游组织旅游可持续发展监测点,2006年至今每年均由世界旅游组织采用问卷调查的方式,对旅游可持续指标进行测度,其中包含了游客整体满意度（李克特量表5分制）。这份调查数据较为科学综合地反映了游客对旅游资源、产品和服务的感知指标,以下简称这套数据为“UNWTO监测数据”。选择这8个旅游目的地的旅游景点进行抓取的数据分析结果,具备较为客观的参照数据,具有一定的科学性。

3.1 数据来源

在数据来源方面,选择目前国内旅游评论较为丰富的旅游电子商务门户网站。经过研究团队的阅读筛选,最终确定选取知名度最高、评论较为丰富的三个旅游网站,分别是：百度旅游网、去哪儿网和携程网。相比之下,阿里旅游虽然拥有腾讯海量用户,但是进入市场时间较短,其用户评论不够活跃;而穷游、马蜂窝等知名旅游网站以攻略和长游记为主,并非短评论,较难获取用户整体评价和开展情感分析,故不入选。通过网络爬虫工具,共抓取120731条评论,评论时间截止至2015年9月30日,具体如表1。

表1 8个旅游目的地的数据采集情况

Tab. 1 The data collection of eight tourist destinations

监测点	评论总数 (条)	2013年评论数 (条)	2014年评论数 (条)	2015年1-9月评论数 (条)	正面词汇数 (个)	负面词汇数 (个)
成都	48816	4260	22563	20921	173861	21149
黄山	13777	745	6319	6411	50678	8039
焦作	5278	455	2494	2218	19309	2758
喀纳斯	1836	288	752	702	6981	949
洛阳	13135	1070	6283	5421	48157	6385
西双版纳	7310	568	3768	2783	29702	4095
阳朔	12568	1119	5098	5811	47211	7700
张家界	18011	1134	7611	8894	79664	12597
合计	120731	9639	54888	53161	455563	63672

新窗口打开

3.2 模型构建

根据前文对当前研究的总结,当前研究较多采用的情感分析技术是自然语言处理技术和机器学习技术,需要提供标准语料供机器长期学习之后才能得出情感判别模型,而且模型的内部逻辑由机器自然生成,难以明晰。为更好地讨论和明晰游客情感逻辑,本研究决定人工构建情感判别规则来组建游客情感分析模型。该模型的基本逻辑是采用词汇匹配技术,对所收集的旅游评论中的情感词汇（一般为正负面）进行匹配和数学统计分析,这是当前情感分析最常用的判别技术。构建此模型需要三个步骤：第一,构建旅游情感专属词库。第二,加入褒贬义词、处理否定句和程度副词。第三,情感系数校正。以下分别解释这三个步骤在本研究中的界定。

3.2.1 游客情感词库构建当前研究大多数采用的词库是由CNKI（知网）发布的HowNet词典,目前它包含中文词语（词形）91016个,英文词语（词形）85295个,主要分为正面情绪、负面情绪、正面评价、负面评价、程度级别和主张这六类词语。在此基础上,采用人工阅读筛选方式,进一步提炼旅游专属词库。先从国内知名旅游网站上读取阅读量较高、文字较多、参考价值较高的游记约100篇、旅游评论约600条。通过人工深度解读,从吃住行游购娱六个方面,提取用于表达游客情感的高频形容词,总共获得317个正面词汇和185个负面词汇。与HowNet词典对比发现,人工筛选共新增了298个词汇,仅40%的词汇与HowNet词典重合。在此基础上,本研究进一步对两部分词库进行修正,删减部分只有在特定语境下才会表达出情感倾向的词汇,以及部分具有二义性的词汇。最终,本研究所构建的游客情感词库共包含3507个正面词汇和3365个负面词汇。

3.2.2 语义逻辑规则构建近年研究发现,相比于以所有词汇为特征项,加入褒贬义词、处理否定句和程度副词,对于判断文本倾向性有重要的促进作用,并且能够更好地反馈文本的倾向强度^[42]。因此,针对程度副词、否定副词以及转折连词这三类能够明显影响语义的副词,构建了一系列规则。

第一,对于程度副词而言,比较受认可的一种分类方法是将其分为绝对和相对两类。从语义上来说,绝对词能够独立表示程度,相对词则需要通过比较来表示程度。从意义上看,绝对词还可以被分为程度过头、程度高和程度低三类,相对词可分为多项比较、双项比较两类^[43];也有学者将绝对、相对程度副词分别分为极量、高量、中量、低量四类^[44]。采用HowNet（知网）程度副词文档^（HowNet（知网）程度副词文档将程度副词划分为5个级别,根据程度副词的强烈程度分别给予分数3、2.5、2、1.5、0.5。^）对程度副词进行处理。该文档根据程度副词的强烈程度,将其划分成五个倍数级别,对其分别给予0.5~3的倍数。

第二,在否定词方面,否定词在文本情感倾向性分析中也有着重要影响。一个否定词可以推翻一个句子的情感倾向^[45],吕叔湘则更具体指出否定句中存在否定的“范围”和“焦点”,认为否定句中的否定范围是否定词后的全部词语^[46]。因此,准确地说,否定词并不是否定整个句子,而是否定跟随其后的词语,并且一个句子中可包括多个否定的对象。由于语言习惯、个人观点等原因,学界对于否定词的具体范围并没有统一的标准。李泉在2003年指出否定副词共有16个,包括“甭、别、不、不曾、不必、非、没、没有、莫、未、未必、未曾、未尝、无从、无须、毋庸”^[47];邸鹏等构建的否定词表中包含24个否定词,包括“不、不是、不要、无、無、别、没有、非、并非、莫、勿、毋、否、没、不太、颠覆、未、未曾、不曾、未必、休、难以、不大、否认”^[45]。将以上否定词整理成否定词库,并确定了以下规则：① 当句子中出现否定词,将对其后的评价词或情感词取相反含义。② 对于多重否定句式的归纳,奇数重否定表示否定义、偶数重否定表示肯定义。

第三,将转折连词对于情感表达的影响纳入考虑。转折句式可分为“狭义转折”和“广义转折”两个概念,其中狭义转折是我们要研究的重点,它主要是指包含“虽然……但是……”“可是”等转折词的转折复句^[48]。转折复句的偏句和正句中,表达的重点通常放在正句上^[49]。其后有学者通过真值表运算,对转折复句中的转折句和让步句分别进行判定,证实转折复句的语义重心在后半句上^[50]。邸鹏等提示标识,表达对客观事实的肯定,预告接下来将要发生的转折;第二类转折词包括“但是、可是、不过、倒是、然而、然则、但、却、只是、只不过、才、可、还是、而”等14个词,它们多在正句出现,是转折关系的直接提示标识,表达写作者真实的情感^[45]。邸鹏等根据两类转折词和否定词、情感词的不同组合情况,制定转折句式的情感倾向性评判规则,并且验证这一规则的通用性,具体规则见表2。

表2 转折句式情感评判规则^[45]

Tab. 2 Emotional evaluation rules of transaction sentence

句式结构	情感极性
第一类转折词+正面情感词	消极
第一类转折词+奇数重否定+正面情感词	积极
第一类转折词+偶数重否定+正面情感词	消极
第一类转折词+负面情感词	积极
第一类转折词+奇数重否定+负面情感词	消极
第一类转折词+偶数重否定+负面情感词	积极
第二类转折词+正面情感词	积极
第二类转折词+奇数重否定+正面情感词	消极
第二类转折词+偶数重否定+正面情感词	积极
第二类转折词+负面情感词	消极
第二类转折词+奇数重否定+负面情感词	积极
第二类转折词+偶数重否定+负面情感词	消极
第一类转折词+……,第二类转折词+……	与只有第一类转折词时相同

新窗口打开

3.2.3 情感乘数拟定由于大众在社交网络上的表达都是有选择性的表达,而表达积极正面情绪更容易获得社会认同,导致人们不自觉地会在社交网络上表现得积极向上^[41]。在这个因素的影响下,通过直接统计正负面词汇的数量来判定整体评价的情感特征不够科学,会夸大正面评论的结果,需要对正负面词汇的比例进行系数矫正。本研究所抓取的初步词频统计的结果也印证了这个观点。在8个旅游监测点的评论中,正面词汇总数是负面词汇总数的7.19倍。直接将词汇总数作为判别的标准,会夸大正面情感。心理学和语言学中尚未有任何科学的实验依据支撑这个系数的存在,本文从实验角度出发来测度误差的程度,拟定了三个情感系数,分别为3倍、4倍、5倍,即当评论中的正面评价超出负面评价的3倍、4倍、5倍时,才将此条评论判定为正面评论。

3.3 模型规则

基于上述构建,拟定6个子模型,用于校验词库、语义逻辑和情感乘数这3个要素的重要性和科学性：

评分法模型：依据网友在旅游网站上发表评论时,对旅游目的地（含景区）的打分进行直接判断。不同网站的评分方式基本一致,分值为1~5。其中1为最低分,表示游客极为不满意;5为最高分,表示游客十分满意。本研究取中值3分作为划分界线,获得4分或5分的评论被判定为正面评论,获得3分的为中性评论,获得1分或2分的为负面评论。该项数据可以直接抓取网站评分值获得,作为本研究的第一个基础模型。

规则A：简称“词频法”。指将抓取到的每条网友评论,对每条评论进行中文分词,得到关于评论的一个词语集合,使用直接统计正负面词频的方法得到每个评论的正、负面词汇数。当一条评论的正面词汇数大于负面词汇数1.5倍时,判定该评论为正面评论;当正词汇数为负词汇数的1.5倍之内,判定为中性评论;当负面词汇数大于正面词汇数,为负面评论。

规则B：简称“词频逻辑法”,是指词频统计与语义逻辑规则相结合的情感分析规则。此规则建立在规则A简单词频统计分析的基础上,根据出现在情感词前后的程度副词、否定副词、转折词的词性,乘以一定的系数,再计算得分。当正面/负面词汇单独出现时,得1/-1分;当情感词前后出现程度副词时,按照HowNet程度副词文档的给分,将情感得分乘以对应的分数;当情感词前出现一个否定词时,将其情感取反,即将情感得分乘以-1,当出现多重否定时,奇数重否定情感得分乘以-1,表否定含义,偶数重否定情感得分不变,表示肯定;当情感词前出现转折词时,第一类转折词乘以-0.5分,第二类转折词乘以2。其他规则与模型A一致。

规则C：简称“情感乘数模型”,指基于规则B的基础之上,加入3/4/5倍情感乘数用于降低误差：① 规则C1。如果一条评论的正面得分大于或等于负面得分绝对值的3倍,则判定其为正面评论;如果正面得分是负面得分绝对值的1~3倍,则判定为中性评论;如果正面得分少于或等于负面得分绝对值的1倍,则判定为负面评论。② 规则C2。如果一条评论的正面得分大于或等于负面得分绝对值的4倍,则判定其为正面评论;如果正面得分是负面得分绝对值的2~4倍,则判定为中性评论;如果正面得分少于或等于负面得分绝对值的2倍,则判定为负面评论。③ 规则C3。如果一条评论的正面得分大于或等于负面得分绝对值的5倍,则判定其为正面评论;如果正面得分是负面得分绝对值的3~5倍,则判定为中性评论;如果正面得分少于或等于负面得分绝对值的3倍,则判定为负面评论。

4 结果与校验

将抓取的约12万条网络评论,经过六个情感分析模型的过滤,得到8个旅游目的地的游客情感正负面评价得分（表3）。整体而言,在各种规则之下,8个旅游目的地获得的旅游评论所表现出的游客情感都高度偏向正面,所有旅游目的地的正面评论均超过了65%。正面评论最高值出现在规则A下的喀纳斯,为95.2%;而负面评论的最高值出现在规则C3下的阳朔,为29.7%。

表3 8个旅游目的地的整体情感评价结果（%）

Tab. 3 Result of emotional evaluation among eight tourist destinations (%)

规则	评论	成都	黄山	焦作	喀纳斯	洛阳	西双版纳	阳朔	张家界
评分法	正面评论	82.6	89.1	84.8	80.0	85.4	79.7	71.3	81.6
	中性评论	14.5	9.6	12.1	18.5	12.3	15.4	20.8	14.2
	负面评论	2.9	1.3	3.1	1.5	2.3	4.9	7.9	4.2
规则A	正面评论	93.9	92.3	91.7	95.2	93.9	93.8	91.1	93.8
	中性评论	4.4	5.7	6.3	3.8	4.4	4.3	6.1	4.3
	负面评论	1.7	2.0	2.0	1.0	1.7	1.9	2.8	1.9
规则B	正面评论	75.7	73.5	75.0	76.6	76.6	78.2	72.4	78.9
	中性评论	14.5	15.4	13.2	15.2	14.0	11.5	13.8	11.7
	负面评论	9.8	11.1	11.8	8.2	9.4	10.3	13.8	9.4
规则C1	正面评论	78.7	75.4	76.9	79.5	78.9	77.6	72.3	76.2
	中性评论	7.9	9.1	7.9	9.3	8.4	8.9	9.7	10.7
	负面评论	13.4	15.5	15.2	11.2	12.7	13.5	18.0	13.1
规则C2	正面评论	75.9	71.6	73.8	75.7	75.8	74.2	68.9	71.9
	中性评论	4.6	6.2	4.9	5.6	5.2	5.8	5.6	7.0
	负面评论	19.5	22.2	21.3	18.7	19.0	19.9	25.5	20.9
规则C3	正面评论	73.7	68.2	71.3	73.5	73.2	71.5	66.3	68.7
	中性评论	3.3	4.7	3.7	3.5	3.9	4.1	4.0	5.0
	负面评论	23.1	27.1	25.1	22.9	22.9	24.4	29.7	26.3

新窗口打开

就单个目的地而言,阳朔的游客情感最为负面,在各种分析规则之下,其获得的正面评论比例都是最低的,而负面评论的比例则都是最高的。除此之外,在不同情感分析规则之下,游客情感最为正面的目的地都有所不同,在评分法中,黄山获得的正面评论比例最高,负面评论比例最低,游客情感最为正面;在规则A和规则C1中,喀纳斯的正面评论比例最为突出;而在规则C2和C3中,成都的正面比例则位列第一。

就整体而言,从评分法,到规则A、规则B,到规则C1、C2、C3,对所有目的地判别出来的正面评论比例整体在逐渐降低,但比例始终在65%以上;相反,负面评论比例在不断增加,从规则C1起,负面评论比例整体反超中性评论的比例;中性评论的比例则是先增后减,从规则A到规则B过渡,中性评论的比例明显下降,并且各个目的地的中性评论比例趋同。

为进一步检验各类规则在识别游客情感的有效性和可靠性,选取UNWTO可持续监测结果中的游客满意度作为检验标准,从单年度和多年度两个角度,检验各类规则的分析效果。校验方法使用较为简单的方差法,即计算8个目的地在各情感规则中的正面评论比例与监测报告中满意度的绝对方差,方差愈小,认为该子模型的分析效果愈好。除绝对值的差异比较以外,对监测结果在2013-2015年3年间的游客满意度值的变化趋势,与各子模型中正面评论比例的变化趋势进行比对,变化趋势愈一致,差异程度愈小,认为该子模型的分析结果愈好。由于UNWTO监测数据中部分监测点的数据不连续,最终仅选取了3年间数据齐全的五个旅游目的地：成都、黄山、喀纳斯、阳朔和张家界,作为比较的样本。

4.1 单年度校验

根据8个旅游目的地在各项情感判定规则中的正面评论比例,以及监测结果中的游客满意度,计算出各规则与监测结果的绝对方差,计算公式如下。

$\begin{matrix} 规则 x 与监测结果的绝对方差 = \frac{\sum_{i}^{=} （ A_{i} - X_{i} ）^{2}}{8} \end{matrix}$ （1）

式中：A_i为第i个旅游目的地的满意度;X_i为第i个旅游目的地的正面评价比例。

根据式（1）,计算各项游客情感分析规则下8个旅游目的地的正面评论比例与监测结果游客满意度的绝对方差（表4）。如表4所示,在本文所建立的六项游客情感判定规则中,游客情感分析的效果排名如下：C1>C2>B>C3>评分法>A。

表4 2015年监测结果单年度校验表

Tab. 4 Single-year verification of the monitoring results in 2015

旅游目的地	监测结果满意度	评分法正面评论比例	规则A 正面评论比例	规则B 正面评论比例	规则C1 正面评论比例	规则C2 正面评论比例	规则C3 正面评论比例
成都	0.7950	0.8576	0.9389	0.7848	0.7818	0.7497	0.7243
黄山	0.8270	0.9066	0.934	0.7757	0.7548	0.7094	0.6668
焦作	0.7230	0.8877	0.9274	0.7926	0.7615	0.7281	0.6984
喀纳斯	0.6989	0.7536	0.9487	0.7507	0.7635	0.7236	0.6952
洛阳	0.8130	0.8685	0.9347	0.7805	0.7683	0.7340	0.7080
西双版纳	0.7560	0.8286	0.9378	0.8020	0.7614	0.7190	0.6838
阳朔	0.5994	0.7589	0.9066	0.7472	0.6995	0.6612	0.6307
张家界	0.7080	0.8421	0.9318	0.7993	0.7411	0.6938	0.6613
绝对方差		0.0115	0.0411	0.0055	0.0030	0.0035	0.0063

新窗口打开

对比各规则的绝对方差发现,规则C1的绝对方差值最小,说明综合考虑词汇统计、语义逻辑和最小情感乘数的规则与监测结果最为接近,能够更准确地测量游客情感。其次,C1和C2两者之间仅相差0.0005,说明这两种方法的可靠性均较高,而这两个规则的差别仅出现在情感系数的设置上,因此进一步证实了规则C在测量游客情感上是较为可行。另外,规则A的绝对方差最大,且大于评分法,说明仅根据每句评论中出现的正负面词汇数来判断该句子的极性存在较大缺陷,需要考虑游客表达时的语义逻辑,以及情感表达的倾向性。

4.2 多年度校验

考虑到各年份的变化,基于五个旅游目的地的三年监测结果,进一步校验各规则在动态变化中的准确性。依据以下公式,计算出在某一旅游目的地的样本中,情感分析规则与监测结果的年度绝对方差,随后计算每一规则中所有旅游目的地年度绝对方差之和,以此对比每个规则与监测结果的差异程度。

$\begin{matrix} 规则 x 与监测结果的年度绝对方差 = \frac{\overset{3}{\sum_{j = 1}} {(A_{i} - X_{i})}^{2}}{3} \end{matrix}$ （2）

式中：A_i为第i个旅游目的地的满意度;X_i为第i个该旅游目的地的正面评价比例;j=1时表示2013年,j=2时表示2014年数据,j=3时表示2015年数据。

根据式（2）计算出每项情感分析规则与监测结果在每个旅游目的地、每一年的绝对方差,以及绝对方差之和,结果发现,将所有旅游目的地三年内的监测结果与本文制定的情感分析规则进行对比,游客情感分析的效果排名如下：C2>C3>C1>B>评分法>A。其中,规则C2与监测结果之间的绝对方差之和最小,即这种规则与监测结果的偏离程度最小（表5）。

表5 监测结果多年度校验分析表

Tab. 5 The multi-year verification of the monitoring results

旅游目的地	评分法绝对方差	规则A 绝对方差	规则B 绝对方差	规则C1 绝对方差	规则C2 绝对方差	规则C3 绝对方差
成都	0.003397	0.030959	0.002492	0.001927	0.001196	0.001740
黄山	0.006980	0.014129	0.005629	0.002032	0.007080	0.013073
喀纳斯	0.016395	0.053762	0.014592	0.013774	0.010949	0.009868
阳朔	0.013679	0.058858	0.007633	0.005570	0.002167	0.001050
张家界	0.019668	0.065636	0.009530	0.008771	0.003914	0.002089
绝对方差之和	0.060120	0.223344	0.039876	0.032074	0.025306	0.027820

新窗口打开

总体而言,无论是单年度校验还是多年度校验,均证明语义逻辑、程度副词和情感乘数这三个变量的存在价值,能够消除文字表达倾向带来的误差。相比之下,C2的评价结果与监测调查结果误差最小,而以往直接使用正负面词汇数量加总进行评价的方法误差最大,两者的方差相差接近十倍以上,其次是游客在点评过程中留在网站上的评分,也是存在误差较大的情况。

5 结论

以创新旅游目的地评价方法为目的,通过情感词库、语义逻辑、情感乘数三个方面创建了新的旅游评价情感分析模型,制定了六项层层递进的游客情感分析规则。基于这些规则,文章对8个旅游目的地的旅游评论的情感意象进行了分析,并以UNWTO监测结果作为标准,对六项情感分析规则的效果进行了校验,主要得出以下结论：

第一,游客在线评论的情绪表达中的确存在较明显的正面倾向,正面评论总数是负面评论总数的7倍。从各旅游目的地游客的情感分析来看,所有目的地在不同年份的正面比例均大于65%。因此,不能仅依靠游客发布在网络上的正负面评价词的数量来判定旅游目的地在游客心目中的满意程度。第二,本研究所拓展的旅游专属词库、语义逻辑、程度副词和情感乘数具有一定的科学性,能够较为准确和全面地捕捉到游客对旅游目的地的情感评价。随着各规则限制性要素的增多,能够逐步减弱情感表达倾向所造成的误差。第三,经过单年度和多年度校验表明,本研究中制定的六大规则的情感分析效果依次为：C2>C1>C3>B>评分法>A。其中规则C2（情感乘数为4）在单年内差异对比和多年间趋势变化中均与监测结果相对吻合,偏离最小,证明中文语义逻辑、情感副词以及情感乘数在情感意象识别中的重要性。其次,规则A在两种校验方法中,均与监测结果最不吻合。说明仅简单依靠语句中的正负面词汇数统计来判断评论的正负极性存在较大误差,需考虑到具体的语境和表达习惯。比如,游客在评论时,可能使用大量正面评价词汇作为铺垫,但最终想传达的是与预期差异过大,导致其产生负面情绪。最后,从两种校验结果来看,评分法同样也是属于误差较大的一种情感分析方法。因此将评论依据评分来进行情感分类,并且以之作为学习语料的机器学习技术,潜在误差较大,科学性不足。

本研究的贡献在于为旅游目的地评价开拓了新的路径,操作简单可行,证实了旅游大数据的可用性,为后续的理论推进和实践应用提供了科学依据。后续的研究可以在此基础上,利用这个评价模型对经典的旅游地理理论展开实证,也可以探索游客情绪的类型以及变化规律。例如捕捉一个旅游地长时间的情感特征来测度生命周期;例如加入发布评论的游客的定位信息之后,可以分析口碑传播的空间规律。与此同时,通过在语义和情感逻辑方面的探索,本研究修正了现有的情感分析模型,新的分析模型能够比传统方法更加准确地捕捉到游客对一个旅游目的地的整体评价,是旅游大数据研究的一次有效的突破。

本研究仍存在一定的局限性。首先,旅游专属词库的数据搜索量尚不够广泛,还可以进一步拓展和论证各个词的独特性。其次,虽然本研究证实情感乘数为4的规则最佳,但是情感乘数的选择仍存在一定的主观性,尚未能回答究竟乘数为4,能否作为衡量大众一般的正负面情绪表达比例的标准。再者,本次校验为单一数据来源校验,尽管UNWTO的监测数据为第三方数据,但是也不能保证完全准确无误地反映旅游目的地的整体满意水平。而本次数据采集来源也仅限于三个主流网站,尚未对全网数据进行采集,有待未来进一步拓展。

The authors have declared that no competing interests exist.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[36]	[Wu Xiaogen, Du Yingying. Empirical study on perceptive image formation of tourists on tourism destination: A case study of Nantong, Jiangsu province . Geographical Research, 2011, 30(9): 1554-1565.] https://doi.org/10.11821/yj2011090002 URL Magsci [本文引用: 1] 摘要游客感知形象是近些年来目的地旅游形象研究的重点。旅游目的地游客感知形象的形成过程是一个复杂的过程,受到了多方面因素的影响,交织了行为学、心理学、社会学、旅游学的各方面内容。本文在明晰旅游目的地游客感知形象概念的基础上,系统分析了游客感知形象形成过程的影响因素与阶段特征,进而基于相关研究假设构建了游客感知形象形成概念模型,并采用因子分析法与相关分析法对概念模型进行了实证检验,研究表明:(1)游客个体因素、旅游目的地情境因素、感知刺激因素是影响旅游目的地游客感知形象形成的主要影响因素;(2)旅游目的地游客感知形象包括认知形象和情感形象,游客认知形象支持要素包括旅游资源要素、旅游可达性要素、休闲娱乐要素以及旅游氛围要素;(3)南通市游客感知形象形成的影响因素与旅游目的地认知形象支持要素、情感形象支持要素之间具有显性相关性,验证了感知形象形成概念模型具有可行性。
[37]	Rojas C D, Camarero C. Visitors' experience, mood and satisfaction in a heritage context: Evidence from an interpretation center . Tourism Management, 2008, 29(3): 525-537. https://doi.org/10.1016/j.tourman.2007.06.004 URL Magsci [本文引用: 1] 摘要 <h2 class="secHeading" id="section_abstract">Abstract</h2><p id="">The study examines how expectations, experiences, and satisfaction are related in the context of cultural tourism and the services provided by cultural organizations. A model is proposed that combines two complementary approaches in the analysis of satisfaction: a cognitive approach based on quality and disconfirmation and an affective approach based on emotions. The empirical analysis carried out on a sample of visitors to an interpretation center allows us to confirm that the perceived quality is a direct determinant of satisfaction, as are emotions. The results also reveal that there is a significant relationship between quality and emotion. Finally, the way in which mood state moderates the cognitive path is studied, as generator of visitor satisfaction.</p>
[38]	贾衍菊, 林德荣. 旅游者服务感知、地方依恋与忠诚度: 以厦门为例 . 地理研究, 2016, 35(2): 390-400. https://doi.org/10.11821/dlyj201602015 URL Magsci [本文引用: 1] 摘要 <p>旅游者忠诚度是近年来旅游学研究领域的热点话题,但以往研究忽视了旅游者情感因素对于个体行为的影响。从自我调节态度理论的视角,综合旅游者服务感知、地方依恋以及忠诚度理论,构建了忠诚度驱动因素模型。选取国内休闲旅游地——厦门进行实证分析,研究发现：① 厦门旅游者服务感知共有“接待服务感知”、“景区服务感知”和“公共服务感知”三个维度;② 公共服务感知对总体满意度的影响效应最大,其次是景区服务感知,而接待服务感知的影响并不显著;③ 总体满意度不仅直接影响忠诚度,且通过地方依恋的中介作用实现;④ 对于地方依恋的两个维度,地方依赖对忠诚度的影响效应更大。该研究结果不仅揭示了“服务感知→总体满意度→地方依恋→旅游者忠诚度”的复杂影响路径,也证实了自我调节态度理论的评价—情感响应—行为响应顺序在目的地管理层面的适用性。因此,要求旅游目的地管理者在实践中必须全面提升目的地服务质量,改善景区服务水平,注重旅游者情感体验管理,培育旅游者对目的地的依恋情感。</p> [Jia Yanju, Lin Derong. Tourists' perception of urban service, place attachment and loyal behaviors: A case study of Xiamen . Geographical Research, 2016, 35(2): 390-400.] https://doi.org/10.11821/dlyj201602015 URL Magsci [本文引用: 1] 摘要 <p>旅游者忠诚度是近年来旅游学研究领域的热点话题,但以往研究忽视了旅游者情感因素对于个体行为的影响。从自我调节态度理论的视角,综合旅游者服务感知、地方依恋以及忠诚度理论,构建了忠诚度驱动因素模型。选取国内休闲旅游地——厦门进行实证分析,研究发现：① 厦门旅游者服务感知共有“接待服务感知”、“景区服务感知”和“公共服务感知”三个维度;② 公共服务感知对总体满意度的影响效应最大,其次是景区服务感知,而接待服务感知的影响并不显著;③ 总体满意度不仅直接影响忠诚度,且通过地方依恋的中介作用实现;④ 对于地方依恋的两个维度,地方依赖对忠诚度的影响效应更大。该研究结果不仅揭示了“服务感知→总体满意度→地方依恋→旅游者忠诚度”的复杂影响路径,也证实了自我调节态度理论的评价—情感响应—行为响应顺序在目的地管理层面的适用性。因此,要求旅游目的地管理者在实践中必须全面提升目的地服务质量,改善景区服务水平,注重旅游者情感体验管理,培育旅游者对目的地的依恋情感。</p>
[39]	Chen C, Chen F. Experience quality, perceived value, satisfaction and behavioral intentions for heritage tourists . Tourism Management, 2010, 31(1): 29-35. https://doi.org/10.1016/j.tourman.2009.02.008 URL Magsci [本文引用: 1] 摘要 <h2 class="secHeading" id="section_abstract">Abstract</h2><p id="">This paper examines the visitor experience of heritage tourism and investigates the relationships between the quality of those experiences, perceived value, satisfaction, and behavioral intentions. A total of 447 respondents completed a survey conducted at four main heritage sites in Tainan, Taiwan. Using structural equation modeling (SEM) technique, the results reveal the direct effects of the quality of experience on perceived value and satisfaction. However, it is the indirect and not direct effects of the quality of experience that impact on behavioral intentions when mediated by perceived value and satisfaction. Overall, the relationship “experience quality → perceived value → satisfaction → behavioral intentions” appears to be evident.</p>
[40]	Radojevic T, Stanisic N, Stanic N. Ensuring positive feedback: Factors that influence customer satisfaction in the contemporary hospitality industry . Tourism Management, 2015, 51(12): 13-21. [本文引用: 1]
[41]	Qiu L, Lin H, Leung A K, et al. Putting their best foot forward: Emotional disclosure on Facebook. CyberPsychology, Behavior & Social Networking, 2012, 15(10): 569-572. [本文引用: 2]
[42]	徐琳宏, 林鸿飞, 杨志豪. 基于语义理解的文本倾向性识别机制 . 中文信息学报, 2007, 21(1): 96-100. https://doi.org/10.3969/j.issn.1003-0077.2007.01.016 URL Magsci [本文引用: 1] 摘要文本倾向性识别在垃圾邮件过滤、信息安全和自动文摘等领域都有广泛的应用。本文提出了基于语义理解的文本倾向性识别机制。其主要思想是首先计算词汇与知网中已标注褒贬性的词汇间的相似度,获取词汇的倾向性;再选择倾向性明显的词汇作为特征值,用SVM分类器分析文本的褒贬性;最后采用否定规则匹配文本中的语义否定的策略提高分类效果,同时处理程度副词附近的褒义词和贬义词,以加强对文本褒贬义强度的识别。 [Xu Linhong, Lin Hongfei, Yang Zhihao. Text orientation identification based on semantic comprehension . Journal of Chinese Information Processing, 2007, 21(1): 96-100.] https://doi.org/10.3969/j.issn.1003-0077.2007.01.016 URL Magsci [本文引用: 1] 摘要文本倾向性识别在垃圾邮件过滤、信息安全和自动文摘等领域都有广泛的应用。本文提出了基于语义理解的文本倾向性识别机制。其主要思想是首先计算词汇与知网中已标注褒贬性的词汇间的相似度,获取词汇的倾向性;再选择倾向性明显的词汇作为特征值,用SVM分类器分析文本的褒贬性;最后采用否定规则匹配文本中的语义否定的策略提高分类效果,同时处理程度副词附近的褒义词和贬义词,以加强对文本褒贬义强度的识别。
[43]	周小兵. 论现代汉语的程度副词 . 中国语文, 1995, 20(2): 100-104. [本文引用: 1] [Zhou Xiaobing. The theory on the adverbs of degree in contemporary Chinese . Studies of the Chinese Language, 1995, 20(2): 100-104.] [本文引用: 1]
[44]	蔺璜, 郭姝慧. 程度副词的特点范围与分类 . 山西大学学报: 哲学社会科学版, 2003, 26(2): 71-74. https://doi.org/10.3969/j.issn.1000-5935.2003.02.015 URL [本文引用: 1] 摘要程度副词是副词家族中举足轻重的一个次类。它与其他副词相比,具有粘着性强,定位性强,语义指向单一的特点。根据其句法语义功能,文章框定了程度副词的范围,鉴定出了85个常用的程度副词,并从上位到下位对其做了较为细致的分类,进而得出了从低量到中量、高量乃至极量的一个具有层级序列的现代汉语程度副词的分类表。 [Lin Huang, Guo Shuhui. On the characteristics, range and classification of adverbs of degree . Journal of Shanxi University: Philosophy & Social Science, 2003, 26(2): 71-74.] https://doi.org/10.3969/j.issn.1000-5935.2003.02.015 URL [本文引用: 1] 摘要程度副词是副词家族中举足轻重的一个次类。它与其他副词相比,具有粘着性强,定位性强,语义指向单一的特点。根据其句法语义功能,文章框定了程度副词的范围,鉴定出了85个常用的程度副词,并从上位到下位对其做了较为细致的分类,进而得出了从低量到中量、高量乃至极量的一个具有层级序列的现代汉语程度副词的分类表。
[45]	邸鹏, 李爱萍, 段利国. 基于转折句式的文本情感倾向性分析 . 计算机工程与设计, 2014, 35(12): 4289-4295. https://doi.org/10.3969/j.issn.1000-7024.2014.12.045 URL [本文引用: 4] 摘要在文本的情感倾向性研究中缺乏对多种情感共现的转折句式的有效分析，为此提出一种专门对转折句式进行有效情感倾向性分析的方法。充分分析汉语中转折句式的结构特点，通过已有资源构建中文情感词典、转折词表、否定词表，依据转折句式中转折词、否定词、情感词的组合规律提出用于进行情感分析的启发式规则。在公开语料库的实验中，该方法能更好地对转折句式进行情感倾向性分析，将此规则融入到传统的朴素贝叶斯情感分类模型后，能获得更高的情感分析精度。 [Di Peng, Li Aiping, Duan Liguo. Text sentiment polarity analysis based on transition sentence . Computer Engineering and Design, 2014, 35(12): 4289-4295.] https://doi.org/10.3969/j.issn.1000-7024.2014.12.045 URL [本文引用: 4] 摘要在文本的情感倾向性研究中缺乏对多种情感共现的转折句式的有效分析，为此提出一种专门对转折句式进行有效情感倾向性分析的方法。充分分析汉语中转折句式的结构特点，通过已有资源构建中文情感词典、转折词表、否定词表，依据转折句式中转折词、否定词、情感词的组合规律提出用于进行情感分析的启发式规则。在公开语料库的实验中，该方法能更好地对转折句式进行情感倾向性分析，将此规则融入到传统的朴素贝叶斯情感分类模型后，能获得更高的情感分析精度。
[46]	吕淑湘. 疑问·否定·肯定 . 中国语文, 1985, 4(2): 41-43. [本文引用: 1] [Lv Shuxiang. Question, negative, positive . Studies of the Chinese Language, 1985, 4(2): 41-43.] [本文引用: 1]
[47]	李泉. 汉语语法考察与分析. 北京: 北京语言文化大学出版社, 2001. [本文引用: 1]
[1]	Schmallegger D, Carson D. Destination image projection on consumer-generated content websites: A case study of the Flinders Ranges . Information Technology & Tourism, 2009, 11(2): 111-127. https://doi.org/10.3727/109830509789994838 URL [本文引用: 1] 摘要 This article examines destination image projection on consumer-generated content (CGC) websites. A case study of the Flinders Ranges in South Australia was conducted to assess the destination images presented by two different markets. Blogs, review sites, and special interest forums were analyzed against a common destination image framework. The retrieved images were then compared to official images promoted by the destination marketing organization (DMO). The research revealed considerable differences between consumer images and DMO images. The results suggest that different types of CGC websites encourage different levels of information exchange. Future research will need to focus on the impact that various types of CGC websites can have on consumers as a form of word of mouth.
[2]	张文, 顿雪霏. 探讨大陆游客对台湾旅游目的地形象的感知: 基于网上游记的内容分析 . 北京第二外国语学院学报, 2010, (11): 75-83. https://doi.org/10.3969/j.issn.1003-6539.2010.11.011 URL 摘要本文在对旅游目的地形象感知的相关理论研究回顾的基础上,以携程旅行网(www.ctrip.com)上发表的大陆游客赴台游记为样本,运用内容分析法,建立分析类目,并做了信度分析.在此基础上,就大陆游客对台湾旅游目的地形象的感知进行了归纳和分析,由此,得出关于大陆游客对台湾旅游目的地形象感知的结论.
[47]	[Li Quan.The Investigation and Analysis of Grammar in Chinese Language. Beijing: Beijing Language &Culture University Press, 2001.] [本文引用: 1]
[48]	程晓明. 转折句式与转折词 . 湖北民族学院学报: 社会科学版, 1998, 16(4): 36-40. [本文引用: 1]
[2]	[Zhang Wen, Dun Xuefei. Study on image perception of mainland tourists to Taiwan: Based on content analysis of online travels . Journal of Beijing International Studies University, 2010, (11): 75-83.] https://doi.org/10.3969/j.issn.1003-6539.2010.11.011 URL 摘要本文在对旅游目的地形象感知的相关理论研究回顾的基础上,以携程旅行网(www.ctrip.com)上发表的大陆游客赴台游记为样本,运用内容分析法,建立分析类目,并做了信度分析.在此基础上,就大陆游客对台湾旅游目的地形象的感知进行了归纳和分析,由此,得出关于大陆游客对台湾旅游目的地形象感知的结论.
[3]	张珍珍, 李君轶. 旅游形象研究中问卷调查和网络文本数据的对比: 以西安旅游形象感知研究为例 . 旅游科学, 2014, 28(6): 73-81. https://doi.org/10.3969/j.issn.1006-575X.2014.06.007 URL [本文引用: 1] 摘要旅游目的地形象测量的主要途径为问卷调查,随着互联网的普及,越来越多的研究者也开始通过在线评论等网络数据来研究旅游目的地形象,然而对于这两种数据之间的相互关系以及其应用于研究的可靠性还是鲜有涉及。本文以西安为例,通过问卷调查和网络评论两种途径获取游客对西安旅游形象的感知数据,并通过数据分析、内容挖掘软件和文本分析等方法,从旅游目的地形象感知因子、整体形象感知、代表性景点三方面对两组数据进行对比分析。研究发现：（1）在西安旅游形象感知的研究中,对调查问卷和网络文本获取的数据进行分析的结果呈现出相对一致性;（2）问卷中非结构化部分的内容和网络文本中提取的内容呈现出高度一致性;（3）与问卷调查数据相比,网络文本数据几乎不涉及游客对旅游＂社会形象＂的感知。
[48]	[Cheng Xiaoming. Transition sentence and advertise . Journal of Hubei Institute for Nationalities: Social Science Edition, 1998, 16(4): 36-40.] [本文引用: 1]
[49]	胡裕树, 许宝华. 現代汉语. 上海:上海教育出版社, 1981. [本文引用: 1]
[3]	[Zhang Zhenzhen, Li Junyi. A comparative study on the data of a questionnaire and web texts in tourism image researches: A case study of Xi'an's tourism image perception . Tourism Science, 2014, 28(6): 73-81.] https://doi.org/10.3969/j.issn.1006-575X.2014.06.007 URL [本文引用: 1] 摘要旅游目的地形象测量的主要途径为问卷调查,随着互联网的普及,越来越多的研究者也开始通过在线评论等网络数据来研究旅游目的地形象,然而对于这两种数据之间的相互关系以及其应用于研究的可靠性还是鲜有涉及。本文以西安为例,通过问卷调查和网络评论两种途径获取游客对西安旅游形象的感知数据,并通过数据分析、内容挖掘软件和文本分析等方法,从旅游目的地形象感知因子、整体形象感知、代表性景点三方面对两组数据进行对比分析。研究发现：（1）在西安旅游形象感知的研究中,对调查问卷和网络文本获取的数据进行分析的结果呈现出相对一致性;（2）问卷中非结构化部分的内容和网络文本中提取的内容呈现出高度一致性;（3）与问卷调查数据相比,网络文本数据几乎不涉及游客对旅游＂社会形象＂的感知。
[4]	Bulchand Gidumal J, Melián González S, Lopez Valcarcel B G. A social media analysis of the contribution of destinations to client satisfaction with hotels . International Journal of Hospitality Management, 2013, 35(1): 44-47. https://doi.org/10.1016/j.ijhm.2013.05.003 URL [本文引用: 1] 摘要 To what extent do the ratings of hotels in social media depend on the hotels themselves and to what extent do they depend on the destination of the hotel? That is, if we were able to place a hotel with the same characteristics and services at two different destinations, would both have the same rating or would they differ? By using multilevel regression analysis, we have quantified the extent to which differences in client satisfaction with hotels can be attributed to the destination in which the hotels are located. We have measured this through ratings provided through social media outlets. Data downloaded from TripAdvisor from a sample of 7173 hotels were used. After controlling for specific variables, an 11.38% of the variance could be attributed to the destination. Thus, both hotels and destination management organizations (DMOs) are involved in client satisfaction and must work jointly to secure it.
[49]	[Hu Yushu, Xu Baohua. Contemporary Chinese.Shanghai: Shanghai Education Press, 1981.] [本文引用: 1]
[50]	刘永红. 转折复句语意重心的逻辑语义分析 . 暨南大学华文学院学报, 2003, 8(1): 45-52. https://doi.org/10.3969/j.issn.1674-8174.2003.01.007 URL [本文引用: 1] 摘要就已有资料来看 ,对转折复句的语意重心存在明显分歧 ,一些语言学家认为转折复句的语义重心在第二句 ,但此论点与论据之间的联系尚未澄清 ,缺少的就是一个论证过程 ,本文试运用数理逻辑真值判定表运算对转折复句语意重心进行逻辑语义分析
[5]	Oliver V, Garcia E, Solana A. Big Data and Tourism: New Indicators for Tourism Management . Barcelona: Roca Salvatella and Telefonica, 2014. [本文引用: 1]
[6]	张黎军, 赵霞. 基于大数据分析的旅游管理服务系统 . 信息通信, 2014, (11): 232-233. https://doi.org/10.3969/j.issn.1673-1131.2014.11.170 URL [本文引用: 1] 摘要针对海量的基站存储数据，基于云计算技术的云平台进行部署，引入大数据分析，结合GIS地图，通过分析用户在景区的驻留等行为，精确建模，对用户主动提供旅游信息和服务，同时景区管理人员有效掌握景区人员流量情况，有的放矢进行管理。 [Zhang Lijun, Zhao Xia. Tourism management and service system based on big data . Information & Communications, 2014, (11): 232-233.] https://doi.org/10.3969/j.issn.1673-1131.2014.11.170 URL [本文引用: 1] 摘要针对海量的基站存储数据，基于云计算技术的云平台进行部署，引入大数据分析，结合GIS地图，通过分析用户在景区的驻留等行为，精确建模，对用户主动提供旅游信息和服务，同时景区管理人员有效掌握景区人员流量情况，有的放矢进行管理。
[7]	吴英鹰. 大数据背景下旅游企业网络营销的创新: 基于AISAS消费者行为分析 . 中国商贸, 2013, (12): 107-108. [本文引用: 1] [Wu Yingying. The innovation of tourism enterprise network marketing in the big data context: Based on AISAS tourist behavior analysis . China Business & Trade, 2013, (12): 107-108.] [本文引用: 1]
[8]	史春云, 张捷, 沈正平, 等. 旅游目的地竞争力定量评价综述 . 人文地理, 2006, 20(3): 72-78. [本文引用: 1] [Shi Chunyun, Zhang Jie, Shen Zhengping, et al. An overview of quantitative evaluation of the tourist destination competitiveness . Human Geography, 2006, 20(3): 72-78.] [本文引用: 1]
[9]	钟士恩, 章锦河, 孙晋坤. 基于遗产保护与旅游发展综合评价的古镇型旅游目的地差异化发展路径研究: 以江苏省为例 . 地理研究, 2015, 34(7): 1380-1393. https://doi.org/10.11821/dlyj201507016 URL Magsci [本文引用: 1] 摘要 <p>在界定了古镇型旅游目的地的概念和内涵的基础上,从地理学区域研究传统,描述了江苏省古镇的区域特征及其格局,以及时间变化上的发展阶段和历程。将旅游发展作为古镇遗产保护和利用的首要方式和最优路径,作为研究出发点。针对中国历史文化名镇（村）和全国特色景观旅游名镇（村）评价指标体系的相对不足,构建了遗产保护与旅游发展综合评价指标体系。在此基础上回答了江苏省共有多少古镇,哪些古镇适宜进行遗产保护和旅游发展。结合分级、分类评价结果,综合均衡分析的理论模型构建,明确了江苏省古镇的差异化发展路径选择及其区域旅游格局重构。</p> [Zhong Shi'en, Zhang Jinhe, Sun Jinshen. The diversified development of historic towns based on the integrated evaluation system of heritage conservation and tourism development in Jiangsu . Geographical Research, 2015, 34(7): 1380-1393.] https://doi.org/10.11821/dlyj201507016 URL Magsci [本文引用: 1] 摘要 <p>在界定了古镇型旅游目的地的概念和内涵的基础上,从地理学区域研究传统,描述了江苏省古镇的区域特征及其格局,以及时间变化上的发展阶段和历程。将旅游发展作为古镇遗产保护和利用的首要方式和最优路径,作为研究出发点。针对中国历史文化名镇（村）和全国特色景观旅游名镇（村）评价指标体系的相对不足,构建了遗产保护与旅游发展综合评价指标体系。在此基础上回答了江苏省共有多少古镇,哪些古镇适宜进行遗产保护和旅游发展。结合分级、分类评价结果,综合均衡分析的理论模型构建,明确了江苏省古镇的差异化发展路径选择及其区域旅游格局重构。</p>
[10]	柴彦威, 塔娜. 中国时空间行为研究进展 . 地理科学进展, 2013, 32(9): 1362-1373. https://doi.org/10.11820/dlkxjz.2013.09.006 Magsci [本文引用: 1] 摘要自时间地理学和活动分析法引入中国以来的近20年间,时空间行为研究已经成为中国城市地理学的重要领域。中国时空间行为研究关注城市空间重构的描述与解释,试图从行为角度解释中国城市社会转型,强调转型期中国城市空间与居民个体行为之间的互动关系,重视日常生活、生活质量、社会公正、低碳社会、智慧城市等热点问题,探索在城市交通、旅游和城市规划等领域中的实践应用。中国时空间行为研究已经形成了以解读城市转型为目标、以规划应用为导向的鲜明特点,为理解中国城市制度与空间转型背景下人类行为模式的复杂性和多样性提供了一个全新的视角。但是,中国时空间行为研究依然面临着理论发展滞后、实践应用需要突破等挑战。本文是对时空行为研究近年来发展的综述性文章,从数据采集与分析方法演进、实证研究与规划应用进展等方面回顾了近20年来中国城市时空间行为研究的最新进展,致力于推动不同学科领域之间的交流和时空间行为研究自身的发展。 [Chai Yanwei, Ta Na. Progress in space-time behavior research in China . Progress in Geography, 2013, 32(9): 1362-1373.] https://doi.org/10.11820/dlkxjz.2013.09.006 Magsci [本文引用: 1] 摘要自时间地理学和活动分析法引入中国以来的近20年间,时空间行为研究已经成为中国城市地理学的重要领域。中国时空间行为研究关注城市空间重构的描述与解释,试图从行为角度解释中国城市社会转型,强调转型期中国城市空间与居民个体行为之间的互动关系,重视日常生活、生活质量、社会公正、低碳社会、智慧城市等热点问题,探索在城市交通、旅游和城市规划等领域中的实践应用。中国时空间行为研究已经形成了以解读城市转型为目标、以规划应用为导向的鲜明特点,为理解中国城市制度与空间转型背景下人类行为模式的复杂性和多样性提供了一个全新的视角。但是,中国时空间行为研究依然面临着理论发展滞后、实践应用需要突破等挑战。本文是对时空行为研究近年来发展的综述性文章,从数据采集与分析方法演进、实证研究与规划应用进展等方面回顾了近20年来中国城市时空间行为研究的最新进展,致力于推动不同学科领域之间的交流和时空间行为研究自身的发展。
[11]	柴彦威, 申悦, 马修军, 等. 北京居民活动与出行行为时空数据采集与管理 . 地理研究, 2013, 32(3): 441-451. https://doi.org/10.11821/yj2013030006 URL Magsci [本文引用: 1] 摘要本研究对传统活动日志调查与基于GPS、LBS的移动数据采集在居民活动—移动数据的获取和应用方面进行对比,并以2010年7月在北京进行的居民活动与移动调查为例,探讨了个体行为时空数据采集的方法、存在问题和处理方式。北京市的实验调查采取活动日志调查与基于GPS、GSM两种不同定位方式的移动数据采集相结合的方法,以定位设备为基础、以互动式调查网站为平台、以面对面和电话访谈为补充,对天通苑和亦庄两个郊区居住区的样本居民进行了为期一周的行为时空数据采集。针对时空轨迹和活动日志存在的问题分别进行处理,并对数据质量进行管理,旨在为城市活动—移动系统研究中的精细化的数据采集与管理提供理论、方法和实践经验。 [Chai Yanwei, Shen Yue, Ma Xiujun, et al. The collection and management of space-time data of individual behavior based on location-based technologies: A case study of activity-travel survey in Beijing . Geographical Research, 2013, 32(3): 441-451.] https://doi.org/10.11821/yj2013030006 URL Magsci [本文引用: 1] 摘要本研究对传统活动日志调查与基于GPS、LBS的移动数据采集在居民活动—移动数据的获取和应用方面进行对比,并以2010年7月在北京进行的居民活动与移动调查为例,探讨了个体行为时空数据采集的方法、存在问题和处理方式。北京市的实验调查采取活动日志调查与基于GPS、GSM两种不同定位方式的移动数据采集相结合的方法,以定位设备为基础、以互动式调查网站为平台、以面对面和电话访谈为补充,对天通苑和亦庄两个郊区居住区的样本居民进行了为期一周的行为时空数据采集。针对时空轨迹和活动日志存在的问题分别进行处理,并对数据质量进行管理,旨在为城市活动—移动系统研究中的精细化的数据采集与管理提供理论、方法和实践经验。
[12]	柯文前, 俞肇元, 陈伟, 等. 人类时空间行为数据观测体系架构及其关键问题 . 地理研究, 2015, 34(2): 373-383. https://doi.org/10.11821/dlyj201502016 URL Magsci [本文引用: 1] 摘要 <p>大数据的行为研究具有丰富的数据源,但在数据的尺度、信度、精度、粒度和研究边界等方面仍存在诸多问题,且涉及隐私、可预测性等广泛争议。依据“信息获取方式确定—信息获取手段整合—信息类型划分—信息解析与要素提取—行为属性与要素集成”的思路,构建了整合高精度、全要素和多视角的行为数据观测体系架构。梳理与论述了行为研究中行为变化的尺度依赖特征,个体行为与群体行为数据的区分与综合,行为数据需求与个体隐私边界界定及行为数据的解析、匹配与整合等关键问题。尝试从科学问题的边界界定与数据需求、多源数据采集与整合方法、多要素行为数据解析与集成方法及应用驱动的行为数据应用模式与途径等方面,对行为数据的综合采集与集成处理进行界定。</p> [Ke Wenqian, Yu Zhaoyuan, Chen Wei, et al. Architecture and key issues for human space-time behavior data observation . Geographical Research, 2015, 34(2): 373-383.] https://doi.org/10.11821/dlyj201502016 URL Magsci [本文引用: 1] 摘要 <p>大数据的行为研究具有丰富的数据源,但在数据的尺度、信度、精度、粒度和研究边界等方面仍存在诸多问题,且涉及隐私、可预测性等广泛争议。依据“信息获取方式确定—信息获取手段整合—信息类型划分—信息解析与要素提取—行为属性与要素集成”的思路,构建了整合高精度、全要素和多视角的行为数据观测体系架构。梳理与论述了行为研究中行为变化的尺度依赖特征,个体行为与群体行为数据的区分与综合,行为数据需求与个体隐私边界界定及行为数据的解析、匹配与整合等关键问题。尝试从科学问题的边界界定与数据需求、多源数据采集与整合方法、多要素行为数据解析与集成方法及应用驱动的行为数据应用模式与途径等方面,对行为数据的综合采集与集成处理进行界定。</p>
[13]	甄峰, 王波. “大数据”热潮下人文地理学研究的再思考 . 地理研究, 2015, 34(5): 803-811. https://doi.org/10.11821/dlyj201505001 URL Magsci [本文引用: 1] 摘要 <p>伴随着移动通信技术的快速发展以及定位应用程序的普及,带有地理空间信息的数据成为“大数据”中的重要部分,为人文地理学研究的发展提供了新的机遇,也契合了人文地理学“计量转向”与“社会转向”的发展规律,以及人文地理学人本主义的发展趋势。但同时,人文地理学者也面临着数据决定论、数据分析方法准备不足以及数据自身缺陷所带来的危机与挑战。在“大数据”热潮下,无论是定量研究还是定性研究,“大数据”还是“小数据”的研究,都应当给予同样的重视,数据规模与数据的采集、分析和阐述并无很大的关联。并且,还需要警惕由于数据垄断可能带来研究的“数字鸿沟”,并呼吁人文地理学研究在研究方法与内容等方面与其他学科进行更多的跨学科合作。</p> [Zhen Feng, Wang Bo. Rethinking human geography in the age of big data . Geographical Research, 2015, 34(5): 803-811.] https://doi.org/10.11821/dlyj201505001 URL Magsci [本文引用: 1] 摘要 <p>伴随着移动通信技术的快速发展以及定位应用程序的普及,带有地理空间信息的数据成为“大数据”中的重要部分,为人文地理学研究的发展提供了新的机遇,也契合了人文地理学“计量转向”与“社会转向”的发展规律,以及人文地理学人本主义的发展趋势。但同时,人文地理学者也面临着数据决定论、数据分析方法准备不足以及数据自身缺陷所带来的危机与挑战。在“大数据”热潮下,无论是定量研究还是定性研究,“大数据”还是“小数据”的研究,都应当给予同样的重视,数据规模与数据的采集、分析和阐述并无很大的关联。并且,还需要警惕由于数据垄断可能带来研究的“数字鸿沟”,并呼吁人文地理学研究在研究方法与内容等方面与其他学科进行更多的跨学科合作。</p>
[14]	Zheng X, Schwartz Z, Uysal M.What Types of Hotels Make Their Guests (Un)Happy? Text Analytics of Customer Experiences in Online Reviews. Lugano: Springer International Publishing, 2015. [本文引用: 1]
[15]	熊伟, 高阳, 吴必虎. 中外国际高星级连锁酒店服务质量对比研究: 基于网络评价的内容分析 . 经济地理, 2012, 32(2): 160-165. URL [本文引用: 1] 摘要服务质量是酒店研究的重要内容,国内外相关研究已在酒店服务质量评价和中外酒店对比中取得了一定的成果,但尚未涉及国内外国际高星级连锁酒店的服务质量评价对比。基于此,文章在文献研究的基础上建立了国际高星级连锁酒店服务质量的评价指标体系,并分别从到到网(http://www.daodao.com)及其母网上搜集了1 035条顾客评论样本,运用内容分析法将其量化处理,通过SPSS17.0统计软件进行分析,主要结论有:①国外评价的总体评价略高于国内水平,对各项基础设施的关注度远高于国内评价,但满意度却远低于国内评价,且国外顾客的意见分散程度大大高于国内顾客;②两者对各项设施设备的关注度和满意度存在明显差异;③国外顾客更愿意在客观评价的基础上将酒店推荐给他人;④国外评价的回复率略低,但回复质量和实际利用效果大大优于国内水平。最后,针对性地提出了相关建议。 [Xiong Wei, Gao Yang, Wu Bihu. A comparison research of online commentary about service quality in Sino-foreign international high-rated chain hotels . Economic Geography, 2012, 32(2): 160-165.] URL [本文引用: 1] 摘要服务质量是酒店研究的重要内容,国内外相关研究已在酒店服务质量评价和中外酒店对比中取得了一定的成果,但尚未涉及国内外国际高星级连锁酒店的服务质量评价对比。基于此,文章在文献研究的基础上建立了国际高星级连锁酒店服务质量的评价指标体系,并分别从到到网(http://www.daodao.com)及其母网上搜集了1 035条顾客评论样本,运用内容分析法将其量化处理,通过SPSS17.0统计软件进行分析,主要结论有:①国外评价的总体评价略高于国内水平,对各项基础设施的关注度远高于国内评价,但满意度却远低于国内评价,且国外顾客的意见分散程度大大高于国内顾客;②两者对各项设施设备的关注度和满意度存在明显差异;③国外顾客更愿意在客观评价的基础上将酒店推荐给他人;④国外评价的回复率略低,但回复质量和实际利用效果大大优于国内水平。最后,针对性地提出了相关建议。
[16]	Ekman P, Friesen W V. Constants across cultures in the face and emotion . Journal of Personality and Social Psychology, 1971, 17(2): 124-129. https://doi.org/10.1037/h0030377 URL PMID: 5542557 [本文引用: 1] 摘要 Investigated the question of whether any facial expressions of emotion are universal. Recent studies showing that members of literate cultures associated the same emotion concepts with the same facial behaviors could not demonstrate that at least some facial expressions of emotion are universal; the cultures compared had all been exposed to some of the same mass media presentations of facial expression, and these may have taught the people in each culture to recognize the unique facial expressions of other cultures. To show that members of a preliterate culture who had minimal exposure to literate cultures would associate the same emotion concepts with the same facial behaviors as do members of Western and Eastern literate cultures, data were gathered in New Guinea by telling 342 Ss a story, showing them a set of 3 faces, and asking them to select the face which showed the emotion appropriate to the story. Ss were members of the Fore linguistic-cultural group, which up until 12 yr. ago was an isolated, Neolithic, material culture. Results provide evidence in support of the hypothesis. (30 ref.) (PsycINFO Database Record (c) 2012 APA, all rights reserved)
[17]	Mehrabian A, Russell J A.An Approach to Environmental Psychology. Cambridge: The MIT Press, 1974. [本文引用: 1]
[18]	Russell J A. A circumplex model of affect . Journal of Personality and Social Psychology, 1980, 39(6): 1161-1178. URL [本文引用: 1]
[19]	Cacioppo J T, Gardner W L, Berntson G G. The affect system has parallel and integrative processing components . Journal of Personality & Social Psychology, 1999, 76(5): 839-855. [本文引用: 1]
[20]	乐国安, 董颖红. 情绪的基本结构: 争论、应用及其前瞻 . 南开学报: 哲学社会科学版, 2013, 58(1): 140-150. [本文引用: 1] [Yue Guo'an, Dong Yinghong. On the categorical and dimensional approaches of the theories of the basic structure of emotions . Nankai Journal: Philosophy, Literature and Social Science Edition, 2013, 58(1): 140-150.] [本文引用: 1]
[21]	Das S R, Chen M Y. Yahoo! For Amazon: Sentiment extraction from small talk on the web . Management Science, 2007, 53(9): 1375-1388. https://doi.org/10.1287/mnsc.1070.0704 URL [本文引用: 1] 摘要 Extracting sentiment from text is a hard semantic problem. We develop a methodology for extracting small investor sentiment from stock message boards. The algorithm comprises different classifier algorithms coupled together by a voting scheme. Accuracy levels are similar to widely used Bayes classifiers, but false positives are lower and sentiment accuracy higher. Time series and cross-sectional aggregation of message information improves the quality of the resultant sentiment index, particularly in the presence of slang and ambiguity. Empirical applications evidence a relationship with stock values--tech-sector postings are related to stock index levels, and to volumes and volatility. The algorithms may be used to assess the impact on investor opinion of management announcements, press releases, third-party news, and regulatory changes.
[22]	赵妍妍, 秦兵, 刘挺. 文本情感分析 . 软件学报, 2010, 21(8): 1834-1848. [本文引用: 1] [Zhao Yanyan, Qin Bing, Liu Ting. Sentiment analysis . Journal of Software, 2010, 21(8): 1834-1848.] [本文引用: 1]
[23]	王洪伟, 郑丽娟, 尹裴, 等. 在线评论的情感极性分类研究综述 . 情报科学, 2012, 30(8): 1263-1271. URL [本文引用: 2] 摘要对在线评论情感极性分类的研究现状与进展进行了总结。首先对情感类型的划分进行归纳,并针对在线评论中所涉及到的肯定和否定两种情感,从粗粒度、细粒度和实证研究三方面展开评述。为研究情感极性分类的商业价值,对在线评论将如何影响消费者的购买行为以及如何影响商家的销售绩效的工作进行整理和评述。最后对今后的研究方向进行展望。 [Wang Hongwei, Zheng Lijuan, Yin Pei, et al. A survey on sentiment polarity classification of online reviews . Information Science, 2012, 30(8): 1263-1271.] URL [本文引用: 2] 摘要对在线评论情感极性分类的研究现状与进展进行了总结。首先对情感类型的划分进行归纳,并针对在线评论中所涉及到的肯定和否定两种情感,从粗粒度、细粒度和实证研究三方面展开评述。为研究情感极性分类的商业价值,对在线评论将如何影响消费者的购买行为以及如何影响商家的销售绩效的工作进行整理和评述。最后对今后的研究方向进行展望。
[24]	乐国安, 董颖红, 陈浩, 等. 在线文本情感分析技术及应用 . 心理科学进展, 2013, 21(10): 1711-1719. https://doi.org/10.3724/SP.J.1042.2013.01711 URL Magsci [本文引用: 2] 摘要 Web 2.0时代的到来, 增强了互联网络的人际交互性与即时性, 使互联网逐渐成为大众普遍交流观点、抒发情感的平台, 同时也积累下关于人类心理和行为的海量文本信息, 可供社会科学研究之用。心理学的情绪结构理论中有关类型分类取向和维度取向的理论成果, 为信息科学研究中的情感词库、情感分析工具的开发和发展, 提供了心理科学基础。利用在线文本情感分析技术研究大众社会心理, 拓宽了包括心理学在内的社会科学研究范畴; 同时社会科学也为在线文本情感分析研究提供了新的研究命题和理论框架。二者相辅相成, 共同推动计算社会科学的发轫与发展。 [Yue Guo'an, Dong Yinghong, Chen Hao, et al. Online textual sentiment analysis technology and its applications . Advances in Psychological Science, 2013, 21(10): 1711-1719.] https://doi.org/10.3724/SP.J.1042.2013.01711 URL Magsci [本文引用: 2] 摘要 Web 2.0时代的到来, 增强了互联网络的人际交互性与即时性, 使互联网逐渐成为大众普遍交流观点、抒发情感的平台, 同时也积累下关于人类心理和行为的海量文本信息, 可供社会科学研究之用。心理学的情绪结构理论中有关类型分类取向和维度取向的理论成果, 为信息科学研究中的情感词库、情感分析工具的开发和发展, 提供了心理科学基础。利用在线文本情感分析技术研究大众社会心理, 拓宽了包括心理学在内的社会科学研究范畴; 同时社会科学也为在线文本情感分析研究提供了新的研究命题和理论框架。二者相辅相成, 共同推动计算社会科学的发轫与发展。
[25]	王祖辉, 姜维, 李一军. 在线评论情感分析中固定搭配特征提取方法研究 . 管理工程学报, 2014, 28(4): 180-186. https://doi.org/10.3969/j.issn.1004-6062.2014.04.024 URL [本文引用: 1] 摘要有效和稳定的特征提取和特征表示是提高在线评论情感分析性能的重要因素.在常规的连续词袋性、触及对等特征的基础上,本文研究在线评论中固定搭配特征的提取与表示方法,提出结合互信息和平均互信息、基于粗糙集两种策略用于固定搭配特征提取,并从特征抽取方法的有效性和稳定性分析出发考查所抽取的固定搭配其内部及外部稳定性,并将经筛选的固定搭配特征融合于多种情感分析模型中进行情感分析.真实酒店评论数据上的实验表明,固定搭配特征的恰当表示和筛选有效改善情感分析模型的分类精度,此外研究发现评论中情感特征词分布不均衡情况下采用可变精度粗规则的提取策略有助于提高情感分析的分类精度. [Wang Zuhui, Jiang Wei, Li Yijun. Regular collocation features extraction method in online reviews sentiment analysis . Journal of Industrial Engineering and Engineering Management, 2014, 28(4): 180-186.] https://doi.org/10.3969/j.issn.1004-6062.2014.04.024 URL [本文引用: 1] 摘要有效和稳定的特征提取和特征表示是提高在线评论情感分析性能的重要因素.在常规的连续词袋性、触及对等特征的基础上,本文研究在线评论中固定搭配特征的提取与表示方法,提出结合互信息和平均互信息、基于粗糙集两种策略用于固定搭配特征提取,并从特征抽取方法的有效性和稳定性分析出发考查所抽取的固定搭配其内部及外部稳定性,并将经筛选的固定搭配特征融合于多种情感分析模型中进行情感分析.真实酒店评论数据上的实验表明,固定搭配特征的恰当表示和筛选有效改善情感分析模型的分类精度,此外研究发现评论中情感特征词分布不均衡情况下采用可变精度粗规则的提取策略有助于提高情感分析的分类精度.
[26]	Pang B, Lee L. Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales . Conference Proceedings of the ACL, 2005: 115-124. https://doi.org/10.3115/1219840.1219855 URL [本文引用: 1] 摘要 We address the rating-inference problem, wherein rather than simply decide whether a review is "thumbs up" or "thumbs down", as in previous sentiment analysis work, one must determine an author's evaluation with respect to a multi-point scale (e.g., one to five "stars"). This task represents an interesting twist on standard multi-class text categorization because there are several different degrees of similarity between class labels; for example, "three stars" is intuitively closer to "four stars" than to "one star". We first evaluate human performance at the task. Then, we apply a meta-algorithm, based on a metric labeling formulation of the problem, that alters a given n-ary classifier's output in an explicit attempt to ensure that similar items receive similar labels. We show that the meta-algorithm can provide significant improvements over both multi-class and regression versions of SVMs when we employ a novel similarity measure appropriate to the problem.Pang, B; Lee, L
[27]	Ye Q, Zhang Z, Law R. Sentiment classification of online reviews to travel destinations by supervised machine learning approaches . Expert Systems with Applications, 2009, 36(3): 6527-6535. https://doi.org/10.1016/j.eswa.2008.07.035 URL [本文引用: 2] 摘要 The rapid growth in Internet applications in tourism has lead to an enormous amount of personal reviews for travel-related information on the Web. These reviews can appear in different forms like BBS, blogs, Wiki or forum websites. More importantly, the information in these reviews is valuable to both travelers and practitioners for various understanding and planning processes. An intrinsic problem of the overwhelming information on the Internet, however, is information overloading as users are simply unable to read all the available information. Query functions in search engines like Yahoo and Google can help users find some of the reviews that they needed about specific destinations. The returned pages from these search engines are still beyond the visual capacity of humans. In this research, sentiment classification techniques were incorporated into the domain of mining reviews from travel blogs. Specifically, we compared three supervised machine learning algorithms of Na ve Bayes, SVM and the character based N-gram model for sentiment classification of the reviews on travel blogs for seven popular travel destinations in the US and Europe. Empirical findings indicated that the SVM and N-gram approaches outperformed the Na茂ve Bayes approach, and that when training datasets had a large number of reviews, all three approaches reached accuracies of at least 80%.
[28]	林江豪, 阳爱民, 周咏梅, 等. 一种基于朴素贝叶斯的微博情感分类 . 计算机工程与科学, 2012, 34(9): 160-165. URL Magsci [本文引用: 1] 摘要 <p>本文基于二次情感特征提取算法，利用句法依存关系进行一次文本情感特征提取，在此基础上，利用情感词典，进行二次情感特征提取。构建朴素贝叶斯分类器，对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号，基于情感词典的特征提取和基于二次情感特征提取方法，在不同的组合下的分类性能，寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析，发现影响微博情感分类性能的原因。实验结果表明，二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是“表情符号+标点符号+二次情感特征提取+BOOL值”。同时发现，朴素贝叶斯在酒店评论情感分类取得更高的分类性能，主要是微博评价对象多样化造成的。</p> [Lin Jianghao, Yang Aimin, Zhou Yongmei, et al. Classification of microblog sentiment based on naïve Bayesian . Computer Engineering & Science, 2012, 34(9): 160-165.] URL Magsci [本文引用: 1] 摘要 <p>本文基于二次情感特征提取算法，利用句法依存关系进行一次文本情感特征提取，在此基础上，利用情感词典，进行二次情感特征提取。构建朴素贝叶斯分类器，对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号，基于情感词典的特征提取和基于二次情感特征提取方法，在不同的组合下的分类性能，寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析，发现影响微博情感分类性能的原因。实验结果表明，二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是“表情符号+标点符号+二次情感特征提取+BOOL值”。同时发现，朴素贝叶斯在酒店评论情感分类取得更高的分类性能，主要是微博评价对象多样化造成的。</p>
[29]	杨鼎, 阳爱民. 一种基于情感词典和朴素贝叶斯的中文文本情感分类方法 . 计算机应用研究, 2010, 27(10): 3737-3739. https://doi.org/10.3969/j.issn.1001-3695.2010.10.035 URL [本文引用: 1] 摘要基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法。这种方法利用情感词典对文本进行处理和表示,基于朴素贝叶斯理论构建文本情感分类器,并以互联网上宾馆中文评论作为分类研究的对象。实验表明,使用提出的方法构成的分类器具有分类速度快、分类准确度高、鲁棒性强等特点,并且适合于大量中文文本情感分类应用系统。 [Yang Ding, Yang Aimin. Classification approach of Chinese texts sentiment based on semantic lexicon and naive Bayesian . Application Research of Computers, 2010, 27(10): 3737-3739.] https://doi.org/10.3969/j.issn.1001-3695.2010.10.035 URL [本文引用: 1] 摘要基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法。这种方法利用情感词典对文本进行处理和表示,基于朴素贝叶斯理论构建文本情感分类器,并以互联网上宾馆中文评论作为分类研究的对象。实验表明,使用提出的方法构成的分类器具有分类速度快、分类准确度高、鲁棒性强等特点,并且适合于大量中文文本情感分类应用系统。
[30]	Stone P J, Dunphy D C, Smith M S.The General Inquirer: A Computer Approach to Content Analysis. New York: The MIT Press, 1966. [本文引用: 1]
[31]	Hu M, Liu B. Mining and Summarizing Customer Reviews . Seattle: ACM, 2004. https://doi.org/10.1145/1014052.1014073 URL [本文引用: 1] 摘要 Merchants selling products on the Web often ask their customers to review the products that they have purchased and the associated services. As e-commerce is becoming more and more popular, the number of customer reviews that a product receives grows rapidly. For a popular product, the number of reviews can be in hundreds or even thousands. This makes it difficult for a potential customer to read them to make an informed decision on whether to purchase the product. It also makes it difficult for the manufacturer of the product to keep track and to manage customer opinions. For the manufacturer, there are additional difficulties because many merchant sites may sell the same product and the manufacturer normally produces many kinds of products. In this research, we aim to mine and to summarize all the customer reviews of a product. This summarization task is different from traditional text summarization because we only mine the features of the product on which the customers have expressed their opinions and whether the opinions are positive or negative. We do not summarize the reviews by selecting a subset or rewrite some of the original sentences from the reviews to capture the main points as in the classic text summarization. Our task is performed in three steps: (1) mining product features that have been commented on by customers; (2) identifying opinion sentences in each review and deciding whether each opinion sentence is positive or negative; (3) summarizing the results. This paper proposes several novel techniques to perform these tasks. Our experimental results using reviews of a number of products sold online demonstrate the effectiveness of the techniques.
[32]	Price L L, Arnould E J, Tierney P. Going to extremes: Managing service encounters and assessing provider performance . Journal of Marketing, 1995, 59(2): 83-90. https://doi.org/10.2307/1252075 URL [本文引用: 1] 摘要 The authors advance a framework for analysis and comparison of service encounters using three neglected dimensions-duration, affective content, and spatial proximity. They focus on service encounters that fall at the extreme of these three dimensions, termed extended, affectively charged, intimate (EAI) encounters. Employing qualitative and quantitative data, they develop measures of service provider performance and test a structural model of the relationships among service provider performance, affective response and service satisfaction for EAI encounters.
[33]	Hosany S, Gilbert D. Measuring tourists' emotional experiences toward hedonic holiday destinations . Journal of Travel Research, 2010, 49(3): 513-526. https://doi.org/10.1177/0047287509349267 URL [本文引用: 1] 摘要 Destinations are more likely to be successful if they recognize the experiential qualities of their offerings. However, with some exceptions, research into the emotional content of the destination experience remains largely underexplored. This current research addresses this lacuna and empirically investigates the dimensions of tourists' emotional experiences toward hedonic holiday destinations...
[34]	Babin B J, Griffin M. The nature of satisfaction: An updated examination and analysis . Journal of Business Research, 1998, 41(2): 127-136. https://doi.org/10.1016/S0148-2963(97)00001-5 URL [本文引用: 1] 摘要 The preponderance of recent satisfaction research focuses on things that cause satisfaction. Measurement articles addressing the precise conceptualization of consumer satisfaction are more than a decade old. In that time, many advances in analytical approaches used to delineate and operationalize latent constructs have been made. The research presented here uses advances in both satisfaction research and measurement theory to provide a more precise view of consumer satisfaction and dissatisfaction than has been previously offered. While some researchers have used indicators that, arguably, lack face validity due to contamination of other closely related constructs, the conceptualization offered here maximizes face validity and is more true to the nature of reflective indicators of latent constructs. Additionally, the possibility of distinct satisfaction and dissatisfaction constructs is investigated.
[35]	Hosany S, Prayag G. Patterns of tourists' emotional responses, satisfaction, and intention to recommend . Journal of Business Research, 2013, 66(6): 730-737. https://doi.org/10.1016/j.jbusres.2011.09.011 URL Magsci [本文引用: 1] 摘要 Previous efforts to understand and predict behavior traditionally categorize tourists into sub-groups using socio-demographic and psychographic variables. Surprisingly, the tourism literature does not profile tourists by the intensity of their emotional associations toward destinations. To address the literature gap, this paper empirically identifies distinguishable patterns of tourist emotional responses and investigates relationships between tourists' emotional profiles and their post-consumption evaluations of satisfaction and intention to recommend. Cluster analysis uncovers five distinct emotional response patterns among tourists: delighted, unemotionals, negatives, mixed, and passionate. Multiple discriminant analysis confirms the validity of the five-cluster solution. The five tourist groups differ by their satisfaction level and propensity to recommend destinations. These findings offer important implications for destination marketers designing segmentation and branding strategies. (C) 2011 Elsevier Inc. All rights reserved.
[36]	吴小根, 杜莹莹. 旅游目的地游客感知形象形成机理与实证: 以江苏省南通市为例 . 地理研究, 2011, 30(9): 1554-1565. https://doi.org/10.11821/yj2011090002 URL Magsci [本文引用: 1] 摘要游客感知形象是近些年来目的地旅游形象研究的重点。旅游目的地游客感知形象的形成过程是一个复杂的过程,受到了多方面因素的影响,交织了行为学、心理学、社会学、旅游学的各方面内容。本文在明晰旅游目的地游客感知形象概念的基础上,系统分析了游客感知形象形成过程的影响因素与阶段特征,进而基于相关研究假设构建了游客感知形象形成概念模型,并采用因子分析法与相关分析法对概念模型进行了实证检验,研究表明:(1)游客个体因素、旅游目的地情境因素、感知刺激因素是影响旅游目的地游客感知形象形成的主要影响因素;(2)旅游目的地游客感知形象包括认知形象和情感形象,游客认知形象支持要素包括旅游资源要素、旅游可达性要素、休闲娱乐要素以及旅游氛围要素;(3)南通市游客感知形象形成的影响因素与旅游目的地认知形象支持要素、情感形象支持要素之间具有显性相关性,验证了感知形象形成概念模型具有可行性。
[50]	[Liu Yonghong. Logical semantic analysis on semantic stress in transitional complex sentences . Journal of College of Chinese Language and Culture of Jinan University, 2003, 8(1): 45-52.] https://doi.org/10.3969/j.issn.1674-8174.2003.01.007 URL [本文引用: 1] 摘要就已有资料来看 ,对转折复句的语意重心存在明显分歧 ,一些语言学家认为转折复句的语义重心在第二句 ,但此论点与论据之间的联系尚未澄清 ,缺少的就是一个论证过程 ,本文试运用数理逻辑真值判定表运算对转折复句语意重心进行逻辑语义分析

旅游目的地游客感知形象形成机理与实证: 以江苏省南通市为例

2011

... 游客情感的研究起源于20世纪90年代,学者们的研究主要集中在基本维度和因素的界定之上.Price等揭示游客在旅游过程中同时经历着正面情感与负面情感,两者相互交织,互为进退^[32].Hosany等阐明了游客对于旅游经历的情绪反应是其消费后行为的基本决定因素,消费后行为包括游客满意度、行为意向、态度判断和选择等^[33].Babin等将顾客满意度也当作游客情感的一种,并认为满意度可以代表旅游者整体的情感意象,但是评估的内容包括不确定性,也受制于评估者的感知性能等因素^[34].进入21世纪之后,游客情感研究在方法论和机制探索上日渐成熟.Hosany等通过探索性与验证性（confirmatory）因子分析,识别了3个突出的情感维度来代表旅游目的地的情感量表,分别是：快乐、爱和惊喜.学者们根据因子分析探索了从负面到正面维度的情感意象的分布,以满意度为核心变量,由高至低分别确定了5个类型的情感意象是：高兴的、激昂的、混合的、冷漠的、负面的,其中“负面的”这一组表现为不满意^[35].在影响游客情感的因素研究方面,学者们发现旅游目的地存在认知形象和情感形象的双重感知^[36].游客在旅游过程中感知的服务质量,是游客愉悦度的决定性因素.而旅游对公共服务的感知往往对最终的整体满意度有着显著的影响^[37,38].基于台湾的研究,旅游体验的质量,直接决定了满意度,其影响的过程为：“体验质量→感知价值→满意度→行为意图”^[39].Radojevic等抓取了欧洲47个首都城市共6768家酒店的206万条在线评论,研究证实酒店的星级评论是影响顾客满意度最显著的因素,并识别出8个与以往研究不同的因素^[40].Ye等的研究表明酒店在线评论与销售预订量之间具有显著的相关关系,并量化地指出在线评论每增加10%,酒店的网络预订将提高5%以上.但是,这些研究主要聚焦于酒店住宿业,尚未拓展到对目的地的研究尺度^[27]. ...

Visitors' experience, mood and satisfaction in a heritage context: Evidence from an interpretation center

2008

旅游者服务感知、地方依恋与忠诚度: 以厦门为例

2016

旅游者服务感知、地方依恋与忠诚度: 以厦门为例

2016

Experience quality, perceived value, satisfaction and behavioral intentions for heritage tourists

2010

Ensuring positive feedback: Factors that influence customer satisfaction in the contemporary hospitality industry

2015

Putting their best foot forward: Emotional disclosure on Facebook. CyberPsychology,

2012

... 综上所述,本文认为当前基于大数据的游客情感研究领域中,研究方法尚不成熟,需要基于现有的文本分析、数据挖掘技术以及旅游学科的特性进行改进.当前未有足够理论基础,可以开展对游客情绪产生和演变机制的研究,需要先解决三个关键问题.第一,现有基于大数据的游客情感分析的研究方法缺乏校验,多数使用机器学习技术,以网站上的正、负面评分作为学习语料的参照标准.但这些评分有可能因为大众的“社交积极倾向”^（一般而言,大众在社交网络上的表达都有目的性,当个体想获得社会尊重和安全感之时,会倾向于较为温和和委婉的表达方式,即用较多的词汇表达正面情绪,而用较少的词汇表达同等程度的负面词汇.^）,而产生过度乐观的评价^[41].同时,这些网络评分与网络评论均来源于同一个游客,存在着一定的循环论证.所校验的是评论与评分之间的相关关系,并不能校验这些评论/评分与旅游目的地的综合满意度之间的关系.而且机器学习法还存在一个重大的局限性,其建模方式主要依靠计算机自动编译算法获得判别模型,其结果只能用于整体判断,内在逻辑是一个无从得知的黑箱.第二,现有研究普遍使用的情感词库均是现有的较为完整的公共词库,尚未有专门针对旅游的情感词库,无法准确捕捉在“非惯常环境下”行为的情感特征,所采用的游客情感分类方法与别的情感分类方法无异,忽视了旅游活动的特点.例如在一般词库中,“刺激”一词往往与负面情绪中的“惊讶”相关联,但实际上在旅游活动中,“刺激”大多数是正面情绪中的“兴奋”的表达.第三,当前对于文本情感极性分类的研究较多,但由于这些研究中均没有加入语义逻辑和情感强度的分析变量,普遍没有考虑语言表达中副词、连词等虚词对于情感表达的影响,容易造成误判,对情感强度的把握也不够准确. ...

... 3.2.3 情感乘数拟定由于大众在社交网络上的表达都是有选择性的表达,而表达积极正面情绪更容易获得社会认同,导致人们不自觉地会在社交网络上表现得积极向上^[41].在这个因素的影响下,通过直接统计正负面词汇的数量来判定整体评价的情感特征不够科学,会夸大正面评论的结果,需要对正负面词汇的比例进行系数矫正.本研究所抓取的初步词频统计的结果也印证了这个观点.在8个旅游监测点的评论中,正面词汇总数是负面词汇总数的7.19倍.直接将词汇总数作为判别的标准,会夸大正面情感.心理学和语言学中尚未有任何科学的实验依据支撑这个系数的存在,本文从实验角度出发来测度误差的程度,拟定了三个情感系数,分别为3倍、4倍、5倍,即当评论中的正面评价超出负面评价的3倍、4倍、5倍时,才将此条评论判定为正面评论. ...

基于语义理解的文本倾向性识别机制

2007

... 3.2.2 语义逻辑规则构建近年研究发现,相比于以所有词汇为特征项,加入褒贬义词、处理否定句和程度副词,对于判断文本倾向性有重要的促进作用,并且能够更好地反馈文本的倾向强度^[42].因此,针对程度副词、否定副词以及转折连词这三类能够明显影响语义的副词,构建了一系列规则. ...

基于语义理解的文本倾向性识别机制

2007

论现代汉语的程度副词

1995

... 第一,对于程度副词而言,比较受认可的一种分类方法是将其分为绝对和相对两类.从语义上来说,绝对词能够独立表示程度,相对词则需要通过比较来表示程度.从意义上看,绝对词还可以被分为程度过头、程度高和程度低三类,相对词可分为多项比较、双项比较两类^[43];也有学者将绝对、相对程度副词分别分为极量、高量、中量、低量四类^[44].采用HowNet（知网）程度副词文档^（HowNet（知网）程度副词文档将程度副词划分为5个级别,根据程度副词的强烈程度分别给予分数3、2.5、2、1.5、0.5.^）对程度副词进行处理.该文档根据程度副词的强烈程度,将其划分成五个倍数级别,对其分别给予0.5~3的倍数. ...

论现代汉语的程度副词

1995

程度副词的特点范围与分类

2003

程度副词的特点范围与分类

2003

基于转折句式的文本情感倾向性分析

2014

... 第二,在否定词方面,否定词在文本情感倾向性分析中也有着重要影响.一个否定词可以推翻一个句子的情感倾向^[45],吕叔湘则更具体指出否定句中存在否定的“范围”和“焦点”,认为否定句中的否定范围是否定词后的全部词语^[46].因此,准确地说,否定词并不是否定整个句子,而是否定跟随其后的词语,并且一个句子中可包括多个否定的对象.由于语言习惯、个人观点等原因,学界对于否定词的具体范围并没有统一的标准.李泉在2003年指出否定副词共有16个,包括“甭、别、不、不曾、不必、非、没、没有、莫、未、未必、未曾、未尝、无从、无须、毋庸”^[47];邸鹏等构建的否定词表中包含24个否定词,包括“不、不是、不要、无、無、别、没有、非、并非、莫、勿、毋、否、没、不太、颠覆、未、未曾、不曾、未必、休、难以、不大、否认”^[45].将以上否定词整理成否定词库,并确定了以下规则：① 当句子中出现否定词,将对其后的评价词或情感词取相反含义.② 对于多重否定句式的归纳,奇数重否定表示否定义、偶数重否定表示肯定义. ...

... [45].将以上否定词整理成否定词库,并确定了以下规则：① 当句子中出现否定词,将对其后的评价词或情感词取相反含义.② 对于多重否定句式的归纳,奇数重否定表示否定义、偶数重否定表示肯定义. ...

... 第三,将转折连词对于情感表达的影响纳入考虑.转折句式可分为“狭义转折”和“广义转折”两个概念,其中狭义转折是我们要研究的重点,它主要是指包含“虽然……但是……”“可是”等转折词的转折复句^[48].转折复句的偏句和正句中,表达的重点通常放在正句上^[49].其后有学者通过真值表运算,对转折复句中的转折句和让步句分别进行判定,证实转折复句的语义重心在后半句上^[50].邸鹏等提示标识,表达对客观事实的肯定,预告接下来将要发生的转折;第二类转折词包括“但是、可是、不过、倒是、然而、然则、但、却、只是、只不过、才、可、还是、而”等14个词,它们多在正句出现,是转折关系的直接提示标识,表达写作者真实的情感^[45].邸鹏等根据两类转折词和否定词、情感词的不同组合情况,制定转折句式的情感倾向性评判规则,并且验证这一规则的通用性,具体规则见表2. ...

... 转折句式情感评判规则^[45] ...

基于转折句式的文本情感倾向性分析

2014

... 转折句式情感评判规则^[45] ...

疑问·否定·肯定

1985

疑问·否定·肯定

1985

2001

Destination image projection on consumer-generated content websites: A case study of the Flinders Ranges

2009

... 当前旅游者越来越多地利用网络在智能移动终端进行预订旅游产品、撰写游记点评、相互交流等活动,由此产生海量的非结构性、碎片化数据,这便是旅游业中的“大数据”.当下基于大数据的旅游研究主要围绕三个主题开展.第一类是对网络文本进行较为直接的内容分析,从而了解旅游目的地或游客的感知特征和用户体验以及之间的因果关系^[1-3].第二类是采用语言学中的文本分析方法结合计算机技术进行数据挖掘,如采用自然语言处理工具,对旅游网站中文本数据进行抓取和分析,根据词频统计、相关词聚类,发现网站内容中蕴含的问题^[4].第三类是通过收集特定专属数据,如通信数据或电子支付数据等,构建数学模型分析游客出行和消费特征^[5,6].旅游从业者可以通过这些数据挖掘,分析游客满意度和预测市场需求,从而改进服务和营销策略^[7].然而,当前研究主要集中在市场营销和商业管理等研究领域,研究所应用的对象主要是旅游企业（如酒店和旅行社）,尚未从企业层面拓展到空间层面,无法适用于旅游目的地的整体评价.本文由此出发,探索如何使用旅游大数据进行方法创新,建立旅游目的地整体评价模型. ...

探讨大陆游客对台湾旅游目的地形象的感知: 基于网上游记的内容分析

2010

2001

转折句式与转折词

1998

探讨大陆游客对台湾旅游目的地形象的感知: 基于网上游记的内容分析

2010

旅游形象研究中问卷调查和网络文本数据的对比: 以西安旅游形象感知研究为例

2014

转折句式与转折词

1998

1981

旅游形象研究中问卷调查和网络文本数据的对比: 以西安旅游形象感知研究为例

2014

Lopez Valcarcel B G. A social media analysis of the contribution of destinations to client satisfaction with hotels

2013

1981

转折复句语意重心的逻辑语义分析

2003

Big Data and Tourism: New Indicators for Tourism Management

2014

基于大数据分析的旅游管理服务系统

2014

基于大数据分析的旅游管理服务系统

2014

大数据背景下旅游企业网络营销的创新: 基于AISAS消费者行为分析

2013

大数据背景下旅游企业网络营销的创新: 基于AISAS消费者行为分析

2013

旅游目的地竞争力定量评价综述

2006

... 传统的旅游目的地的相关评价主要依靠定量模型,数据来源主要由问卷调查和统计数据这两个渠道构成^[8,9].在当前大数据研究背景下,地理学者们开始采用GIS和GPS等新的空间技术,有针对性地采集个体时空行为和其他信息,从而获得群体性的空间规律和综合评价^[10,11].但是如何解决大数据的尺度、精度、信度的界定以及多源数据的整合利用问题;如何利用游客在互联网中产生的海量数据捕捉游客的偏好、愉悦度、满意度等情感信息,继而获得游客对旅游目的地的整体评价,是地理学者们尚未解决的问题^[12,13].针对这个问题,当前旅游大数据和情感分析的研究领域也缺乏科学的解决方法.首先,尽管当前研究在大数据收集、挖掘和分析方法上已经有所进展,但是没有专门针对处于“非惯常状态”下的旅游活动的分析词库和方法.同时,当前旅游大数据研究的议题较为应用导向型,多集中在游客感知和满意度这两个方面,而尚未从深层次探讨游客情绪的捕捉方法和情感表达的基本逻辑.再者,当前旅游大数据的分析和评估模型尚未成熟,需要创新的方法和数据来校验这些大数据模型能否科学地反映游客需求和偏好. ...

旅游目的地竞争力定量评价综述

2006

基于遗产保护与旅游发展综合评价的古镇型旅游目的地差异化发展路径研究: 以江苏省为例

2015

基于遗产保护与旅游发展综合评价的古镇型旅游目的地差异化发展路径研究: 以江苏省为例

2015

中国时空间行为研究进展

2013

中国时空间行为研究进展

2013

北京居民活动与出行行为时空数据采集与管理

2013

北京居民活动与出行行为时空数据采集与管理

2013

人类时空间行为数据观测体系架构及其关键问题

2015

人类时空间行为数据观测体系架构及其关键问题

2015

“大数据”热潮下人文地理学研究的再思考

2015

“大数据”热潮下人文地理学研究的再思考

2015

... 传统的旅游调查往往采取问卷调查和访谈等方法,虽然信息精准,但是信息丰富程度、数量均比较有限.同时,因为关联到受访者的个体信息,回答过程私密性不足,其可信度存在一定局限.与之相比,游客在旅游活动的过程中发表的评论,正成为了解游客偏好、评估旅游服务质量和满意度的新素材.特别是游客在旅游活动结束后针对景区和旅游目的地发表的文字短评论,具有数量多、内容精炼等特点,而且大部分在文字评论的同时还给予评分.这些海量数据,日渐成为旅游服务研究和咨询领域关注的重点信息源^[14,15].但是,在线网站的旅游评分是否能真实反映游客心理,如何从海量的、非/半结构化的旅游评论中准确地提取旅游者情感特征信息,是当前旅游大数据研究的新挑战.解决这个问题需要从心理学的情感理论研究出发,并借助当前语言学中的在线文本分析技术,来构建适用于游客情感评价的分析模型.本节针对情绪理论、在线文本分析和游客情感研究这三个领域进行评述,提出研究的切入点（图1）. ...

中外国际高星级连锁酒店服务质量对比研究: 基于网络评价的内容分析

2012

中外国际高星级连锁酒店服务质量对比研究: 基于网络评价的内容分析

2012

Constants across cultures in the face and emotion

1971

... 当前心理学的情绪理论有两大取向,包括分类取向（categorical approach）和维度取向（dimensional approach）.分类取向启蒙于达尔文的进化论,认为情绪有基本情绪和复杂情绪之分.基本情绪是天生的,主要包括快乐、悲伤、愤怒、厌恶、恐惧、惊讶等六个类别.分析人的情绪（emotion）、情感（affection）到情操（sentiment）,都需要从这六个基本类型出发.在日常生活的影响下,基本情绪会发生叠加和演化,从而衍生出复杂情绪,即后者由前者构成^[16].维度取向认为情绪不是由基本情绪和复杂情绪构成,而是取决于三个矢量维度的影响：效价（valence）、活力（arousal）和力量.Mehrahian等据此提出了PAD模型：愉悦度（pleasure）、唤醒度（arousal）和支配度（dominance）,认为人的各种情绪都是由这三个维度在不用程度的作用下形成的^[17,18].维度取向与分类取向的差别在于,维度取向认为情绪不存在基本类型,也没有绝对的分类标准.相比而言,分类取向的研究较为浅显易懂,操作起来比较方便可行,但是究竟情绪应该分为几个类别,至今仍未有定论.而且分类取向所界定的情绪类型中,有许多情绪存在高度相关性,例如焦虑与抑郁,这也成为分类取向研究当前受到质疑的原因之一. ...

1974

A circumplex model of affect

1980

The affect system has parallel and integrative processing components

1999

... 尽管关于情绪应该从分类取向还是从维度取向来认知,当前还处于争论中,但学者们已经从两个取向分别开发出相应的量表,用来捕捉情绪的内容和程度;在研究的初期大多将情绪分为正面、负面或者消极、积极来测度,而随着研究的深入逐渐增加新的情绪类型^[19,20].这些研究在当前已经初步应用到网络文本的情绪测量中,例如谷歌开发的心境量表（GPOMS）可以在线测量六种不同的网络情绪.LIWC（linguistic inquiry and word count,LIWC）软件是当前较为主流的在线文本情感分析软件,它通过分词和词性匹配功能,可用于海量文本的情绪测度,最多可以捕捉十余种情绪.研究者可根据不同研究目的确立的情绪词汇表,然后制定合理的情绪叠加逻辑,就可以计算出文本中蕴含的情绪类型.LIWC所用的这种分析逻辑,应该归属于分类取向,即预先对情绪的类型做出理论判断,再进行词汇匹配.对于处理海量非结构化数据,这种做法比较具有合理性.相对而言,维度取向的情绪量表难以应用到海量网络文本中,因为它需要依赖大量的结构化问题对情绪进行捕捉和刻画,才能判断出情绪的类型.本研究的目的在于利用海量网络数据来探索旅游目的地的评估方法,故分析逻辑与LIWC基本一致,均是预先设计好要分析的情绪类型,再进行词频捕捉. ...

情绪的基本结构: 争论、应用及其前瞻

2013

情绪的基本结构: 争论、应用及其前瞻

2013

Yahoo! For Amazon: Sentiment extraction from small talk on the web

2007

... 情感分析的理论基础来源于心理学,而分析技术正逐渐从传统的社会学走向情报信息科学.早在20世纪90年代末,情报信息科学已经尝试对文学作品中的主观意见、情感、主张等进行语义判断或极性分析^[21].早期主要对带有情感倾向的词语进行分词和计算.随着越来越多带有情感倾向和主观意见的文本出现,相关研究也逐渐从简单的计算,演变到对词语进行情感分析,进阶到更加复杂的对句子、段落、文章进行情感分析^[22].当前主要的研究目标是判断点评者对点评对象的观点是赞成或反对,立场是肯定或否定,因此大部分研究只考虑正面、负面两类概括性情感^[23]. ...

文本情感分析

2010

文本情感分析

2010

在线评论的情感极性分类研究综述

2012

... 根据文本的层次,情感分析可分为文档、句子和词汇三个水平,其中文本情感分析的基础是词汇所表达的情绪,其情绪特征对于句子和文档的情感倾向具有极高的贡献率^[24].根据分析的深度,可以分为粗粒度和细粒度两种方式.粗粒度的情感分析方式一般用于判断文本整体的情感极性,而细粒度的分析方法则多被用于判断作者对评论对象中某具体属性或维度的情感^[23].关于情感分析的步骤,王祖辉等总结了两个重要步骤,第一是从评论中抽取确切表达情感约束的特征,在当前应用中主要是过滤词库的构建;第二是建立情感分析评价的技术模型,对文本的整体情绪进行计量统计分析^[25].当前情感分析技术主要有三种,包括自然语言处理技术、机器学习技术、词汇匹配技术,早期的研究大多使用自然语言分词方法,即人工或者通过计算机对文本进行分词,然后统计出词汇类型和频度,从而判断文本的情感特征^[26].但自然语言分词方法效率较低,需要大量的人工判读.因此研究的主流方法逐渐转向机器学习和词汇匹配. ...

在线评论的情感极性分类研究综述

2012

在线文本情感分析技术及应用

2013

... 词汇匹配技术主要通过建立词库,然后通过计算机自动进行情绪词匹配,从而获得文本的情感特征^[24].例如Stone等归纳的General Inquirer词库,还有由CNKI（知网）发布的Hownet词典.词库本身也可以通过自动或半自动的方法建立.首先找到一系列典型的正、负面词汇作为种子词,随后利用特定的词汇资源,从中找到这些种子词的同义词或反义词,并且计算新词与种子词之间的联系,从而自动或半自动地建立词库^[30,31]. ...

在线文本情感分析技术及应用

2013

在线评论情感分析中固定搭配特征提取方法研究

2014

在线评论情感分析中固定搭配特征提取方法研究

2014

Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales

2005

Sentiment classification of online reviews to travel destinations by supervised machine learning approaches

2009

... Ye等使用朴素贝叶斯、支持向量机、N-gram三种算法进行旅游博客文本的情感分类,研究发现前两种算法的效果较好,当训练数据库足够大时,三种方法没有显著差别,与网友点评给分相比,准确率都能达到80%左右^[27].林江豪等通过构建朴素贝叶斯分类器,对热门话题微博和酒店评论进行文本情感倾向性分类,实验发现,将包含程度副词的句法路径,替换成了不包含程度副词的简单路径,能够降低分析的复杂度^[28].杨鼎等以携程网上北京、上海、广州的宾馆评论作为情感语料库,基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法,但是实验发现,将情感词库作为特征选择进行情绪过滤,反而更能提高文本情感分类的效果^[29]. ...

一种基于朴素贝叶斯的微博情感分类

2012

一种基于朴素贝叶斯的微博情感分类

2012

一种基于情感词典和朴素贝叶斯的中文文本情感分类方法

2010

一种基于情感词典和朴素贝叶斯的中文文本情感分类方法

2010

1966

Mining and Summarizing Customer Reviews

2004

Going to extremes: Managing service encounters and assessing provider performance

1995

Measuring tourists' emotional experiences toward hedonic holiday destinations

2010

The nature of satisfaction: An updated examination and analysis

1998

Patterns of tourists' emotional responses, satisfaction, and intention to recommend

2013

旅游目的地游客感知形象形成机理与实证: 以江苏省南通市为例

2011

转折复句语意重心的逻辑语义分析

2003

〈

〉

基于大数据的旅游目的地情感评价方法探究

Exploring emotion methods of tourism destination evaluation: A big-data approach

1 引言

2 基于旅游大数据的情感分析

2.1 情感分析的理论基础

2.2 在线文本情感分析研究进展

2.3 游客情感研究

3 研究方法

3.1 数据来源

3.2 模型构建

3.3 模型规则

4 结果与校验

4.1 单年度校验

4.2 多年度校验

5 结论

参考文献 文献选项 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子