搜档网
当前位置:搜档网 › 结合点评情感分析的推荐算法研究

结合点评情感分析的推荐算法研究

结合点评情感分析的推荐算法研究
结合点评情感分析的推荐算法研究

课题研究的主要方法

四、课题研究的主要方法 1.文献研究。通过阅读、翻阅与本文相关的著作、论文、期刊等理论成果,来学习前人的分析研究思路和写作手法,吸取宝贵经验、开拓本文的写作分析思路,丰富理论知识,在原有的基础上进行创新。 2.调查问卷法。我根据J公司员工是否愿意宣传自己的公司、员工是否自愿留在公司为公司效力和员工等方面设计问卷,收集分析相关数据,同时运用所学理论,做到理论与数据相结合,科学分析。 3.访谈法。我在J公司三个部门中各选取了1~2名员工,进行半结构化访谈,并根据他们的回答进行归纳整理。 四、课题研究的主要方法 1.文献研究。通过收集文献等相关资料,丰富更多的理论知识,吸取宝贵经验,开拓研究分析思路。 2.调查分析。通过收集h公司管理人员针对工作压力的调查问卷,运用SPSS分析法分析数据,同时运用所学理论相结合,做出科学的研究结果。 3.总结归纳。对研究结果进行系统的归纳总结,得出最终的结论,提出相对的建议。 四、课题研究的主要方法 本文通过人力资源管理和招聘管理的相关理论进行研究,主要包括人力资源的目标、任务、胜任力模型理论、结构化面试理论和人才测评,用以上理论作为基础,结合哲博百众(天津)科技有限公司招聘管理和人才甄选的现状,对其招聘管理中存在的问题进行分析,进一步提出优化的建议。 本文主要采用的研究方法有问卷调查法、观察法和文献研究法。 文献阅读:阅读期刊、著作、论文等文献,研究相关知识理论,学习理论基础,并思考论文的内容核心和写作方式,寻找书籍间内容的相互联系,总结出共通点,加入自己的思考,打开思路。结合实际:收集与研究相关的实际案例,跟阅读总结的文献理论相结合,同时积极做出个人思考,根据实例分析理论。总结归纳:得出最终的结论,从不同方面进行优化和总结,加以个人的观点和意见。 四、课题研究的主要方法 1.文献研究。通过大量阅读、仔细翻阅与本文相关的著作、论文、期刊等理论成果,来学习前人的分析研究思路和写作手法。吸取宝贵经验、开拓本文的写作分析思路,丰富理论知识。2.问卷调查分析。通过问卷调查收集相关理论所需相关数据,同时运用所学理论,做到理论与数据相结合,科学支撑。 3.总结归纳。对研究结果进行系统的归纳总结,得出最终的结论,提出个人看法与建议。 四、课题研究的主要方法 1.文献研究。通过大量阅读、仔细翻阅与本文相关的著作、论文、期刊等理论成果,来学习前人的分析研究思路和写作手法。吸取宝贵经验、开拓本文的写作分析思路,丰富理论知识。2.问卷调查。进行问卷的设计和发放,以及后期的数据处理,从得到的数据中得出结论分析问题。 3.总结分析。除了分析已知数据外还要对其提出建议和参考,为其发展提供信息参考。

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.sodocs.net/doc/d710890081.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.sodocs.net/doc/d710890081.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

开题报告课题研究思路及步骤

开题报告课题研究思路及步骤 我校党总支《如何发挥党组织和党员在教学工作中的作用》课题,是湛江师范学院校级党建研究课题,经过湛师党委评审通过的二等项目。根据上级组织的指示,经课题小组研究决定,今天开题,我代表课题研究组,将本课题的有关情况向各位领导、专家和老师们汇报如下: 一、本课题选题的依据及意义 XX年6月25日,中共中央总书记、国家主席、中央军委主席胡锦涛在中央党校省部级干部进修班发表重要讲话。胡锦涛指出,解放思想,是党的思想路线的本质要求,是我们应对前进道路上各种新情况新问题、不断开创事业新局面的一大法宝,必须坚定不移地加以坚持。改革开放,是解放和发展社会生产力、不断创新充满活力的体制机制的必然要求,是发展中国特色社会主义的强大动力,必须坚定不移地加以推进。科学发展,社会和谐,是发展中国特色社会主义的基本要求,是实现经济社会又好又快发展的内在需要,必须坚定不移地加以落实。全面建设小康社会,是我们党和国家到2020年的奋斗目标,是全国各族人民根本利益所在,必须坚定不移地为之奋斗。做到这四个坚定不移,对保持党和国家事业顺利发展的大局至关重要。 胡锦涛总书记在党的十七大报告中指出:我们党已经成立八十六年,在全国执政五十八年,拥有七千多万党员,党的自身建设任务比过去任何时候都更为繁重。党领导的改革开放既给党注入巨大活力,

也使党面临许多前所未有的新课题新考验。世情、国情、党情的发展变化,决定了以改革创新精神加强党的建设既十分重要又十分紧迫。因此,我们必须深刻领会以改革创新精神全面推进党的建设新的伟大工程的重大意义,把党的建设新的伟大工程抓紧、抓实、抓好。 省委十届二次全会的召开和省委发出“开展解放思想学习讨论活动”的号召,全省各级党组织和广大干部群众争相通过各种途径,拥护、支持和参与到这场大讨论中来,一场新的思想解放浪潮正在广东的大地上掀起。 因此,在学校的教育教学中发挥党组织和党员的作用成为中学开展解放思想、落实科学发展观的重要研究方向。 从本校来看,学校的发展已经到了关键时期,学校创办示范性高中已经进入的关键阶段。 在学校中党组织及党员的作用主要依靠基层党员的行动实现,党组织在学校中处于政治核心地位,党组织工作的重点转为对行政事务的监督保证,监督学校对党和国家的路线方针政策以及教育政策法规的贯彻落实。而党员在学校中则主要认真履行党员义务,密切联系群众,在群众中直到表率作用。在思想大解放的今天,确实做到思想大解放,带头实施学校的“双主协调,共同发展”教学理念,解决学生厌学及层次差异大导致教学质量下滑的问题。

基于商品评论文本的情感分析研究

龙源期刊网 https://www.sodocs.net/doc/d710890081.html, 基于商品评论文本的情感分析研究 作者:陶莉娜李超萍李健高荣 来源:《现代信息科技》2018年第04期 摘要:随着互联网络科技的迅速发展,越来越多的用户开始网上购物,网络中的商品评 论数据也随之增加。如何在大量的评论数据中提取有用的信息,使数据价值最大化是值得重视的问题。本文针对京东网站商品的评论数据进行了情感分析,从中提取有用的信息,帮助商家了解消费者的需求,发现商品的不足之处,并制定改进方案,以提高商品的竞争力。 关键词:数据挖掘;商品评论;情感分析 中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2018)04-0019-03 Abstract:With the rapid development of internet technology,more and more users have begun to shop online,and the product review data on the internet has also increased. However,how to extract useful information from a large amount of review data and maximize the value of data is a problem worthy of attention. This article analyzes the sentiment data of https://www.sodocs.net/doc/d710890081.html, website products,provides useful information to help businesses understand the needs of consumers,discovers the inadequacies of products,and formulates improvement programs to improve the competitiveness of products. Keywords:data mining;commodity reviews;sentiment analysis 1 主要技术实现 1.1 网络爬虫 网络的迅速发展使互联网成为大量信息的载体,有效地提取并利用这些信息对我们来说是一个很大的挑战。为了快速的提取有用信息,我们采取网络爬虫技术,它的好处是获取成本小,可以将网页上的内容按照一定的格式规范进行有针对性地获取。 1.2 基于文本情感分析 文本的情感分析是指利用计算机语言、自然语言处理和文本挖掘来辨别文本主观情感信息的一种手段。一般来说,情感分析是对说话者当时的言语评论或建议的一个情感状况辨析。其研究内容包括非结构化文本的分词、情感倾向性分类和情感强度等,它涉及到自然语言处理、文本分词、机器学习等多个研究领域。本文的研究重点是对商品评论文本所表达的正向或负向情感进行分类[1]。

文本情感分析研究现状

文本情感分析研究现状 机器之心专栏 作者:李明磊 作为NLP领域重要的研究方向之一,情感分析在实际业务场景中 存在巨大的应用价值。在此文中,华为云NLP算法专家李明磊为 我们介绍了情感分析的概念以及华为云在情感分析方面的实践和 进展。 基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见和建议,比 如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价,如果负面评价忽然增多,就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。 是什么:文本情感分析旨在分析出文本中针对某个对象的评价的正负面,比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素,(entity/实体, aspect/属性,opinio n/观点,holder/观点持有者,time/时间),其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素

、 (entity 体, 输入文木 holder/?点持有者,time/ 时 |i 图i情感分析五要素 举例如下图: 我觉得华为手机非常牛逼。(华为手机* 图2情感分析五要素例子 上例中左侧为非结构化的评论文本,右侧为情感分析模型分析出的五个要素中的四个(不包括时间)。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可 以是实体词和实体类别,实体词可以是「餐馆」、「饭店」、「路边摊」,而实 体类别是「饭店」;属性可以是属性词和属性类别,如属性词可以是「水煮牛肉」、 「三文鱼」等,都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类,是一对多的关系。词和类别分别对应了不同的

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.sodocs.net/doc/d710890081.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.sodocs.net/doc/d710890081.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.sodocs.net/doc/d710890081.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

课题研究的要求方法和步骤

课题研究的要求、方法和步骤 (一)选题选题是课题研究的起始,也就是确定自己要研究什么课 题。 1.课题来自哪里? (1)学校或学校以上相关部门提供的参考课题或供申报的课题 (2)教师自己从事教育教学工作中感到困惑或感兴趣的问题上升为课题 2.选题的一般原则科学性:要有理论基础和事实依据,必须符合科学原理;预期结果要合理;研究方法要正确严谨,要有可行性和创新性。 3.选题的一般过程 (1)明确方向——发现问题 (2)浓缩范围——经验分析 (3)提示焦点——形成课题 4.选题的注意事项 (1)选题宜小不宜大 (2)选题应结合学校的实际,来源于教育教学的现实问题。选题要有新意。课题的表述应简明、具体。 (3)选题要考虑研究者的优势,与自身工作相结合,与研究者的能力相适应。 (二)申报课题 申报课题,也就是设计研究方案,是如何进行课题研究的具体设 想,是开始进行课题研究的工作框架,是如何进行研究的基本思路。是保证研究顺利进行的必要措施;使研究具体化的中心环节;是研究成果质量的重要保证;有利于检查和自我检查;有利于协作研究。一般上级部门开展的课题研究都附有课题申报表。 1.课题申报表(课题研究方案)组成:(1)课题的表述与界定:课题的名称或题目必须明确表述所要研究的问题,要体现研究对象、研究问题、研究方法。如“强化预习指导提高学生自学能力”。 (2)研究的背景、目的、意义:研究背景:即根据什么、受什么启发而研究。 研究目的意义:即为什么要研究、研究的价值是什么、解决什么问题,包括理论意义、实践意义;外在目标(目的)、内在目标目的——学生发展)。 研究综述:本课题研究的历史与现状。研究的特色或突破点:问题 新、方法新、角度新、效果新。 (3)研究范围:对研究对象的总体范围的界定;对研究对象的 模糊概念进行界定;对关键概念的界定。 (4)研究内容:很重要的部分,如果提不出具体的研究内容,就无法

本课题的研究思路、研究方法、技术思路和实施步骤

本课题的研究思路、研究方法、技术思路和实施步骤 思想政治理论课的学科特点适合实施研究性教学。高职院校思想政治理论课的主要任务是对大学生进行系统的马克思理论教育,最终使大学生成为品学兼优适合社会需求的技术人才。思想政治教育课最终目的是要求学生知行统一,知识的识记只是其手段。而研究型教学主张教学以学生为主体,重实践、探究、强调学生在做中学,使学生在研究过程中体验并把所学知识内化。这与思想政治教育课的目的是一致的。 研究方法采用定量研究与定性研究相结合的方法。定量研究主要用观察、实验、调查、统计等方法研究教育现象,注重研究的严密性、客观性, 以求得到客观事实。定性研究采用参与观察和深度访谈而获得第一手资料,具体的方法主要有参与观察、行动研究、历史研究法等。两种研究方法各有所长。本课题采用多种科学研究方法,多角度、全方位地进行研究,以期取得理想的研究成果。项目预期的成果形式为调查报告、论文。 拟用三年时间实施本课题的研究,实施范围为北海职业学院的在校生,收益学生估计为三千到四千人。 第一阶段为动员和调查阶段(2006年9月至2007年8) 推动研究性教学,必须以转变教育观念为先导,以具有针对性的现代教育理论为指导思想,组织思想政治理论课教师和相关管理人员深入开展研究性教学教育思想的学习与讨论。 课题组成员采用集中、分散、问卷、开座谈会等方式调查本院学生。调查内容为学生对思想政治理论课教学方法、课程讲授、课堂讨论、作业训练、实践训练、考核方式等六方面的意见和看法;学生人生观、价值观、法律意识等基本情况。收集第一手材料为研究作准备,此阶段拟用九个月时间。 第二阶段为教学环境现代化建设阶段、理论研究阶段(2007年9月至2008年8) 推动研究性教学,必须积极营造教学资源丰富的环境,特别是有信息技术和先进仪器、设备支持下的教学环境,具体包括立体化精品教材、多媒体教室、电子图书馆、全球知识共享的校园网络以及有利于推动研究性教学的组织、管理制度与运行机制等,为推动研究性教学提供充分的物质保障和制度保障。 课题组成员根据第一手资料的原始数据进行相关领域的理论研究,提出改革策略。此阶段拟用九个月时间。

传统方法和深度学习的情感分析

传统方法和深度学习的情感分析 1.问题 Kaggle竞赛Bag of Words Meets Bags of Popcorn是电影评论(review)的情感分析,可以视作为短文本的二分类问题(正向、负向)。标注数据集长这样: 评价指标是AUC。因此,在测试数据集上应该给出概率而不是类别;即为predict_proba 而不是predict: # random frorest result = forest.predict_proba(test_data_features)[:, 1] # not `predict` result = forest.predict(test_data_features) 采用BoW特征、RF (random forest)分类器,预测类别的AUC为0.84436,预测概率的AUC 则为0.92154。 2.分析 传统方法 传统方法一般会使用到两种特征:BoW (bag of words),n-gram。BoW忽略了词序,只是单纯对词计数;而n-gram则是考虑到了词序,比如bigram词对"dog run"、"run dog"是两个不同的特征。BoW可以用CountVectorizer向量化: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(analyzer="word", tokenizer=None, preprocessor=None, stop_words=None, max_features=5000) train_data_features = vectorizer.fit_transform(clean_train_reviews) 在一个句子中,不同的词重要性是不同的;需要用TFIDF来给词加权重。n-gram特征则可以用TfidfVectorizer向量化: from sklearn.feature_extraction.text import TfidfVectorizer vectorizer = TfidfVectorizer(max_features=40000, ngram_range=(1, 3), sublinear_tf=True) train_x = vectorizer.fit_transform(clean_train_reviews) 使用unigram、bigram、trigram特征+ RF分类器,AUC为0.93058;如果改成LR分类器,则AUC为0.96330。

商品评论情感分析系统的设计与实现

商品评论情感分析系统的设计与实现 近几年随着电子商务的不断发展成熟,网上购物越来越普及。消 费者在浏览电子商务网站的同时,也可以将对各种商品的评论发表到 网站上。如何充分挖掘、高效利用这些商品评论信息显得格外重要, 情感分析技术由此产生。目前主流的情感分析研究方法有基于情感知识的方法和基于机器学习的方法。基于情感知识的情感分析方法关键是针对词语的情感倾向进行研究,具有一定的局限性。基于机器学习 的情感分析方法目前主要利用传统的机器学习方法。随着深度学习的兴起,越来越多的学者将Deep Learning运用到情感分析领域。因此,本文探究运用深度学习方法进行情感分析研究,提高评论文本情感分 类的准确率。本文目标是构建一个高效准确的商品评论情感分析系统。实验所用的商品评论数据集,一部分利用Scrapy框架从京东网站上 爬取,一部分来自网上公开的数据集。对中文数据进行分词、词性筛选、去停用词,通过合理改进Word2Vec模型实现将预处理过的评论文本转换成词向量矩阵,输入到后续的情感分析分类器中。本文重点是 情感分析分类器的设计。卷积神经网络TextCNN能够降低数据规模和复杂程度,深层次捕捉文本数据的n元语法特征。门控循环单元GRU 模型简单、训练时间短,能够有效解决长短时间序列的变化问题,获得全局文本特征。本文提出新模型TextCNN-GRU作为系统的分类器。该模型先进入嵌入层完成词向量化训练,接着CNN部分提取文本局部最 优特征,GRU部分获得全局的句子表达,最后输出情感分类。为了提升模型的效果,本文在参数选择上设置很多对比实验,有词向量维度、

GRU层层数、滑动窗口大小等。通过TextCNN-GRU混合模型与单一模型TextCNN、GRU以及传统机器学习模型SVM、Naive Bayes、KNN比较,表明TextCNN-GRU在情感分析上比其他5种模型有更高的准确率,很好说明TextCNN-GRU能够综合TextCNN和GRU各自优势,取得更好的分类效果。

文本情感分析综述

随着企业信息化与互联网的发展,信息以爆炸性速度飞速增长,其中包括了大量的非结构化与半结构化数据。非结构化与半结构化数据,主要是文本型数据,阐述5w问题,即who,when,where,what,Why。如何充分利用非结构化数据与半结构化数据,分析其包含的潜在信息,拥有支持决策,成为了众多企业与研究者关注的重点。尤其,针对互联网(如博客和论坛)上大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集和处理,因此迫切需要计算机帮助用户快速获取和整理这些相关评价信息。因此,如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。情感分析(sentiment analysis)技术也就应运而生(本文中提及的情感分析,都是指文本情感分析)。 文本情感分析(sentiment analysis),又称为意见挖掘,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。其中,主观情感可以是他们的判断或者评价,他们的情绪状态,或者有意传递的情感信息。因此,情感分析的一个主要任务就是情感倾向性的判断,Pang等人在文献1中将情感倾向分为正面、负面和中性,即褒义、贬义和客观评价。研究初期,大量研究者都致力于针对词语和句子的倾向性判断研究,但随着互联网上大量主观性文本的出现,研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句研究以及情感篇章的研究。文本情感分析主要可以归纳为3项层层递进的研究任务,即情感信息的抽取、情感信息的分类以及情感信息的检索与归纳[2]。情感信息抽取就是将无结构的情感文本转化为计算机容易识别和处理的结构化文本。情感信息分类则是利用情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒、贬、客观或者其他更细致的情感类别。情感信息检索和归纳可以看作是与用户直接交互的接口,强调检索和归纳的两项应用。 情感分析是一个新兴的研究课题,具有很大的研究价值和应用价值,正受到国内外众多研究者的青睐。目前实现情感分析的技术主要包括基于机器学习法和基于语义方法两类。本文主要针对这两大方法的研究进展进行比较分析,接着介绍国内外现有的资源建设情况,最后介绍情感分析的几个重要应用和展望它的发展趋势。 1 基于统计机器学习法 随着大规模语料库的建设和各种语言知识库的出现,基于语料库的统计机器学习方法进入自然语言处理的视野。多种机器学习方法应用到自然语言处理中并取得了良好的效果,促进了自然语言处理技术的发展。机器学习的本质是基于数据的学习(Learning from Data)。利用机器学习算法对统计语言模型进行训练,最后用训练好的分类器对新文本情感进行识别。2002年,Pang 等人就在文献[1]中提出用机器学习的方法进行情感倾向的挖掘工作,他们以互联网上的电影评论文本作为语料,采用了不同的特征选择方法,应用朴素贝叶斯(Naive Bayes)、最大熵(Maximum Entropy)、向量机(SVM)对电影评论分别进行分类,实验表明SVM 的分类性能最好,准确率达到87.5%。该研究引起学术界的关注,之后用于倾向性判断的机器学习算法的改进被陆续提出,基本的算法有:支持向量机(SVM)、朴素贝叶斯(NB)、K-近邻(KNN)、简单线性分类器(SLC)和最大熵(ME)等。他们在另一项工作中,将文本极性分类问题转换成求取句子连接图的最小分割问题,实现了一个基于minimum-cut的分类器。[7]。Whitelaw等人[11]关注研究带形容词的词组及其修饰语(如“extremely boring”或“not really verygood”),他们提取带形容词的词组作为特征,基于这些特征,用向量空间模型表示文

情感分析:基于词典的分析方法

情感分析:基于词典的分析方法 好主意值得扩散,激发我们创造的动力所有的数据挖掘方法和思路基本上很久之前都已经形成了,只是现代计算机的普及让这些创新的想法拥有了看似可行的技术支撑,给了他们起死回生的机会,从历史的故纸堆里摇身一变,成了高大上的现代挖掘感念。情感分析的历史也可以追溯到1950年,没错你真的没有看错,那时的情感分析用于研究论文评述的态度。如今,广阔的社交媒体为情感分析提供了用武之地,文本数据源源不断地从微博、博客、微信、社交平台、新闻评论、百度知道等等交互平台抓取下来,而情感分析被广泛的应用于挖掘互联网上的主观信息。从基础上讲,情感分析能够帮助企业掌握文本所表达的情感倾向:正向、负向、还是中性,给予企业分析特定人群特别是消费者对某一固定话题、产品、方法持有的态度。企业可以使用挖掘出来的情感信息寻找新的营销机会,改善营销方式,针对人群采取精准营销等等,美国总统奥观海团队就使用情感分析方法监控大众对其政策的态度和反应。1.情感分析及其应用:这里是老生常谈在企业内,所有的数据挖掘工作归根结底要解决业务问题,这一点认识的越深刻越能脚踏实地的解决问题,而不是制造虚假问题然后解决或者是答非所问,结果不能对问题实现有效的干预。1.1.情感分析的用途情感分析也一样要

寻找自己的业务用途。当然情感分析有很多用途,网络社交越来越火,名博或意见领袖越来越多,可以对商品和服务打分、评价的站点更是如雨后春笋,用户的评价和建议可以全网传播,这些数据毫无疑问是精准营销的动力来源。企业也可以根据情感分析建立自己的数字形象,识别新的市场机会,做好市场细分,进而推动产品成功上市,但抓住这些评论的价值部分也是企业的巨大挑战。上述正是情感分析的应用背景,但其主要用途包括:监控社交媒体社交媒体监控可以非常有效的管理品牌的影响力或识别对品牌有影响力的 意见领袖,比如你想知道自己品牌负面评论的来源,你可以监控50个行业意见领袖的微博、博客,分析他们微博或文章下面的用户评论,从而确定谁会引导负向评论,之后就可以和这些意见领袖合作,从而转化他们的负面影响。公共关系情感分析同时能帮助企业改善或重塑公共关系策略,例如情感分析可以探索销售热点和行业的流行趋势,同样就像上一步表述的一样,通过情感分析找到社会上对品牌有好感的意见领袖,建立并维持合作的关系,这种方式显然是一种行之有效的公共关系管理策略。市场营销情感分析正在逐步替代传统市场研究的内容,比如情感需求调研、使用习惯及态度研究等等,例如,三星想知道客户对他们的新机型的评价,在社交媒体和数据挖掘兴起之前他们只能通过市场调研的 方式解决。而数据分析则可以抓取消费者在各大消费网站如

基于在线评论情感分析的快递服务质量评价

第43卷第3期 2017年3月 北京工业大学学报 JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGY Vol.43 No.3 Mar. 2017 基于在线评论情感分析的快递服务质量评价 王洪伟\宋媛\杜战其u,郑丽娟3,华瑾4,张艺伟1 (1.同济大学经济与管理学院,上海200092 ; 2.上海海洋大学工程学院,上海201306; 3.聊城大学商学院,山东聊城252000; 4.上海通用汽车销售有限公司,上海201206) 摘要:由于问卷调查分析法受访者少,问卷质量也低,为此,以海量的在线消费者评论为数据,采用情感分析技 术,提出一种快递服务质量评价方法.选取大众点评网上S F和ST两家快递企业的评论语料为例进行实验分析,首 先,应用服务质量测评模型SERVQUAL量表和物流服务质量评价的相关理论,结合文本分析方法,建立一套基于 在线评论情感分析的快递服务质量评价指标体系;其次,对评论语料进行抓取、分句、标识等预处理,比较不同特征 选择算法在不同分类算法下的查全率与查准率,最终以信息增益和支持向量机作为最佳组合,抽取614个特征项 用于有用性文本的识别;然后,基于HowNet的语义相似度极性计算方法和副词量级划分方法对在线评论进行情感 极性和强度分析;最后,应用TF-IDF法,结合评论文本确定评价指标的权重,对快递企业服务质量计算综合评价得 分.与大众点评网的星级评分进行对比,实验结果表明:该方法与现有方法相比,能够直观地比较S F和ST两家快 递企业在快递服务质量各项评价指标上的差异,并且两者的得分趋势相吻合. 关键词:在线评论;情感分析;快递服务;质量评价 中图分类号:U461; TP308 文献标志码:A 文章编号:0254 -0037(2017)03 -0402 -11 doi:10.11936/bjutxb2016010063 Evaluation of Service Quality for Express Industry Through Sentiment Analysis of Online Reviews WANG Hongwei1,SONG Y uan1,DU Zhanqi1,2,ZHENG Lijuan3,HUA Jin4,ZHANG Yiwei1 (1. School of Economics and Management,Tongji University,Shanghai 200092,China; 2. College of Engineering,Shanghai Ocean University,Shanghai 201306,China; 3. School of Business,University of Liaocheng,Liaocheng 252000,Shandong,China; 4. Saic General Motors Sales C o.,L td.,Shanghai 201206,China) A b stra c t :The evaluation m ethod based on questionnaire survey has lim ited respondents with low quality, therefore,an evaluation method of express service quality was put forward in this paper through sentim ent analysis of massive online reviews by selecting online reviews of express com panies SF and ST from dianping. com for experim ent analysis. F irst,the SERVQUAL model of service quality evaluation and the related theory of quality evaluation of logistics service was applied com bined with text analysis,to establish an index system of quality evaluation of express service through sentim ent analysis. Then online reviews such as capturing,phrasing and m arking were preprocessed,and the recall ratio and precision ratio under different feature selection algorithm and different classification algorithm were com pared. 614 features were extracted and the useful text were identified by choose IG and SVM as the best combination. 收稿日期:2016-01-27 基金项目:国家自然科学基金资助项目(71371144,71601082);上海市哲学社会科学规划课题资助项目(2013BGL004) 作者简介:王洪伟(1973—),男,教授,博士生导师,主要从事商务智能与情感计算方面的研究,E-mail:hwwang@tongji. edu. cn

相关主题