科研资料|超全文本分析法学习资料包!

词云已经是超简单的文本大数据情感分析工具啦!想要对这些评论做进一步的科研挖掘,你应该学会更多文本分析方法!

文本分析是人文社科领域常用的研究方法,并逐渐被应用到许多跨学科的研究领域。但是它相对复杂,也有一定的使用门槛。本期就来和岛主一起来学习一下文本分析方法吧!

基本概念

在学习文本分析法之前,我们需要对“文本”(Text)有一个更深化的认识。狭义的“文本”是指通过可视化过程呈现的内容,可以来自文档、图像、声音等。从广义上讲,前苏联文化符号学家尤里·洛特曼认为,“文本”是“整体符号”,即具有信息传递、信息生成和信息记忆功能的具有文化意义的符号组合。

围绕“文本”展开的分析方法,我们称之为“文本分析法”。从具体定义上看,“文本分析”是一种基于定性研究的定量分析方法,是适用于对任何文本(或其他符号)进行测量的方法论,主要目的是对文本内容进行系统、客观的定量和定性分析,从而揭示其变化和特点。

主要类型

从研究取向来看,文本分析法的具体方法主要有以下三种:

1. 修辞分析法(“新批评”细读法)

“细读法”是一种特殊的批评方法。它建立在仔细分析文本语义的基础上,需要运用隐喻、歧义、反讽、悖论等概念、理论和方法,尽可能详细地分析和解释文本的语言和结构要素。修辞分析法的分析过程包括理解和分析词语的意义,感受和理解语境,把握修辞的特点。

从分析对象的层面来分析的话,修辞分析法所围绕的中心是文本的句法和语义单元、文本的意象和隐喻,以及对象征和象征系统的仔细阅读和分析。

2. “符号学”分析法

“符号学”是研究符号及其运作的学科。主要研究内容包括符号本身,符号构成所依据的符号系统,符号运作所依赖的文化。

因此,“符号学”的分析视角要求我们首先列出尽可能多的文本中的有效符号,然后分析符号的组合形式和组合方法,最后分析符号的文化内涵和思想逻辑。

3. “叙述学”分析法

“叙述学”分析又称“叙事学”分析,主要关注“叙事内容”和“叙事模式”这两个主题。叙述学所阐述的内容是全面而深入的,包括叙事行为、叙事层次、叙事时间、叙事姿态和叙事风格。

在此推荐两部关于“叙述学”分析法的具有代表性的学术著作:《叙事学》(胡亚敏);《中国现代经典短篇小说文本分析》(刘俐俐)。

4. 文本功能分析框架(纽马克)

英国实用翻译理论家纽马克将文本类型分为三种:表现性文本、信息性文本和呼唤性文本。同时,他指出文本类型的划分并不是唯一的,大多数文本具有两种或两种以上的功能,但其中一种功能占主导地位,并主张根据不同的文本类型采取不同的分析方法。

从编码方式来看,文本分析法包括以下3种具体形式:

1. 人工编码(属于质性分析的范畴)

首先是对文本内容意义的解读。在横向上,重点分析不同文本之间的差异、联系和相互作用; 纵向上关注文本产生的深层原因(社会、历史等因素)、思想内涵和发展影响。

其次是对形式意义的解读。主要侧重于对文本的呈现形式、所处位置(语境)、功能作用的分析解读。

2. 计算机辅助编码

指的是在人工分析过程中借助简单的电脑文书软件(如Word)进行图表制作及说明性文字阐述。

3. 计算机自动编码(属于定量分析的范畴)

包括对有效文本数据进行筛选、抽样统计以及编码归纳,并在此基础上对普遍的规律进行概括总结。常见的计算机文本分析软件有以下几种:

 ◆AnSWR 6.4

 ◆ATLAS.ti 5.2

 ◆EZ-Text

 ◆MAXqda 2

 ◆NUDIST 6

在文本分析法的范畴内,还有一些常见且实用的文本分析技术及软件:

1. 主题分析(Thematic analysis)

Nvivo,ATLAS. ti

2. 内容分析(Content analysis)

LIWC,DICTION

3. 基于词典的方法(Dictionary analysis)

4. 词袋法(文本向量化)(Bag-of--words)

(1)监督算法,如SVM、 Bayes和 Regression

(2)无监督算法,如LDA话题模型

5. 自然语言处理(Natural Language Processing)

具体分析步骤

1. 选择研究主题

2. 搜集及分析资料

3. 归类(按照对象、主题、情境或综合标准)

4. 确定具有代表性的样本目标

(1)整体抽样。制作抽样框,将框中的每项文本数据按照顺序编号,并统一采取随机抽样、系统抽样等的整体抽样方法。

(2)多阶段分组抽样。首先将文本数据分为不同组别,从中随机取出一组进行完整分析,或再从中随机抽样。

5. 找出高频关键词,确定分析单位或类别

分析单位包括物理单位、句法单位、语义单位、语用单位等等,涵义特征层面如社会特征、心理特征和身体特征;颜色形象层面如眼睛的颜色、头发的颜色、衣着的颜色。

6. 制定测量图表

7. 对文本单元进行具体的描述、说明和分析

(1)图表法。利用python, gephi等软件运行关系图。

(2)文字阐述法。在文案编辑软件中对文本单元进行说明与阐释。

★注意事项

1. 应按照分析单位的特征,尽量用量化的方式记录研究对象在各个层面的信息数据。

2. 采用事先设计好的、易于标准化统计分析的评判记录表。

3. 相同分析维度的评判必须有两个以上的评判员分别作出记录(数字形式)。

4. 根据类别(或关键词)出现频数进行记录、判断和分析时还要重视基数的大小。

基本特点

1. 非介入性

整个研究过程围绕的是现成的文本信息,不存在研究者干扰研究对象的情况。

2. 相对主观性

受研究者自身价值观念、政治立场、认知体验和知识结构等主观因素影响较大。

3. 超时空性

文本分析的研究范围广,可以通过线上或线下的资料收集而跨时空进行研究。与此同时,研究的时长也是可持续的,对研究对象及研究结果无干扰。

4. 综合性

文本分析既包括主观因素较多的定性研究,也包括科学性强的、需要充足客观事实支撑的定量研究。

5. 低成本性

与其他研究方法相比,文本分析法对时间、精力和经费等资源的消耗相对较少,对研究条件的要求较低。

6. 可证实性

需要有学术经验或客观科学的证据的支撑,并应经过系统化的调查取样。

7. 归纳性

文本分析法不是研究者自己事先对假设的演绎与阐释,而是对现有文本材料的归纳分析,强调多维度地深入文本材料,自下而上地浓缩、建构出一套理论框架。

意义价值

1. 从文本中搜寻多元化意义

一方面,我们可以探讨单一文本存在的因素和意义; 另一方面,我们也可以探讨互补效应和多文本效应。同时,研究者通过观察和研究给出的文本意义也应该被考虑在内。

2. 使文本内容与现实社会得以更加紧密的联系

至于文本本身,我们可以通过分析来探究文本的社会历史因素。就文本与社会的关系而言,我们可以将文本浓缩的理论运用到社会实践中去,更好地实现其现实价值。

3. 更好地描述文本内容的结构与功能

文本结构不仅包括句法单位和语义单位之间的表面联系和结构,还包括各级单位之间相互作用形成的整体语义和语用结构(反映作者的思想、创作意图和个人态度)。通过分析,我们可以发现这些结构在不同层次上的不同功能,并将其应用到其他实际问题和研究课题中。

4. 透彻了解文本产生的前因后果

我们既要了解影响文本产生的相关变量和关键词,又要借助一些具有强客观性和权威性的文本,将其作为评判参考的标准。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值