该项目的目标是开发一个启发式模块,通过对文本中的叙事现象提出建议,扩展基于网络的文本分析和注释环境CATMA [4]的功能。重点是解决叙述与叙述之间的时间关系的经典叙述学类别,例如类别顺序(按什么顺序?)、频率(多久?)和持续时间(多长时间?)。[5]
该模块基于三种方法开发:(1)起点是时间现象的注释,由经过训练的注释者进行。[6] 然后将该标记与 (2) 基于规则的方法[7]和 (3) 机器学习方法相结合,以预测文学文本中的现象。[8]
由于文学研究(尤其是解释学)方法与计算机科学数据挖掘方法的相互作用,非确定性文本方法与可判定或确定性方法是相互对立的,不能轻易转移到另一种方法。因此,叙事学分析的可重复性对于文学和计算机科学方法的兼容性以及启发式模块的成功至关重要。另一方面,文学文本分析领域中分析结果的可重复性是一个有问题的概念,因为它不容易与解释学程序的原则兼容。
本文的其余部分将更详细地介绍这一矛盾中出现的问题领域。为此,我们将首先在第 2 部分讨论解释学在叙事学中的一般作用及其对于为 heureCLÉA 项目选择合适的注释方法的重要性。然后,我们在第 3 节中描述了(解释学)叙述学和(非解释学)计算语言学之间合作中发生的相互作用。重点关注所分析或使用的数据的范围和多样性问题,这些问题可以用两对对立的概念来识别:示范性 与稀疏性、解释的多样性与噪声 。对于这两种情况,我们描述了纪律后果以及制定的解决方案。在本节的最后一部分,我们特别关注对叙事学的影响,在项目持续时间过半之后,这些影响现在已经变得相当重要。最后,我们在第 4 部分总结了跨学科方法的方法论优势。
2. 诠释学的作用
2.1 诠释学与叙事学
诠释学,即“解释言语和文本的方法论” [9],自古以来就被用来解释宗教文本。如今,在施莱尔马赫和狄尔泰等人对其进行重新定义之后,[10]诠释学发挥着 重要作用,尤其是在文学研究中。在那里,“解释性文本理解”通常意味着一种非常具体的操作:找出“人们认为的作品或其组成部分的意义(或意义或内容)”。[11]按照流行的观点,这样的文本理解不可避免地具有一种非常特殊的结构,这种结构的特点是文本解释者的预设、对文本某些部分的假设以及对文本整体的假设反复地相互影响,从而导致这些个别假设被修改或确认。[12]
heureCLÉA 项目较少关注解释的方法论,而是关注叙述学文本分析框架内的解释学文本解释本身:叙述学是一门文学学科,为叙述文本的分析和解释提供了一系列理论概念和模型。这些叙述学范畴用于命名和定位文本属性,这些属性(a)被认为是叙述文本的典型特征,(b)在不同方面可作为文本解释的基础。[13]许多类别捕捉了主要可在文本表面访问的结构现象。
由于主要关注文本属性,叙述学被认为是一种独立于上下文的叙述文本分析方法,不需要参考文本外的上下文。[14]人们通常认为,叙述学提供了一种独立于解释的方法。[15] 但是,语境独立性并不等同于解释独立性——至少在广义的“解释”中不是:大多数以叙述学方式描述的现象都可以在文本表面上获得,但对其应用所必需的文本语言意义的重构也可以包括依赖于解释的方面,例如消歧或蕴涵的发展,因此是广义上的解释性的,也就是说:解释者有时可以合理地对文本中表达的内容得出不同的结论,因为意义并不总是必然源于文本材料。例如,语言理解——以及非演绎推理的应用——对于分析叙述的时间顺序是必要的;尽管一开始人们可能会怀疑这只能根据时态等明确的文本标记来确定。[16]如果一种解释是基于语言理解的,那么它不一定是唯一正确的结论,因为它基于对可能相互矛盾的方面的解释或权衡,而不能仅仅从文本表面的现象中得出。即使有这样的结论,当意义假设在参考所讨论的文本段落、更广泛的文本内背景以及可能的主体间共享的预设(比如一般的世界知识)中交替产生、修改和确认时,上面概述的解释性文本理解程序的变体可以发挥作用。
通过使用叙述学范畴分析文本,我们在纯形式的文本描述和解释学之间徘徊:通常可以假设叙述学范畴用于对文本进行分类或描述[17],因此并不主要关注解释学程序。同时,叙述学分析也是一种解释学,因而是一种阐释的过程。解释在三个方面与叙述学相关:
(1)叙事学文本描述可以作为对作品进行全面解读的基础、试金石或启发法。[18](2)叙述分析通常超越纯粹形式或定量的文本描述,因为正如上文所解释的,它涉及语言理解。这通常(但并非总是)会导致主体间有效的结果。[19](3)有些情况下,叙述学分类必须先进行文本解释,因为只有在全面的文本解释的基础上才能理解所要确定的现象。[20]
虽然第一点只有在对作品进行全面解释时才会发挥作用,但其他两个方面在任何叙事文本分析中都具有潜在相关性。因此,尽管叙述学文本分析采用了比较正式的方法,但它显然是一种解释学程序。因此,heureCLÉA 项目中的工作受到人文学科和计算机科学之间典型对比、或非确定性和确定性工作方法的强烈影响。
2.2 诠释标记
甚至在叙述学和计算语言学开始实际合作之前,就必须澄清一个重要问题:如何将文本分析的解释学方法转化为适当的机器可读格式?目的是找到一种支持非确定性文本分析的注释方法,就像在 heureCLÉA 项目中进行的那样。并非所有用于注释文本的标记类型都适合此目的。
基本上,可以区分标记和注释对象之间的联系以及标记的功能。划分为嵌入式或内联标记(直接写入带注释的文本)和独立标记(单独存储并通过存储的引用指向相应的文本部分),这不仅具有技术重要性。标记和注释对象之间的联系选择也涉及到文本分析的不同方法:虽然与文本紧密相连的内联注释 – 至少是隐含的 – 与文本分析的规范方法相关,因此具有一定的客观性和永恒的本体论有效性,但是,独立注释更加灵活,允许对文本进行多样化和复杂的归因。这使得它更接近于上面讨论过的、自狄尔泰和伽达默尔以来主宰人文学科的解释学文本分析的思想。为了能够有意义地开展文学研究,人们特别需要一种标记,通过允许同时对同一文本段落进行不同的标记,从而实现对同一文本段落的不同解释。这里的“不同”并非单单意味着“不同”,还必然包括了注释相矛盾的可能性。正如我们将在第 3.3 节中看到的那样,对一个文本段落进行两种分析可能会产生互相排斥的结果,因此该段落会得到相互矛盾的注释。即使这种直接矛盾大多是由与之相关的不同预设引起的,因此有可能澄清这些差异,但在许多情况下,这种澄清并不会导致对文本段落的一致评估,而只是导致对评估中的分歧达成某种一致。因此,对于文学文本分析,必须能够对同一字符串进行互斥的注释。[21]
注释方法之间的第二个区别涉及所提供的标记的功能。从某种意义上说,这里的问题是标记的目的是为了给谁使用:是否应该使用所谓的程序标记来指示机器执行某种操作(例如,以某种方式显示文本 - 如标题)还是描述性标记应该告知人类收件人某个文本部分的分类(在语法、词典或甚至某个语用上下文中)?大约二十年前,Coombs 等人。已经确定只有描述性标记才能满足科学文本分析的智力目标。[22] Piez 进一步发展了这种方法,并创造了“解释性标记”这个术语:
»我所说的›解释性›标记是指有意解释的标记。它不仅限于描述可以正式定义和客观验证的文本的方面或特征。相反,它致力于以开放式的方式记录学者或分析师的观察和猜测。作为标记,它能够进行自动化和半自动化处理,从而可以大规模处理并转换成不同的表示形式。通过某种可能属于其自身特有的标记机制,文本可以进行进一步的处理,如文本分析、可视化或再现。可以比较采用一致的解释方法的文本,或对同一文本应用不同的解释方法的文本。解释性标记主要不是致力于支持数据交换和重用(尽管这些好处不会被排除),而是专注于它所表达的解释的呈现和阐释。“ [23]
对于 heureCLÉA 中的工作,使用了这种以描述性对立标记形式出现的“解释性标记” ,该标记在 CATMA 中实现。[24] 这不仅允许对同一文本段落进行多重、重叠甚至矛盾的注释,而且还允许灵活设计所使用的分析类别。这些可以在注释运行期间根据需要进行修改和调整,CATMA 还允许通过实施的搜索功能对注释进行半自动更改。 CATMA 的这种灵活性极大地支持了解释文本分析实践所需的注释的递归修订,从而支持了整个文学文本分析过程。因此,CATMA 提供的注释格式也用于 heureCLÉA 项目。
3. 文学与计算机科学文本分析之间的相互作用
当文学研究和计算机科学这两个截然不同的学科在诸如 heureCLÉA 这样的项目中进行合作时,学科之间的一些理论和实践差异不可避免地会成为焦点,必须在项目过程中对这些差异进行分析并建设性地解决。有时,所涉及的两个学科都会使用某些技术术语,但这些术语在每种情况下的定义不同 - 例如“事件”和“叙述”。这些纯粹术语上的差异可以通过揭示特定主题的定义轻松地得到补救:虽然在自然语言处理(NLP)中,“事件”的定义通常尽可能保持一般性,即发生或发生的事情并且具有时间维度,但叙述学中事件的概念要详细得多。[25]事件被定义为叙述的状态变化(此定义也称为“事件 I”)或具有事实性和结果性等附加属性的叙述的状态变化,即叙述的虚构世界中状态变化的实际发生和完成(也称为“事件 II”)。[26]
然而,第二个不同之处需要更复杂的措施来实现合作。问题在于,这两个学科传统上对所进行或使用的分析的质量的评估方式不同:在 NLP 中被认为不合适的数据基础从文学研究的角度来看可能是方法论上合理的分析。
下面我们想介绍一下这个问题的两个主要方面。一方面,第 3.1 节讨论了对适当分析数据量的不同评估——即稀疏性(缺乏数据)和示例性分析之间的紧张关系,另一方面讨论了一致性分析的理想水平——即噪声(不可用的、矛盾的数据)和解释多元化之间的矛盾(第 3.2 节)。第 3.3和3.4节将表明,这种学科差异不仅可以务实地解决,而且最终还可以为各个学科带来附加价值。
在 NLP 中,尽可能大的数据库用于自动执行文本识别任务,以便得出巴林电报数据 具有统计意义的规律,例如,可以预测特定文本中现象的分布。在这种自然语言处理的统计方法框架内,罕见现象是有问题的,因为它们的数量不足以形成可靠的推理基础。这种问题根据上下文被称为稀疏数据或罕见事件,在每次分析中都必然会发生:虽然经常出现的语言现象的数量是有限的,并且可以通过创建合适的语料库来捕获,但通常不可能收集足够的数据来对很少发生的现象进行详尽的分析。[27]因此,根据问题的不同,在统计 NLP 中,从语料库中删除很少发生的现象是一种常见的做法。对于那些用于对现象进行建模的参数完全来自训练语料库的情况尤其如此。[28]
虽然自动化语言处理的主要要求是尽可能多地出现被调查现象,但相反,对个案进行示范分析却是文学研究中的常见做法。文本分析或解读通常局限于对一部或几部作品的处理,原因有二。一方面,尤其在综合性的文本解读语境中,凸显个别作品或个别作者的特殊性,符合文学研究的自我形象:“文学研究的努力,恰恰针对的是文本的特殊性。 […] 谈论文学意义就是谈论规则的例外。“ [29]另一方面,这种模范工作方法也有实际的原因:即使文学学者关心通过文本分析和解释获得可以转移到某些其他文本的见解,但由于实际原因,对大量文本进行研究往往是不可能的。这是因为文学文本工作——尤其是叙事学分析等强烈以文本为导向的方法——需要非常精确和重复的接收以及贴近文本的详细分析。
3.2 关于分析的多样性
对于自动语言处理,所使用的数据材料不仅应尽可能包含所研究现象的出现次数,而且还应尽可能明确,以尽量减少预测的统计误差。这意味着,除其他事项外,如果数据由多个人注释,则注释应该是一致的。作为训练和评估 NLP 系统的数据基础,通常使用所谓的“黄金标准”,其旨在通过由几个人根据精确定义的注释指南手动创建和比较注释来保证数据材料的高度一致性。[30]