但不会丧失透明度和多样性

Showcase, discuss, and inspire with creative America Data Set.
Post Reply
Bappy11
Posts: 477
Joined: Sun Dec 22, 2024 9:27 am

但不会丧失透明度和多样性

Post by Bappy11 »

1.3 可视化有助于解释大量数据
数字人文学科被认为是一场运动的先驱,该运动寻求传统语言学研究方法的替代方法,以便利用数字技术获取以前未被认识或未被认识到的现象的线索。[13] 其中包括:例如,探索性的方法,也称为“意外发现” [14],很少受到人文学科的重视,因为它们不是由对知识的具体兴趣所引导的。然而,定量评价必须忍受这样的指责:他们已经在纯数字陈述中看到了结果。然而,数字化信息的数量之海往往难以用解释学方法处理,因此必须尝试其他方法,即使最终的知识收益尚不可预见。

在《希腊-阿拉伯词汇表》中,数据量的不断增加也使得获取基础语料库的整体概述甚至只是从中获得摘录变得越来越困难。尽管带有搜索表单和结果列表的典型数据库机制可以满足基本需求,但总数据量超过 100,000 条记录,但此功能现在仅在特殊情况下才足够,因为更一般的搜索查询已经可以产生难以管理的结果数量。将来,传统的功能将不再足够。结果,数据库内容对用户来说变得越来越不透明,并且如何对各个信息进行分类和评估也变得越来越不清楚。

因此,为了继续为研究提供坚实的基础,有必要以其他形式呈现材料。在这方面,可视化尤其提供了一个很好的机会,因为它们可以同时描绘多个语义层次,同时也为科学界和感兴趣的公众提供了有吸引力的数字资源访问方式。可视化可以让用户立即洞察数据结构和内容之间的关系,从而为解释的可能性提供关键的线索。[15] 在此基础上,即使从大量数据中也有可能为人文学科的研究注入新的动力。

2. 方法论
2.1 »映射«词语?
图 4:正在工作的天文学家,出自《Shāhanshāhī-nāmah》(16 世纪),伊斯坦布尔大学图书馆,MS 编号。 FY 1404。转载并引用自:Seyyed Hossein Nasr,《伊斯兰科学》。插图研究,伊斯兰世界节日出版社,1976 年,第 113 页,第 65 页(请注意任何版权声明)。
图 4:正在工作的天文学家,出自《Shāhanshāhī-nāmah》(16 世纪),伊斯坦布尔大学图书馆,MS 编号。 FY 1404。转载并引用自:Seyyed Hossein Nasr,《伊斯兰科学》。插图研究,伊斯兰世界节日出版公司,1976 年,第 113 页,第 65 页(请注意任何版权声明)。
插图(图 4)展示了 16 世纪伊斯坦布尔的一座天文实验室。学者们使用各种科学工具,例如象限仪、星盘、沙漏和天文球,并将他们的研究结果转移到地图和笔记本上。他们试图利用他们的设备来测量和描绘星空中发生的事情,以便更好地理解和解释天体的运动。多种观察工具和详细记录结果对于理解复杂过程而言是至关重要的先决条件。在这种情况下,知识产生是一个测量、映射和解释的过程。映射在这里起着特殊的作用,因为它可以调解数据收集或测量和解释。

《希腊-阿拉伯语词汇表》主要关注翻译结构,主要包含大量的希腊-阿拉伯语词对,每个词对都分配给其来源和翻译者。从地理上看,内容仅限于巴格达周边地区,因为这是翻译最丰富、最密集的地区。在这方面,本研究的标题并不针对地理或天文维度,而是针对语言结构及其在翻译过程中的变化。图形说明应该允许观看者识别和阅读类似地图的这些结构。[16]在最好的情况下,这些“地图”可以成为独立的研究参考。

但是应该如何设计可视化才能以有意义的方式支持研究问题?有哪些多维表示方法可用?可视化在什么时候比数据库查询的结果列表发挥更多作用?可视化是否有可能作为研究的参考,还是仅仅是一种简化的可视化?

Edward Tufte在他的《定量信息的可视化展示》一书中,在“图形卓越原则” [17]标题下为可视化设计制定了一些指南,并指出了以下重要方面:

同时描绘和关联的内容维度越多,可视化的表现力就越强。
好的可视化以压缩的方式呈现信息,
因此,其形式和结构设计是设计的核心。因此,对于可视化的用户来说,清晰地记录和传达所呈现的内容以及呈现方式非常重要。根据这种观点,如果图形风格设备仅仅是为了达到某种效果,那么它们就是次要的,就像暗示性设计如果将预制的语句放在前台一样。另一方面,通过使可能的关联可见来激发观众的兴趣至关重要,但最终还是把解释权留给观众。

在选择了应该通过可视化来表示哪些主题和相关的认知兴趣之后,还必须明确以下几点:

为此需要哪些尺寸,
预期存在哪些相关性,
哪些可视化策略适合这种情况,以及
如何为观众优化显示效果。
2.2 专题目标
可视化的开发应该支持数据库的以下方面:

如何才能清晰的呈现源语料?这些文本在历史意义上应如何分类以及它们在 澳大利亚电报数据 语料库中具有什么样的相关性?这里必须把文本的长度以及原文和译文的时间分类联系起来。这主要是为了与尚不熟悉语料库的用户进行交流。 (见第 3.1 节)
源文本和目标文本之间存在哪些一般语言差异?翻译通常使用更广泛的词汇吗?还是有语言综合的趋势?这里,必须对文本进行比较,以区别源语言和目标语言中的词汇。 (见第 3.2 节)
文本在语法层面上是如何转变的?各自的翻译者是如何处理希腊语和阿拉伯语之间的结构差异的?翻译人员之间可以发现哪些差异?哪些希腊语词类被翻译成了哪些阿拉伯语词类,在某些作者或资料中可以看到哪些差异? (见第 3.3 节)
如何才能一眼看出某个词条有哪些起源和翻译变体,包括作者和译者的可能作用?有必要说明出现在不同作者文本中的单词是如何由不同的翻译者翻译的。 (见第 3.4 节)
2.3 可能的可视化方法
可以使用哪些可视化方法以图形方式描绘此处列出的方面?显然,仅使用两个参数的典型饼图或条形图不足以在保持主题复杂性的同时使相关性变得可见。目的是创建可同时显示至少三个参数的表示。
Post Reply