使用机器学习绘制集体智慧研究领域图谱

Showcase, discuss, and inspire with creative America Data Set.
Post Reply
jrineakter
Posts: 860
Joined: Thu Jan 02, 2025 7:05 am

使用机器学习绘制集体智慧研究领域图谱

Post by jrineakter »

作为我们新研究计划的一部分,我们使用机器学习和文献搜索来绘制集体智慧研究的主要趋势。这有助于我们巩固现有的集体智慧知识体系,并找出一些可以解决的研究空白,以推动该领域的发展。

在 Nesta 的集体智能设计中心,我们对通过新方法和新兴技术增强集体智能 (CI) 的潜力很感兴趣。本着集体智能的精神,我们希望确保我们的工作能够补充和建立在现有的学术规范之上,解决当前的差距和挑战,并充分利用新的研究方法。

我们认为,有必要开展对话,超越一些较狭隘的集体智慧学术定义,将所有形式的群体智慧(人类和机器)纳入其中,以大规模行动实现目标。这就是为什么我们在集体智慧的工作定义中也考虑了众包、公民科学和协商民主。

通过将这些知识体系编纂成法典,为有效 Facebook 数据 的方法建立证据基础,我们的目标是为该领域带来严谨性,并为设计集体智慧贡献资源,这些集体智慧可供我们自己和他人使用,以解决健康、国际发展、环境等领域的一些最复杂的问题!

使用主题模型来理解该领域
研究主题群
集体智慧研究中的突出主题集群

很多关于集体智慧的现有知识都可以通过在线研究和创新数据库找到,而这正是我们开始绘图工作的地方。我们与 Nesta 的创新绘图团队合作,使用机器学习方法来了解集体智慧研究界如何描述他们的工作以及文献和项目描述中最常出现的主题类型。通过将主题建模应用于我们的 7000 项数据集(开放获取文章、资金摘要、公司描述),我们确定了突出的主题集群及其相互关联性。

上面的聚类图显示了语料库中每个主题相对于其他主题的主导性(文本大小)以及主题在含义上的紧密程度(文本标题之间的位置和距离)。我们可以看到,最大的主题标题是众包,这表明这是最常被引用的集体智慧类型。其他代表性主题包括公民科学、传感器数据、数据质量和多智能体系统。

学术文献中的四个主要趋势
研究学科气泡图
“集体智慧”研究的学科划分

通过使用传统学术文献检索深入研究,我们发现了目前正在影响该领域的四个主要趋势:

集体智慧研究涉及许多不同的学科。计算机科学领域的出版物是该领域的主要研究对象,但社会科学、工程、数学、商业与管理、医学与健康领域的学者也撰写了大量有关该主题的文章。这种多学科性既是优势也是劣势,因为由于缺乏专门的论坛来召集不同领域的学者并发表他们的研究成果,专业知识的多样性所带来的好处有时会被削弱。

在过去的 10 年中,与“集体智慧”相比,以“众包”和“公民科学”为主题的文章数量出现了大幅增长。2008 年,以“集体智慧”为关键词的出版物数量比公民科学和众包多 5 倍,但尽管此后几年前者每年的出版物数量稳定在约 200 篇,但众包和公民科学的出版物数量却迅速增加,2018 年分别发表了约 1,400 篇和约 550 篇文章。

在我们选择的搜索词中,公民科学研究与 CCID 关注的社会问题最为密切相关。与公民科学密切相关的关键词包括城市化、气候变化和生物多样性,而与集体智慧相关的关键词包括 Web 2.0、群体和人工智能、知识管理和开放式创新。这些不同的重点和互补优势表明,致力于集体智慧研究的不同学术团体有很多东西可以相互学习。

绘制众包、公民科学和集体智慧文章之间的共同引用(作者相互引用的频率)和参考书目的相关性,揭示出截然不同且大多不重叠的集群。这表明,这些领域的学者目前并没有阅读彼此的作品并相互学习。

集体智慧研究具有全球影响力。与许多学术领域一样,大多数文章都来自美国和英国,但来自中国、日本、韩国和澳大利亚的学者也撰写了相当一部分使用“集体智慧”一词的出版物。我们发现研究资助的地理趋势相似(对于我们数据集中指定资助的约 15%)。我们的数据显示,中国国家自然科学基金会 (NSFC) 是集体智慧的新兴资助者。
这些早期见解表明,在集体智慧领域内和周边工作的学者和从业者可以跨越学科界限相互学习。无论你称之为公民科学、众包、协商民主还是协作学习……这些都是集体智慧发挥作用的很好例子。
Post Reply