强大的图像生成器、能够执行多项任务的人工智能代理或看似(对某些人来说)有感知的聊天机器人的出现,对于使用机器学习解决健康、教育和环境等领域的重大社会挑战的数据科学家来说是一个令人兴奋的前景。
人工智能的非正式职责之一是“先解决智能问题,再解决其他所有问题”。我们必须假设“解决”包括减少教育不平等、解决肥胖问题和减少家庭碳排放。我们是否即将获得可以帮助我们解决这些问题的人工智能系统?
工业化人工智能
人工智能的主导模型是工业模型。它利用大量网络和社交媒体数据训练深度人工网络。这些网络学习预测模式,可用于感知任务,例如识别照片中的脸部。它们适用于没有人工输入的任务,或者我们不感兴趣的任务,例如喜欢社交媒体帖子。
开发这些系统的大型科技公司利 阿塞拜疆电话号码数据 用这些系统来预测相关的搜索引擎结果,预测哪些社交媒体内容最吸引人,并提出可能促成购买的建议。这有助于这些公司构建更具吸引力和盈利能力的网站和应用程序。
但当涉及到社会影响领域时,数据稀缺,解释比预测更重要,犯错可能会造成生命损失。
社会部门缺乏数据
我们的社会面临着巨大的挑战:最贫困儿童与其他儿童之间的差距越来越大;肥胖率不断上升;迫切需要减少家庭排放。上述人工智能系统可以通过绘制问题图和确定解决方案来帮助应对这些挑战。不幸的是,这说起来容易做起来难。
搜索引擎和社交网站生成大量标准化数据,这些数据对相关结果具有高度预测性。相比之下,教育和卫生等社会影响行业由数百或数千个组织(地方当局、医院或学校)组成,每个组织都收集小型、不完整且不连贯的数据集。社交媒体或搜索引擎数据可能与改善健康结果(例如,不同群体接触的食品广告)或教育结果(哪些社交网络结构可以提高社区的适应力和社会流动性)相关,但获取这些数据的成本很高或根本无法实现。即使有可能,它们也可能提供有偏见的观点,排除或低估某些弱势群体。
当然,可以通过投资数据收集、标准化和集成来弥补数据缺口。但即使我们这样做了,用这些数据训练大量深度学习模型并利用它们进行大规模预测可能也不是一个好主意。原因如下。
模型风险
工业人工智能模型产生的输出与社会影响领域的背景之间存在重大不匹配。试图将两者结合起来,就像把在亚利桑那州郊区训练的自动驾驶汽车开进欧洲城市中心密集繁忙的街道上。会发生事故。