游客发表
来源:DeepTech深科技
在传统的数字分身人类行为模拟研究中,智能体的模拟行为通常是通过人工指定的规则来定义的。
这种方法虽然具有较好的人格可解释性,但往往过度简化了真实人类行为的技术即复杂性。而本研究采用的新突生成式智能体架构则采取了一种全新的路径。
该团队招募了超过 1000 名来自不同年龄、破两如饥似渴性别、对话种族、创造地域、数字分身教育背景和政治倾向的模拟志愿者。
他们通过与参与者进行深入对话,人格创建了他们各自的技术即 AI 模拟智能体(Simulation Agents)。
这些对话采用半结构化的新突勾心斗角方式进行,既包含预设的破两标准问题,也允许根据受访者的对话回答进行灵活的追问,涵盖了从个人生活故事到当代社会问题的广泛话题,以期获取完整而深入的个人信息,为 AI 系统提供丰富的个性化数据基础。
在实验中,研究人员设计了一套全面的测试方案。参与者需要完成性格测试(大五人格量表 44 条目版)、社会调查问卷和逻辑游戏等一系列评估,并在两周后重复相同的测试。
随后,他们让 AI 模拟智能体完成相同的千难万难测试项目。结果显示,AI 智能体的回答与真实参与者的反应具有高达 85% 的相似度。
这意味着,其预测准确度接近受访者自身在两周后重复作答时的一致性水平。在大五人格特征预测上,AI 智能体实现了 0.80 的相关性。
该研究还特别关注了 AI 系统可能存在的偏见问题。通过对政治倾向、种族和性别等敏感维度的分析发现,基于深度访谈的智能体能够有效降低预测偏差。
研究人员认为,相比仅使用人口统计信息或个人描述的大雨滂沱基线方案,这种基于对话的 AI 智能体构建方案在各项指标上,都表现出显著的优势。
朴俊成在接受媒体采访时表示:“如果我们能让许多个‘迷你的你’在数字世界中运行,并做出与你相同的决策,这就是我认为的未来图景。”
他解释说,这种深度模拟的灵感部分来自于他在 2023 年发表关于生成式智能体的论文后,参加了大量播客访谈的经历。
“两个小时的深度对话可以产生意想不到的力量。通过这样的交谈,人们能够深入了解一个人的思维方式和价值观。”他补充道。浪子回头
这项研究的主要目的,是为社会科学等领域提供更便捷的研究工具。因此,该课题组建立了包含 1000 个生成式智能体的智能体库。
通过创建行为逼真的 AI 模拟智能体,研究人员可以开展一些在现实中成本过高、难以实施或存在伦理争议的研究项目。
例如,可以利用真实人类来生成角色模型,然后以编程方式在模拟环境中使用这些模型,这是无法直接用人类直接实现的。
此外,正儿八经还可以用来测试社交媒体上打击虚假信息的干预措施效果,或研究导致交通拥堵的行为模式等。这种方法不仅能够节省研究成本,还能突破传统研究方法的局限性。
特别值得注意的是,这项研究只需要两小时的访谈数据就能创建出相当准确的性格模拟,这比目前数字孪生技术需要的数据量要少得多,效率也提升了不少。
不过,这种方法尚不完美,尤其是智能体并不能完全捕捉构成个人独特性的所有细节。
例如,养家糊口在测试个人价值观和公平性概念的“独裁者博弈”中,AI 的表现相对较差。这表明,在某些复杂的道德判断和价值选择方面,AI 模拟智能体仍有提升空间。
同时,这项技术也可能带来一定的滥用风险。目前,诈骗者已经开始使用音频和视频深度伪造技术,来欺骗受害者的家人、朋友和商业伙伴。如果他们能够获取个人性格的连锁反应深度伪造技术,潜在危害将更加严重。
值得注意的是,这类模拟智能体与目前主流 AI 公司开发的工具型智能体有所不同。工具型智能体主要用于执行特定任务,如数据输入、信息检索或日程安排等。
包括美国客户关系管理软件服务公司 Salesforce、美国 AI 初创公司 Anthropic 等都已推出了各自的工具型 AI 产品,OpenAI 也计划于 2025 年 1 月发布相关产品。
这两类智能体虽然有所区别,但研究人员认为,对模拟智能体的满腔热忱研究将有助于提升 AI 智能体的整体性能,推动 AI 领域进一步发展。
而随着 AI 技术的发展,有望逐步接近更准确地模拟和理解人类行为的目标。
参考资料:
https://arxiv.org/pdf/2411.10109
https://www.biometricupdate.com/202411/ai-model-that-copies-human-personality-opens-questions-on-deepfakes
https://www.techradar.com/computing/artificial-intelligence/ai-can-now-clone-your-personality-in-only-two-hours-and-thats-a-dream-for-deepfake-scammers
运营/排版:何晨龙
随机阅读
热门排行
友情链接