编辑
2024-02-29
论文阅读
0
请注意,本文编写于 203 天前,最后修改于 202 天前,其中某些信息可能已经过时。

目录

Summary Overview
Main Content
Experiments
Metrics
Datasets
Results
🤖ChatGPT
Others
ResourceInfo
Paperhttps://arxiv.org/abs/2009.00829
Code & Datahttps://github.com/rajammanabrolu/C2PO
PublicAAAI
Date2024.02.29

Summary Overview

该文提出了一种软连接的方式(soft casual relation),并且使用常识信息,在固定的情节节点之间构建情节,从而达到故事生成的目的。

Main Content

自动生成故事所面临的核心挑战之一是因果关系的发展,即故事中的事件是由之前的事件发展而来的。

故事生成中的一些故事生成方法没有将常识性知识明确地纳入故事生成过程中,下面是结合常识资源自动生成故事的方法:

  • Rashkin 等人(2018)提出了一个注释框架,专门用于研究基于常识的故事中人物的心理状态。
  • Guan、Wang和Huang(2019)结合外部常识知识源明确改进了故事结局的生成,Mao等人(2019);
  • Guan等人(2020)研究了在ConceptNet(Speer和Havasi,2012)和BookCorpus(Kiros等人,2015)等常识源上微调基于转换器的预训练语言模型(Vaswani等人,2017)。

然而,这些工作的重点是提高他们所谓的逻辑性和语法性,主要是转化为局部连贯性,而不是分析对因果关系或整体故事质量的感知。

软因果关系:对两个互不相斥的标准的合理预期:

  1. certain activities are needed to achieve a character's goal 第一个分句借鉴了 Trabasso 和 van den Broek(1985 年)关于因果关系在故事理解中的作用的心理学理论:读者试图通过追踪因果关系来理解事件发生的 "原因"--除非前面发生了某些事件 x,否则某些事件 y 就不可能发生。
  2. certain activities are in pursuit of future goals 第二个分句借鉴了 Graesser、Lang 和 Roberts(1991 年)关于角色目标层次在故事理解中的作用的理论:读者试图通过跟踪和预测角色目标层次来理解事情发生的 "原因"。

image.png

image.png

Experiments

Metrics

作者通过Mechanical Turk招募了351名人类参与实验,参加的标准为

  • 英语流利
  • 能理解故事中基于常识的因果关系

参与者需要回答一下问题:

  • Which story's events occur in a more PLAUSIBLE ORDER? : as a proxy to indicate preceptions of overall causality within the story
  • which story's sentences MAKE MORE SENSE given sentences before and after them? : to examine perceptions of local causality and commonsense reasoning in the story
  • Which story better follows a SINGLE PLOT? : for insight into perceptions of global coherence for the entire story
  • Which story is of HIGHER QUALITY? : as a measure of overall perceived story quality
  • Which story is more ENJOYABLE? : indicates story value
  • Which story better FITS A GENRE? : a measure of how well the stoy matches commonsense knowledge specific to a genre, capturing the differences between the two genres

对于每一个问题,在配对比较中,我们都会进行配对曼-惠特尼 U 检验,以评估统计显著性,并计算 Fleiss'κ (Kappa) 值,以衡量评分者之间的可靠性。

Datasets

image.png

我们在 Ammanabrolu 等人(2020a)3 首次引入的故事数据集上进行了评估,该数据集包含两种类型--悬疑故事和童话故事,数据集的统计数据见表 1。数据按 8:2 的比例分成训练和测试两部分,训练部分用于训练 C2PO 和两个基线模型。

Results

image.png

image.png

🤖ChatGPT

ChapGPT

  1. 论文的创新之处与独特性: 论文提出了一种自动化故事讲述系统——C2PO(Causal Commonsense Plot Ordering),该系统通过软因果关系生成故事情节。软因果关系是基于常识推理推断出的因果关系,不必严格符合逻辑一致性,而是基于人们日常常识理解的事件先后关系。C2PO利用基于变压器的模型,对常识推理进行训练,生成具有因果性和连贯性的故事情节。这一创新点在于将常识推理与故事生成结合,提高了故事的质量和可信度。

  2. 论文中存在的问题及改进建议:

    • 问题:C2PO系统可能过度依赖于常识推理模型(如COMET),可能导致生成故事的多样性和创新性受限。
    • 改进建议:可以考虑引入更多元化的知识源和故事元素,例如结合不同文化背景的故事数据库,以提高故事的多样性和创新性。
  3. 基于论文的内容和研究结果,提出的创新点或研究路径:

    • 创新点一:开发跨文化故事生成模型,整合多种文化背景下的常识知识,提高故事的普遍性和包容性。
    • 创新点二:研究情感驱动的故事生成,将情感分析与常识推理相结合,生成情感丰富、更具吸引力的故事。
    • 创新点三:开发交互式故事生成系统,允许用户参与故事情节的决策,增加故事的互动性和个性化。
  4. 为新的研究路径制定的研究方案:

    • 跨文化故事生成模型: 研究方法:收集和整理不同文化背景的故事数据,训练模型理解和运用不同文化的常识知识。 步骤:数据收集与整理、模型训练、测试与优化。 期望结果:生成具有跨文化特征的故事,提高故事的普遍性和包容性。
    • 情感驱动的故事生成: 研究方法:结合情感分析技术和常识推理模型,分析故事情节中的情感元素,生成情感丰富的故事。 步骤:情感分析模型开发、与常识推理模型的整合、测试与优化。 期望结果:产生情感丰富、更具吸引力的故事。
    • 交互式故事生成系统: 研究方法:开发一个允许用户参与决策的故事生成系统,用户的选择影响故事情节的发展。 步骤:系统设计、用户交互界面开发、系统测试与优化。 期望结果:提高故事的互动性和个性化,增强用户体验。

Others

OpenIE 提取三元组

本文作者:Geaming

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!