Resource Info Paper https://ceur-ws.org/Vol-2699/paper07.pdf Code & Data https://github.com/ranyxr/dice_story Model https://drive.google.com/drive/folders/1T68rWkOde5ZwcuodQ9iWuYJAcqAmb0Jo Public CIKM Date 2020.10.19
这篇文章是2020年的,研究了如何将知识图谱模型与 LM 相结合,并且提出了一个 DICE 模型。当时还没有 LLM 的概念,但是作者还是使用了 GPT-2 这样的模型微调进行了测试,感觉作者对于未来趋势的把握还是十分不错的。
主要思想就是,通过根据 User 的关键词,根据构建好的知识图谱 KG,去寻找完善词语之间的关系,生成 SVO 三元组,并其通过三元组提交给语言模型生成最后的故事文本,这里作者的目标是生成短故事(5句话左右)。但是知识图谱在这里仅起到一个 enrich 的作用,并没有其他的作用。
文章主要想要解决的问题:
Contributions:
该系统的任务是从一组 SVO 三元组中生成 5 句故事,这些三元组被提取出来并重新组合到一个知识图谱中。系统的预期输入是用户提供的一组关键词。图 2 显示了 DICE 系统的双层结构。我们使用 SVO 三元组作为连接知识丰富层和文本生成层的接口。SVO 三元组可以从知识图谱中构建,也可以从故事语料库中提取;同时,它们还可以作为语言模型生成故事的提示。系统首先利用知识图谱检查这些关键词之间的关系并添加其他信息,然后生成一组 SVO 三元组,供语言模型生成故事。
示例生成的故事文本:
评估重点关注生成输出的两个方面:与故事无关的指标和与故事相关的指标。
对于与故事无关的指标,我们使用自动分析工具 Grammarly 来评估生成文本的整体语法性能。
为每个模型随机挑选了 100 个样本来评估它们的性能。
ChapGPT
论文的创新之处与独特性: 此篇论文提出了一种新的方法,将知识图谱与语言模型结合,用于创造性故事生成。该方法不依赖于知识图谱的嵌入,而是直接使用主谓宾(SVO)三元组作为提示来引导语言模型生成故事。这种方法有效地将知识图谱中的知识注入到自动生成的故事中,同时也能在一定程度上控制故事的内容。这一方法的关键在于使用SVO三元组作为连接知识丰富层和文本生成层的接口。
论文中存在的问题及改进建议:
基于论文的内容和研究结果,提出的创新点或研究路径: a. 探索使用图形神经网络来增强故事生成的连贯性和逻辑性,通过将SVO三元组以图形的形式组织,使得模型可以更好地理解和利用故事元素之间的关系。 b. 开发一种新的语言模型训练方法,专门针对故事生成任务,例如通过模仿人类叙述故事的方式来训练模型。 c. 利用更丰富的外部知识源,如历史数据库、文学作品集,来提供更多样化和深入的背景知识,从而生成更具创造性和多样性的故事。
为新的研究路径制定的研究方案: a. 使用图形神经网络增强故事生成:
b. 开发针对故事生成的语言模型训练方法:
c. 利用丰富的外部知识源提升故事生成:
本文作者:Geaming
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!