信息抽取的核心目标是通过大语言模型对提问的内容进行结构化提取。抽取的信息需要包括目标检索字段信息、目标条件字段信息、目标检索表名信息、句式语义信息这四部分内容:
🔎 目标检索字段信息。对应数据库查询语句的 SELECT 部分,指业务部门希望获取的数据列。
🔎 目标条件字段信息。限定数据范围的约束表达式,关联 WHERE 子句中的逻辑判断。包含条件对象(字段)与判断内容(值/范围),当业务部门未明确限制条件时该部分可为空值。
🔎 目标检索表名信息。数据库表的描述信息抽取,但考虑到在业务部门 Query 中不一定知道自己想要的信息在哪张表中,故如果业务部门指定表信息的话则抽取出来,如果没有指定也支持暂不抽取。
🔎 骨架信息。通俗描述就是整个 Query 中除字段信息之外的骨架信息,从句式信息中我们可以提炼出对应的 SQL 语句大致的样式,为后续样例召回做准备。
发布于:湖南省