用最少的投入,产生最大的效益

AI题库自动生成系统

整体概述
赛摩博晟AI题库自动生成系统旨在利用大语言模型的强大自然语言处理能力,根据给定的规范或规程生成高质量的题库。通过自动化生成题库,可以大大减轻人工出题的工作量,提高出题效率,同时确保题目的准确性和一致性。
研发题库智能生成器,该生成器能够选择各类素材文档(如Word、PDF、Excel等)文本,自动构建考题素材和考题间的关联关系,思考题型及设置干扰项,设置难易程度,自动生成考题。
考题生成式模型设计、训练及数据准备。对培训源文档进行语料清洗,分别设计单选题、多选题、判断题、填空题、简答题的生成式模型,对清洗后的语料分别构建测试样本集与训练样本集,进行各出题模型的拟合训练与验证,将效果满足需求的模型进行能力上线封装成功能模块,形成智能考题生成功能。随后,题库等培训资料以任务流的方式,自动推送至安全生产系统的每一位人员,以供其使用。
智能考题生成任务的创建过程,支持多样化的考题来源,用户可以通过本地上传Word文档或手动复制粘贴文本内容等方式进行创建。在完成生成后,提供一键入库的便捷操作,同时也支持导出功能,以满足用户作为线下题库来源的需求。
系统架构
系统功能
赛摩博晟在电力行业深耕多年,积累了大量的行业知识库,结合主流大语言模型,并有效整合电力行业相关语料进行AIGC模型的微调,在电力行业垂直领域能够有效的实现知识问答、关键信息抽取、智能题库生成。
  • 1. 输入模块
    负责接收用户输入的规范或规程文本,接收生成题库的相关参数。输入模块是题库生成系统的前端交互核心,负责接收用户提供的两类核心数据。文本类输入,用户上传的规范/规程文档(如PDF、Word、TXT格式)。参数类输入,生成题库的元数据,如题目数量、难度等级、题型分布等。
  • 2. 大语言模型处理
    利用预训练的大语言模型对输入文本进行理解和分析,提取关键知识点和逻辑关系。输入文本预处理,通过文本清洗去除噪声(如公式符号、图表说明),保留核心文本内容。知识点标注,使用预训练模型识别实体(人名、地名、术语),概念(核心定义),关系(因果、条件、对比等逻辑结构)。通过知识点提取与结构化,构建知识图谱,根据知识点复杂度划分难度等级。
  • 3. 题目生成
    根据大语言模型处理模块的输出,结合用户指定的参数,自动生成符合规范的题目。根据用户指定的题型、难度、知识点等参数生成题目,支持选择题、填空题、简答题、计算题、论述题等多种题型,输出符合考试规范的题目文本。自动生成标准答案、解析及评分标准。
  • 4. 题目筛选与优化
    基于生成的题目,结合知识图谱、规则校验和模型评估,设计一个自动化筛选与优化模块,确保题目在准确性、合理性、规范性和多样性上达到高标准。准确性校验,检查题目内容是否符合学科知识体系,确保答案与解析的正确性,避免逻辑矛盾。合理性优化,调整题目表述,避免歧义或误导性语言,确保题目难度与用户指定参数一致。规范性检查,符合考试格式规范,避免重复题目或相似题目。多样性提升,使用聚类算法对题目进行去重,确保覆盖不同知识点。
  • 5. 输出模块
    基于生成的题库和用户指定的输出格式,设计灵活、可扩展的输出模块,支持将题目以多种格式导出,如Word文档、Excel表格、在线题库平台等,确保题目、答案、解析、难度等级、知识点标签等完整导出,支持一次性导出大量题目。
  • 6. 考题生成结果审核
    在创建完考题生成任务后,对生成的考题结果进行干预审核校验。当选择文档中的某个段落时,系统会展示该段落所抽取出的考题结果,并能够根据每句话智能推荐相应的考题题型类型。此外,系统还会展示该段落已经生成的考题数量、已处理的考题数量以及剩余的考题数量。用户还可以根据需求筛选查看已处理和未处理的考题,并支持对考题进行检索,以确保生成的考题质量符合标准。
  • 7. 考题入库管理
    经过严格的审核与校验后,所生成的考题将被纳入题库中进行统一管理。入库后的考题将支持同步操作,确保数据的一致性。题库系统提供全面的题目维护功能,用户可自定义每个题目的内容,包括题目、答案、难度、分值及对应知识点等详细信息。