背景
德克萨斯州第10地区教育服务中心(ESC)在促进学生成功和塑造全州教育格局方面发挥着关键作用。作为二十个其他ESC的合作伙伴,第10地区服务于120个公立和特许学校学区,超过3,000所学校,以及超过900,000名学生。该ESC创建、分发并支持一个题库TEKSbank,供600个学区和特许学校使用,涉及超过5,000所学校和超过300万名学生。从课程开发和教学支持到领导力培训和特殊教育服务,第10地区致力于赋能教育工作者,丰富学习体验,并推动来自不同背景和能力的学生取得积极成果。
挑战
第10地区发布了一个题库TEKSbank,供学区帮助学生为高风险考试——德克萨斯州学术准备评估(STAAR®)做准备。90,000个TEKSbank测试题与州的课程标准——德克萨斯州基本知识和技能,以及其他标签如韦伯的知识深度(DOK)和布鲁姆的分类法保持一致。
随着教育趋势的变化和州标准的更新,第10地区投入大量精力确保题库的对齐和相关性。
为了确保内容与州的课程标准对齐,并具有不同的难度级别,第10地区每年进行多项对齐项目。雇佣承包商手动分析每个项目。有些项目需要每个年级12级的单一课程专家审查多达2,000个项目。这些审查过程不仅耗时,而且手动审查导致更新项目的准确性和一致性缺乏。
第10地区在维护内容对齐上花费了大量时间和资源,几乎没有时间优先考虑内容的增长和改进。每年花费150,000美元仅用于更新现有内容的标准或标签并不罕见。2023年,德克萨斯州的教育格局发生了重大变革,引入了技术增强的题目(TEI)和在线评估,这使得这一问题变得更加重要。这与传统的评估方法有所不同,并挑战教育工作者为一个强调批判性思维和知识复杂展示的新范式做好准备。为了支持教师并引导他们进入这一新领域,第10地区面临着创造20,000个高质量TEI的挑战。
第10地区最初概述了他们希望通过寻找新合作伙伴来实现的四个主要目标。
- 确保与最新州标准对齐
- 识别知识空白
- 分配知识深度(DOK)更新与文化相关的内容
在开始实施新技术以简化流程之前,ESC还需要考虑几个重要因素:
- 在整个过程中需要保持人类监督
- 不断调整和完善内容
- 减少对齐项目的时间,以便有更多时间来增强和开发更多问题
第10地区于2023年3月与Prometric的Finetune团队取得联系。Finetune迅速理解了ESC的挑战,并开始实施Finetune Catalog™,这是一种结合了人工智能和人类的内容对齐工具,能够提供题库和学习材料的深入见解。
“Finetune对K-12内容和标准有着非常好的理解。尽管我们没有技术AI知识来描述它,但与他们讨论我们想要的内容很容易。”
- 吉姆·纽豪斯,第10地区前数据解决方案助理主任
结果
第10地区向Finetune提供了学习材料,如考试蓝图、标准、题库等。Finetune利用这些内容构建了一个定制的Catalog AI模型,分析他们的内容并查看其与韦伯知识深度的对齐程度。经过第一次对齐,Catalog报告了96%的准确率,使第10地区的团队对未来内容的发展和改进感到兴奋和乐观。那些需要对齐改进的“稻草堆中的针”是可以修复的,他们能够比以往更快、更便宜、更精确地做到这一点。
除了第一次对齐的准确性外,ESC还获得了在未来评估构建中有用的依据。这一复杂的依据已经成为他们能够通过评估平台提供给测试构建者和教师的一个转型性的新数据集合。
“Catalog的实施仅用几周时间,而不是预期的六个月,并将所需承包商的数量从十个减少到仅三个。使用Finetune Catalog完成对齐任务释放了时间和资金,并提高了整体生产力。”
- 吉姆·纽豪斯,第10地区前数据解决方案助理主任
现在,第10地区在核心内容领域(包括数学、英语语言艺术与阅读(ELAR)、科学和社会研究)每年节省约100,000美元,可以重新投资于生产新内容以扩展其当前题库。TEKSbank现在配备了25%(20,000个)尖端的技术增强题目,这提供了更深层次的知识评估和对学生技能的更准确评估。
“我们认为AI是一种由人类编程、由人类监督和由人类分析的工具。”
- 吉姆·纽豪斯,第10地区前数据解决方案助理主任
下载成功案例