高考考生们,你的AI志愿顾问来了!

顶端新闻记者 金艾琳 北京报道

6月12日,夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型,并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。该模型具备专家级决策能力,能够为每位考生提供精准、个性化的志愿填报服务。

AI志愿顾问的到来,会取代人类志愿专家的地位吗?通过了解国内首个高考志愿大模型背后的技术逻辑,以及人类志愿专家的看法,一起探讨这场志愿填报领域的变化后的看法。

【让每位考生都有自己的AI志愿顾问】

具体来看,高考志愿大模型驱动的夸克“志愿报告”以Agent方式运行,目前已开放试用。它能像经验丰富的志愿填报专家一样,为考生提供个性化的规划建议。基于“任务规划—执行—检查—反思”的链式推理流程,夸克志愿报告会自动输出涵盖冲稳保策略、志愿表、院校专业推荐等内容的完整报告。

“志愿报告”Agent以考生的成绩、兴趣偏好、家庭背景和地域倾向等为基础,会首先制定个性化任务规划(如定位成绩段、筛选专业方向、制定填报策略等);随后将任务转化为指令,基于高质量数据完成任务执行。

每轮执行结果模型经过自动检查,会判断是否存在逻辑冲突、数据缺漏、排序异常等问题,并将结果反馈至“反思”模块。通过评估结果与需求的差异不断优化后续策略,从而实现动态修正与智能迭代。

例如,当考生倾向选择省内且要求985院校时,模型在执行任务后,面对省内985院校较少的情况,会像志愿专家一样尝试推荐适合的外省985高校。

夸克高考志愿大模型支撑的另一个功能是“高考深度搜索”,当用户输入如“江苏物理组考生584分,性格内向,想找稳定工作”这类复杂查询时便会触发。为提升回答的准确性与专业性,模型会将考生的真实需求精细化拆解,每一类需求都对应定制化的回答范式与要点,确保回复兼具针对性与深度。

【训练机制揭秘:多阶段、高复杂度训练,实现像专家一样思考与决策】

以通义千问为基座,夸克高考志愿大模型基于领域数据优势,通过专项训练具备对复杂规则与用户需求的理解与推理能力,让模型真正“像志愿专家一样思考与决策”。

夸克高考志愿大模型通过一个多阶段、高复杂度的训练范式构建流程,融合了自监督语义建模、监督式对齐调优、由专家判别价值引导的策略精化机制。

在指令微调阶段,夸克高考志愿大模型将数百名资深高考志愿规划师的沟通、决策过程进行结构化。围绕他们与考生或家长的多轮真实对话,提取出完整分析路径与语言风格。通过将上万条真实专家“推理链”转化为高质量监督数据,夸克高考志愿大模型得以深度学习人类专家的分析过程。

夸克高考志愿大模型还在复杂推理任务中生成了中间可验证结构,显著降低幻觉率、增强跨模态演绎能力,并实现分布外泛化鲁棒性,解决各种需要专业知识的复杂问题。

最后通过基于人类偏好强化学习(RLHF)精化策略层,夸克高考志愿大模型构建了一个闭环优化机制,将“模拟填报 → 专家反馈 → 策略评分”引入到模型迭代过程中。

模型会基于模拟的考生档案生成志愿填报方案,随后这些方案将被提交给多位高考志愿专家进行评估。评估标准包括:专业建议是否准确易懂、排序逻辑是否贴合考生特征、是否兼顾分数与兴趣、是否充分提示风险并给出可行应对策略等。

夸克团队已完成对数千份志愿报告的专家标注与打分,通过“人类挑刺 + 模型修正”的方式,使模型输出在专业度与匹配度上持续逼近专家的真实判断标准。

【AI报考能取代人类专家吗?听听报考老师的意见和收获】

可以看到,当下的AI报考解决了部分信息处理的效率问题。那么对于人类报考专家来说,AI能否取代其地位呢?

夸克搜索负责人张帆认为,AI首先肯定不会取代志愿专家,因为AI和志愿专家双方的价值都不可替代,双方更应该是一个合作关系。AI一定程度上会改变志愿专家的工作的方式和一些工作的效率。AI最大限度的能提升在志愿填报上的对信息处理的效率,也就是技术效率带来的社会价值和整个的填报的效率的提升。

“夸克高考志愿报告在推荐院校和专业时会给出详细的说明理由,这一点让我感到惊讶,或者说超出预期。报告对学校和专业的优势阐述得非常清晰和到位,是报告的一大亮点。”志愿专家陈杰(化名)说。

张帆提到,夸克合作了全国有几百位的志愿专家,也在走访这些志愿专家工作的模式,志愿专家的一对一模式的背后其实可以了解到很多考生和家长背后的一些隐形信息和隐形动机,这个其实是AI很难做到的。

“志愿专家其实也在和AI合作,夸克合作的几百个志愿专家一方面炯提供他们在各省各地区一些的对应的情报经验,同时在这个过程里面,去帮我们去做整个的数据的分析整理,能够确保说AI提供的这一部分的数据更准确、更专业。”张帆认为,AI代表了技术效率,人类志愿专家代表的是这一部分的人文的深度,所以这两个价值会不会取代。

志愿专家刘明(化名)则提到了一个很有趣的心路历程。“初期我曾担心把这些AI训练出来了,回头就把我给替代掉了,我不就失业了吗,是不是在自掘坟墓。”刘明表示,随着训练深入,我发现模型有其弱点,而这些弱点在人类专家的集体智慧下得到了持续优化和迭代。所以模型可能始终需要在人类专家的集体智慧下不断的去优化。

刘明提到,训练大模型,也是在训练自己。“在参与高考志愿大模型训练前,我们的知识基本装在自己脑子里,这是多年经验沉淀下来的,但我们很少专门做结构化的整理。训练大模型的过程,也让我第一次系统化的从底层逻辑上去思考高考志愿报考这件事情,这个过程也是在训练我自己。这是一个互相打磨的过程。”