编者按:本次实验旨在探究当 AI 被要求"从零开始"撰写申请文书时,会呈现何种结果。关于如何在恪守学术诚信的前提下,将 AI 作为协作助手进行合规、深度的运用,我们将在未来的专栏中另行探讨。

引言

金秋十月,申请季的战鼓已然擂响。大学申请通道全面开启,早申 (Early Decision) 的截止日期仅剩四周,而 GPT-5 也已问世两月有余。在这个令人目不暇接的季节,全球学子都在急切地寻找破局之道,试图在繁重的申请季中寻求一丝从容。

对于名校申请的博弈,我深谙其道。在我的高中最后一年,我曾向二十二所学府投递过叩门砖。而在随后的近十年里,我曾以此经验,协助全球数百位学子打磨文书,助他们叩开了美、加、英等国顶尖学府的大门。

我本人在指导学生文书时,从不假手于人工智能。然而,目睹大语言模型 (LLM) 日新月异的进化及其在写作领域的渗透,我决定与三位我所熟悉的 AI "顶流"进行一次深度交锋,旨在评估它们在构建名校文书时的锋芒与短板。

模型选型与博弈设定

今日,我选取了我的母校——布朗大学 (Brown University) 的一篇 Common App 文书题目,并对以下三大模型进行了测试:

  • ChatGPT 5.0
  • Claude Sonnet 4.5
  • Gemini 2.5 Pro

我使用的是各模型的免费版本,并在构思前清空了所有记忆,确保在一个纯净的对话环境中开始。我向所有模型设定了相同的背景:我对神经科学 (Neuroscience) 和中文 (Chinese) 抱有浓厚的学术兴趣。

初始指令 (Prompt) 如下:

我是一名高三学生,正准备申请布朗大学的秋季入学。我刚开始着手 Common App 的文书,需要你的协助。题目如下:

"布朗的开放式课程体系 (Open Curriculum) 允许学生在广泛涉猎的同时,深入探索学术志趣。请告诉我们任何令你兴奋的学术兴趣,以及你将如何在布朗追求这些兴趣。(200–250字)"

请扮演一位以"助我被布朗录取"为最高目标的招生顾问。申请的其他部分(如文书、活动列表、推荐信等)在此次讨论中暂不考虑。

在揭晓结果之前,请铭记:切勿直接提交由 AI 撰写的文书。这不仅触犯了学术诚信的底线(AI 检测软件极易识破),过度依赖 AI 更会扼杀原本属于您的创造力灵光。请将本次实验视为一次演示与以此为鉴的案例。

言归正传,让我们看看各路 AI 选手的表现。

ChatGPT:单刀直入的实用派

首先登场的是 ChatGPT,它是 LLM 世界中的通才与实用主义者,其表现也完全符合这一人设。

在我输入首条指令后,ChatGPT 迅速给出了一个清晰简练的概要,阐述了布朗大学的考察重点,并为文书提出了推荐结构。它几乎是瞬间就总结了布朗的偏好,并勾勒出了三段式的布局。

ChatGPT 分析文书期望并建议布朗大学文书结构
ChatGPT 几乎瞬间总结了布朗大学的偏好,并提出了三段式结构。

然而,在生成上述内容后,ChatGPT 仅仅询问了我的学术兴趣。在我回复之后,它未作任何进一步的探询,便径直生成了文书初稿。文章以"当我第一次了解青春期的突触修剪时..."开篇,第二段则致力于"通过分子与认知双重镜头探索神经科学"。

这两段内容,既未能准确反映我对学科的真实体验,也非我本意的表达。ChatGPT 倾向于预判"什么能满足题目要求",而忽略了向我寻求更多细节。它唯一的后续追问仅关于语调——是该更"个人化"一点,还是更"精细专业"一点?

简而言之,若想驾驭它,你需要用更多的指令来强力校准其内容方向。

Claude:温婉周全的策略家

接下来是外交官般周全的 Claude。

面对我的初始指令,Claude 并没有急于动笔,而是列出了一份四步走的"启动清单",分享了针对布朗文书的战略性指引。这种碎片化的优先级确认,配合逻辑严密的追问,让人耳目一新。Claude 似乎更愿意沉下心来,确保在行动前已掌握所有必要细节。

Claude 概述布朗大学开放课程文书的战略方法
Claude 的首次回复列出了它在动笔前希望确认的优先事项。

即便在我分享了学术兴趣后,它依然按兵不动,而是先提供了一份推荐的结构大纲,并极具直觉地按句子数量进行了规划——这是一个非常精妙的约束条件。

Claude 为布朗大学文书推荐逐句结构
Claude 按句子数量重新构建了大纲——一个出人意料且直观的约束条件。

当我最终要求生成草稿时,Claude 交付了一篇完全符合我们商定框架的文章。然而,读起来却略显割裂。神经科学与中文的提及并列放置,中间缺乏真正的逻辑桥梁,使得整篇文章更像是一份组织良好的清单,而非浑然一体的叙事。

尽管如此,Claude 这种循循善诱的问询方式,最接近我指导学生时的真实状态。若能进行更多的多轮对话,我推测其文书质量将有质的飞跃。

Gemini:严谨逻辑的构建者

最后是 Google 的 Gemini。

我早闻 Gemini 对逻辑有着近乎偏执的追求,这一点在起草过程中展露无遗。它的首轮回复洋洋洒洒(长到需要多张截图才能截全),宛如一篇学术论文:包含了总体目标、详尽的三部分结构、两个大纲样本以及最终的检查清单。

其回复以一种自信的口吻结束,确信这种格式定能取悦招生官。不同于其他模型用针对性问题来引导我,Gemini 的指导显得更具指令性,而少了几分协作感。在我确认兴趣后,Gemini 生成了它自己的草稿,并附上了一段"自我辩护",以此证明这篇文书为何出色,甚至不忘赞美自己写的"钩子" (Hook) 有多妙。

那个所谓的"钩子"确实将我的学术兴趣以一种看似合理的方式融合推进了。如果招生官认为这是学生写的,或许会为这种推理水平鼓掌。但读起来,它依然更像是学术论文的开篇,而非个人叙事的起点。

大学文书的题目特意设置为开放式,旨在让学生尝试对话描写、倒叙手法或描写冲突时刻。Gemini 这种强行将每位写作者塞入论文式开篇的做法,错失了展现个性的良机。它对自己草稿优点的自卖自夸,也略显推销味。

洞见与结语

市场能容纳多个 LLM 并存是有原因的——即便在这个简短的实验中,它们各自的天赋也已展露无遗:

  • ChatGPT 是单刀直入的实用派;
  • Claude 提出了带有个人魅力的针对性问题;
  • Gemini 则将逻辑与连贯性奉为圭臬。

然而,这些模型也暴露了共性的短板。没有一个模型能精准控制字数;宣称的字数与实际产出之间,少则差五字,多则差三十字。令我惊讶的是,尽管题目明确允许写到 250 字,但在没有我催促的情况下,没有任何模型写超过 220 字。当你的施展空间仅有寥寥数百字时,留白即是浪费,即是错失良机。

在内容层面,尽管我提供了具体细节,但所有模型都仅仅浮光掠影。每篇文章都机械地引用了布朗的"Carney 脑科学研究所",却无一提及"开放式课程体系"的其他灵魂要素——比如设计自己的专业 (Concentration),或无限制地选修"及格/不及格"课程。如果把文中的专有名词换成另一所学校的,这些文章完全可以套用到其他项目上——对于申请一所录取率仅为个位数的顶尖学府而言,这无疑是一步险棋。

当然,更多的迭代打磨或许能通过"调教"获得更好的结果。LLM 尚处于进化的早期阶段,我很好奇它们未来的辅助写作能力将如何成熟(敬请期待后续专栏的更新)。

但可以确定的是:AI 是强大的利器,但其产出的上限,始终被使用者的心血所束缚。若运用得当,它们是绝佳的头脑风暴伙伴——但请铭记,您,才是那个注入灵魂、提供智慧核心的人。