国际广东会科技前沿|Nature 教你在科学研究中如何使用 AI 工具
2025/02/28
引 言
2025 年 2 月《自然》杂志的系列报道系统梳理了当前最前沿的AI工具在科研领域的应用场景与发展趋势。本文将结合最新技术动态,为研究者提供全面的AI工具使用指南。
第一章 主流AI工具功能解析:从推理到代码
1.推理型模型 (the reasoner)
OpenAI 的 o 系列模型是在推理领域最被看好的。o3-mini 凭借“思维链”(Chain of Thought, CoT)技术在数学证明重构等任务中表现优异,但其闭源性质限制了对其内部机制的深入研究。
DeepSeek-R1作为开放权重(open-weight)模型,允许研究者下载基础架构进行定制。其独特优势在于完整展示推理过程(ToC, Trace of Computation),例如在医学诊断路径建模中,医生可追溯AI的决策逻辑。
2.代码开发(the coder)
Anthropic 的 Claude 3.5 Sonnet 在代码生成等任务中表现出色,并且可以远程控制等功能实现跨软件的自动化操作。据俄亥俄州立大学测试显示,其在生物信息学代码生成任务中的准确率达 89%,远超同类产品。
Google 的 Gemini 2.0 Flash 凭借其卓越的代码生成能力和超快推理速度,在开发者社区获得广泛关注。在长文本处理方面,Gemini 2.0 Flash Thinking 支持高达 100 万 tokens 的上下文窗口,使得它不会跳过上下文中的大段信息。
3.开源生态(the opened ones)
自 Meta 于 2023 年发布 Llama 以来,开源 AI 生态呈现出蓬勃发展的态势。全球开发者和研究机构通过模型蒸馏、垂域指令微调、多模态扩展等技术,以开源模型为基底构建出多样化的衍生模型,构建出一个开源的生态。
例如, 阿里巴巴开发的通义千问 Qwen 系列上线第一年就在企业端部署了9万个以上的实例,展示了开源模型在商业环境中的强大适应性和实用价值。
在科学和工程领域,开源 AI 生态正展现出强大的专业化能力。例如由多机构共同参与的 Semikong 项目,这款模型通过融入半导体设计公司的工作流程,充当数字专家,显著加快新芯片的研发和上市进程。北卡罗来纳大学团队通过调整 Llama 的注意力机制,使其能够解析领域特定语言 Quil,从而支持广东会计算模拟任务。
Nature 特别提到 Allen 人工智能研究所的 OLMo 模型。它作为完全开源模型,它不仅开放模型权重,还提供完整的训练数据与算法代码,成为研究模型偏差的热门对象。这种完全透明的开源方式与Meta的Llama形成了对比。
根据本文撰写时的排名显示(OpenRouter),在科学类别中,谷歌的 Gemini Flash 2.0、Anthropic 的 Claude 3.5 Sonnet 与我国的 DeepSeek-V3分列前三位,而 OpenAI 的 o3-mini 作为思考过程的先行者因速度限制暂居第五。
第二章 AI 赋能的科研:效率与局限

东京 Sakana AI 团队开发的“AI科学家”系统,虽能完成从文献综述到论文评审的自动化全流程,但其底层模型的选择直接影响产出质量。
一方面,局限来自于训练语料的系统性取舍和流行度偏见。例如,使用普通的 DeepSeek-R1 时,系统会回避涉及地缘政治的回答,切换至后训练版本的 R1-1776 后,则显著扩展了假设生成能力,但也增加了伦理争议性输出。
另一方面,在纯数学等抽象学科上,目前的大语言模型仍然处于劣势。伯克利实验室指出,当前自动化系统仍局限于数据丰富的领域(如材料科学),在抽象学科需融合符号编程的能力。
在模型之外,检索增强生成(Retrieval-Augmented Generation, RAG)正在改变知识生产方式。Perplexity AI 通过实时检索 1.2 亿篇学术论文,将大语言模型幻觉率降至 12%,优于通用模型的 33%。斯坦福大学开发的 Legal-RAG系统,在判例分析中准确率提升至 83%,但需警惕 17% 的潜在误导性引用。
终章:总结
当前阶段,AI 应定位为处理重复性任务的助手,而非替代人类科学家的创造力。Nature 提醒我们,在利用 AI 提升效率时,应始终保持对科学本质和伦理底线的警惕。
相关链接:
2.https://www.nature.com/articles/d41586-025-00437-0
3.https://www.sohu.com/a/793664803_355140
4.https://openrouter.ai/rankings/science
5.https://www.nature.com/articles/d41586-024-02842-3
6.https://www.perplexity.ai/hub/blog/open-sourcing-r1-1776
编译 | 李泽积
指导 | 刘玉龙
English
OA
Email
