国际广东会科技前沿|Nature 教你在科学研究中如何使用 AI 工具

2025/02/28

引 言


2025 年 2 月《自然》杂志的系列报道系统梳理了当前最前沿的AI工具在科研领域的应用场景与发展趋势。本文将结合最新技术动态,为研究者提供全面的AI工具使用指南。


第一章 主流AI工具功能解析:从推理到代码


1.推理型模型 (the reasoner)

OpenAI 的 o 系列模型是在推理领域最被看好的。o3-mini 凭借“思维链”(Chain of Thought, CoT)技术在数学证明重构等任务中表现优异,但其闭源性质限制了对其内部机制的深入研究。

DeepSeek-R1作为开放权重(open-weight)模型,允许研究者下载基础架构进行定制。其独特优势在于完整展示推理过程(ToC, Trace of Computation),例如在医学诊断路径建模中,医生可追溯AI的决策逻辑。


2.代码开发(the coder)

Anthropic 的 Claude 3.5 Sonnet 在代码生成等任务中表现出色,并且可以远程控制等功能实现跨软件的自动化操作。据俄亥俄州立大学测试显示,其在生物信息学代码生成任务中的准确率达 89%,远超同类产品。

Google 的 Gemini 2.0 Flash 凭借其卓越的代码生成能力和超快推理速度,在开发者社区获得广泛关注。在长文本处理方面,Gemini 2.0 Flash Thinking 支持高达 100 万 tokens 的上下文窗口,使得它不会跳过上下文中的大段信息。


3.开源生态(the opened ones)

自 Meta 于 2023 年发布 Llama 以来,开源 AI 生态呈现出蓬勃发展的态势。全球开发者和研究机构通过模型蒸馏、垂域指令微调、多模态扩展等技术,以开源模型为基底构建出多样化的衍生模型,构建出一个开源的生态。

例如, 阿里巴巴开发的通义千问 Qwen 系列上线第一年就在企业端部署了9万个以上的实例,展示了开源模型在商业环境中的强大适应性和实用价值。 

在科学和工程领域,开源 AI 生态正展现出强大的专业化能力。例如由多机构共同参与的 Semikong 项目,这款模型通过融入半导体设计公司的工作流程,充当数字专家,显著加快新芯片的研发和上市进程。北卡罗来纳大学团队通过调整 Llama 的注意力机制,使其能够解析领域特定语言 Quil,从而支持广东会计算模拟任务。

Nature 特别提到 Allen 人工智能研究所的 OLMo 模型。它作为完全开源模型,它不仅开放模型权重,还提供完整的训练数据与算法代码,成为研究模型偏差的热门对象。这种完全透明的开源方式与Meta的Llama形成了对比。

根据本文撰写时的排名显示(OpenRouter),在科学类别中,谷歌的 Gemini Flash 2.0、Anthropic 的 Claude 3.5 Sonnet 与我国的 DeepSeek-V3分列前三位,而 OpenAI 的 o3-mini 作为思考过程的先行者因速度限制暂居第五。


第二章 AI 赋能的科研:效率与局限


228 02.png


东京 Sakana AI 团队开发的“AI科学家”系统,虽能完成从文献综述到论文评审的自动化全流程,但其底层模型的选择直接影响产出质量。

一方面,局限来自于训练语料的系统性取舍和流行度偏见。例如,使用普通的 DeepSeek-R1 时,系统会回避涉及地缘政治的回答,切换至后训练版本的 R1-1776 后,则显著扩展了假设生成能力,但也增加了伦理争议性输出。

另一方面,在纯数学等抽象学科上,目前的大语言模型仍然处于劣势。伯克利实验室指出,当前自动化系统仍局限于数据丰富的领域(如材料科学),在抽象学科需融合符号编程的能力。

在模型之外,检索增强生成(Retrieval-Augmented Generation, RAG)正在改变知识生产方式。Perplexity AI 通过实时检索 1.2 亿篇学术论文,将大语言模型幻觉率降至 12%,优于通用模型的 33%。斯坦福大学开发的 Legal-RAG系统,在判例分析中准确率提升至 83%,但需警惕 17% 的潜在误导性引用。


终章:总结


当前阶段,AI 应定位为处理重复性任务的助手,而非替代人类科学家的创造力。Nature 提醒我们,在利用 AI 提升效率时,应始终保持对科学本质和伦理底线的警惕。


相关链接:

1.https://digialps.com/meet-r1-1776-the-finetune-deepseek-r1-model-that-brings-uncensored-fact-based-ai-to-the-world/   

2.https://www.nature.com/articles/d41586-025-00437-0

3.https://www.sohu.com/a/793664803_355140

4.https://openrouter.ai/rankings/science

5.https://www.nature.com/articles/d41586-024-02842-3

6.https://www.perplexity.ai/hub/blog/open-sourcing-r1-1776

7.https://www.itconvergence.com/blog/how-to-overcome-ai-hallucinations-using-retrieval-augmented-generation/


编译 | 李泽积

指导 | 刘玉龙