国际广东会科技前沿｜Nature 教你在科学研究中如何使用 AI 工具

新闻中心

首页>新闻>广东会科技动态

国际广东会科技前沿｜Nature 教你在科学研究中如何使用 AI 工具

2025/02/28

引言

2025 年 2 月《自然》杂志的系列报道系统梳理了当前最前沿的AI工具在科研领域的应用场景与发展趋势。本文将结合最新技术动态，为研究者提供全面的AI工具使用指南。

第一章主流AI工具功能解析：从推理到代码

1.推理型模型 (the reasoner)

OpenAI 的 o 系列模型是在推理领域最被看好的。o3-mini 凭借“思维链”（Chain of Thought, CoT）技术在数学证明重构等任务中表现优异，但其闭源性质限制了对其内部机制的深入研究。

DeepSeek-R1作为开放权重（open-weight）模型，允许研究者下载基础架构进行定制。其独特优势在于完整展示推理过程（ToC, Trace of Computation），例如在医学诊断路径建模中，医生可追溯AI的决策逻辑。

2.代码开发（the coder）

Anthropic 的 Claude 3.5 Sonnet 在代码生成等任务中表现出色，并且可以远程控制等功能实现跨软件的自动化操作。据俄亥俄州立大学测试显示，其在生物信息学代码生成任务中的准确率达 89%，远超同类产品。

Google 的 Gemini 2.0 Flash 凭借其卓越的代码生成能力和超快推理速度，在开发者社区获得广泛关注。在长文本处理方面，Gemini 2.0 Flash Thinking 支持高达 100 万 tokens 的上下文窗口，使得它不会跳过上下文中的大段信息。

3.开源生态（the opened ones）

自 Meta 于 2023 年发布 Llama 以来，开源 AI 生态呈现出蓬勃发展的态势。全球开发者和研究机构通过模型蒸馏、垂域指令微调、多模态扩展等技术，以开源模型为基底构建出多样化的衍生模型，构建出一个开源的生态。

例如，阿里巴巴开发的通义千问 Qwen 系列上线第一年就在企业端部署了9万个以上的实例，展示了开源模型在商业环境中的强大适应性和实用价值。

在科学和工程领域，开源 AI 生态正展现出强大的专业化能力。例如由多机构共同参与的 Semikong 项目，这款模型通过融入半导体设计公司的工作流程，充当数字专家，显著加快新芯片的研发和上市进程。北卡罗来纳大学团队通过调整 Llama 的注意力机制，使其能够解析领域特定语言 Quil，从而支持广东会计算模拟任务。

Nature 特别提到 Allen 人工智能研究所的 OLMo 模型。它作为完全开源模型，它不仅开放模型权重，还提供完整的训练数据与算法代码，成为研究模型偏差的热门对象。这种完全透明的开源方式与Meta的Llama形成了对比。

根据本文撰写时的排名显示（OpenRouter），在科学类别中，谷歌的 Gemini Flash 2.0、Anthropic 的 Claude 3.5 Sonnet 与我国的 DeepSeek-V3分列前三位，而 OpenAI 的 o3-mini 作为思考过程的先行者因速度限制暂居第五。

第二章 AI 赋能的科研：效率与局限

228 02.png

东京 Sakana AI 团队开发的“AI科学家”系统，虽能完成从文献综述到论文评审的自动化全流程，但其底层模型的选择直接影响产出质量。

一方面，局限来自于训练语料的系统性取舍和流行度偏见。例如，使用普通的 DeepSeek-R1 时，系统会回避涉及地缘政治的回答，切换至后训练版本的 R1-1776 后，则显著扩展了假设生成能力，但也增加了伦理争议性输出。

另一方面，在纯数学等抽象学科上，目前的大语言模型仍然处于劣势。伯克利实验室指出，当前自动化系统仍局限于数据丰富的领域（如材料科学），在抽象学科需融合符号编程的能力。

在模型之外，检索增强生成（Retrieval-Augmented Generation, RAG）正在改变知识生产方式。Perplexity AI 通过实时检索 1.2 亿篇学术论文，将大语言模型幻觉率降至 12%，优于通用模型的 33%。斯坦福大学开发的 Legal-RAG系统，在判例分析中准确率提升至 83%，但需警惕 17% 的潜在误导性引用。

终章：总结

当前阶段，AI 应定位为处理重复性任务的助手，而非替代人类科学家的创造力。Nature 提醒我们，在利用 AI 提升效率时，应始终保持对科学本质和伦理底线的警惕。

新闻中心

国际广东会科技前沿｜Nature 教你在科学研究中如何使用 AI 工具

引 言

第一章 主流AI工具功能解析：从推理到代码

第二章 AI 赋能的科研：效率与局限

终章：总结

引言

第一章主流AI工具功能解析：从推理到代码