Articles

As large language models (LLMs) continue to improve at writing code, a key challenge has emerged: enabling them to generate complex, high-quality training data that actually reflects real-world programming. Currently, most data synthesis methods rely on simple code snippets as…

FEA-Bench:首个仓库级新功能实现基准,让大模型更懂软件开发
编者按:当前,大语言模型在代码生成领域已展现出惊人的能力,但能否胜任真实软件开发中的“新增功能实现”任务,仍是一个关键未解的问题。对此,微软亚洲研究院与北京大学联合发布了首个专注于仓库级新功能实现的基准测试 FEA-Bench,填补了评估体系中的重要空白。该测试集构建于真实开源项目的 pull request (合并请求),覆盖1400多个高质量任务,系统评估了主流大模型在复杂工程任务中的表现。F…

特征树驱动的数据合成框架,加速构建高质量模型基座
作者:工程与基础架构组 编者按:随着代码大模型能力的不断增强,高质量指令数据的构造成为释放其潜力的关键。然而,现有方法普遍依赖单一的代码片段作为构造种子,限制了数据的复杂度与多样性。近日,微软亚洲研究院联合厦门大学、清华大学提出全新特征树驱动的数据合成框架,通过建模代码语义层级关系,实现了对合成代码复杂度的精细控制,并支持从函数级到多文件级的多样任务生成。基于该框架训练得到的 EpiCoder 模…

PEACE: 以地质图GeoMap为起点,敲开地质学AI应用研究的大门
编者按:地球上每年约发生500多万次地震,平均每天有上万次,无论强度如何,地震总是令人恐惧。那么,人工智能技术的发展是否能够在地质灾害预警中提供高效的数据处理和预测能力?答案是肯定的,但最有效的方案是将人工智能与传统方法相结合。 地质图是中长期地震预报评价的重要依据之一。地质学家通过分析地质图,可以了解特定区域的地质历史与构造特征,并结合活动构造图、地壳稳定性等资料,研究地震的时空分布规律及其地质…