关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » 人工智能 »伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用

    伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用

    2025-05-29 20:36:22 出处:中国存储网
    分享

    中国存储网消息,近日,伯克利实验室与 Meta 合作发布了开放分子 25 (OMol25) 和通用原子模型 (UMA) 供公众使用。Open Molecules 是超过 1 亿个 3D 分子快照的集合,其特性是使用密度泛函理论 (DFT) 计算的。DFT 是一种非常强大(且计算成本高昂)的工具,用于模拟原子相互作用的精确细节,使科学家能够预测每个原子上的力和系统的能量,这反过来又决定了决定更大规模特性的分子运动和化学反应,例如电解质在电池中的反应或药物如何与受体结合以预防疾病。

    伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用

    OMol25 使用高性能量子化学程序包 ORCA(版本 6.0.1)构建,包含大型原子系统的模拟,到目前为止,没有大量计算资源的化学家无法获得这些模拟。以前的分子数据集要小得多,模拟只包括 20 到 30 个原子(每次计算)和有限的元素。OMol25 需要 60 亿个核心小时的计算时间来创建 10 倍大的数据集,包括许多不同元素之间的复杂交互。Meta 的基础 AI 研究 (FAIR) 团队利用公司庞大的全球计算资源网络来运行数百万次 DFT 模拟,利用世界上一部分人睡着而不浏览 Instagram 和 Facebook 时的空闲带宽。

    此外,Meta 还分享了其通用原子模型 (UMA),这是一种基于机器学习数据的工具,用于模拟原子在各种材料和分子中的相互作用。与 Microsoft 的 Aurora 天气模型一样,UMA 也基于现有数据进行训练,这些数据包含超过 300 亿个原子,这些数据是 Meta 在过去五年中发布的所有数据集中包含的,包括那些同时具有分子和材料的数据集。

    UMA 为研究人员提供了一个基础化学模型,该模型提供了更准确的预测并更好地了解了分子行为。它还可以作为下游用例和微调应用程序以及开发自己的模型的多功能基础。

    美德纽带

    使用传统 HPC 结果训练机器学习模型的一个示例,或者以 UMA 为例,机器学习原子间电位 (MLIP) 在数值 DFT 数据上进行训练,可以提供相同口径的预测,但比传统数值方法快 10000 倍。在标准计算系统上运行时,模拟大型原子系统的能力总是遥不可及的。MLIP 充当数值 DFT 的替代项,需要与传统 DFT 计算相同的输入:原子位置、原子序数以及自旋和电荷信息(可选)。

    MLIP 方法的有用性取决于它可用于训练的数据的数量、质量和广度。OMol25 拥有 1 亿个 3D 分子快照,是用于训练的化学多样性最强的分子数据集,因此增强了 MLIP 模型。如发现的良性循环中所述,现有的传统 HPC(数值)数据用于训练 AI 模型,然后产生更多的“DFT”结果(使用快速 MLIP 模型),这些结果可能会反馈到循环中,以产生更大、更多样化的结果集。

    OMol25 和 UMA 相结合,有可能使用基于数据的 AI 模型而不是直接计算来解锁分子和材料研究的新功能。Meta 将此视为开放科学发布的下一步,以加速原子级材料设计。他们还与劳伦斯利弗莫尔国家实验室 (Lawrence Livermore National Laboratory) 等合作伙伴合作,将这些数据集和模型扩展到聚合物等新类别的分子。

    “我认为这将彻底改变人们进行化学原子模拟的方式,能够自信地说这真是太酷了,”项目联合负责人、伯克利实验室的化学家和研究科学家塞缪尔·布劳 (Samuel Blau) 说。他在团队中的同事来自六所大学、两家公司和两个国家实验室。

    “我们非常高兴能与社区合作构建这个数据集,看看它将带我们去哪里创建新的 AI 模型,”Meta 基础 AI 研究 (FAIR) 实验室的研究总监 Larry Zitnick 说。

    OMol25 和 UMA 代表了 AI 在发现的良性循环中加速的另一个例子。基于数据的科学和工程基础模型的持续开发将继续加速发现过程。论文和数据可在此处获得:

    • 下载 OMol25 数据集和模型
    • 阅读 OMol25 论文
    • 下载 UMA 模型
    • 阅读 UMA 论文
    超算应用 AI模型 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    NDATA电子档案管理系统应用深度剖析

    腾讯云安全发布云上红蓝对抗防护神器,破解重保盲区与溯源难题

    腾讯云天御发布海外交易风控解决方案,AI+情报双擎护航企业全球化安全

    庆祝 iPhone 问世 20 周年,Appl或将推出一款屏幕无边框的手机

    小米正在开发自己的玄戒 XRing 01 SoC,采用3nm 级工艺

    微信小程序开发公司选择行业建议,市场上不容错过的微信小程序开发公司盘点

    2025中国图象图形大会顺利举行,合合信息AI助力打造视觉安全防护体系

    IBM Think 2025:Gen AI 的主流化和 Agentic AI 的开始

    HPE宣布扩展 Aruba Networking 和 GreenLake 云合作

    RSA Conference 2025:Superna 推出数据攻击面管理器以重新定义数据层的风险暴露管理

    IT头条

    苹果正在考虑让 Siri 成为 ChatGPT 的直接竞争对手

    22:41

    小米发文:捏造关于小米的虚假信息的网络黑公关案件,已经告破

    22:37

    车载数据存储需求愈来愈高,车规级UFS 4.0将变得愈发重要

    21:55

    Dell 2025 科技日:通过基础架构、解决方案和服务推动企业 AI 创新

    21:48

    SAS 推出AI治理地图

    01:51

    技术分享

    深入分析SQL字符串限制长度漏洞

    PHP 和 MySQL 开发的8个技巧

    解析向MySQL数据库的表中录入数据的方法

    高性能服务端漫谈

    windows 7 图片预览问题 图解Windows7无法预览图片设置方法

    深入浅出SQL之左连接、右连接和全连接

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。