日前从中国科学院空天信息创新研究院(以下简称“空天院”)获悉,空天院付琨研究员团队联合鹏城实验室正式发布自主研制的百亿级遥感解译基础模型――“空天・灵眸”3.0版,这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。
“空天・灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的行业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。今年3月起,研究团队与鹏城实验室深度合作,基于中国算力网“鹏城云脑Ⅱ”枢纽节点,采用512张N腾910显卡,历时数月攻关完成了在4亿张国产化多模态空天遥感数据样本上的预训练,基础模型参数规模首次超过百亿。
中国科学院空天信息创新研究院研究员孙显说:“我们如果把基础模型看作一个机器人,那么,‘参数’就相当于它的‘记忆细胞’和‘知识细胞’。如果参数规模小,则它能记住和处理的信息就相对有限,只能做一些比较简单的任务。参数规模越大,这两种细胞就越多,它就能捕捉、记忆和处理更复杂的信息,从而更加准确、精细地完成更困难、更复杂的任务。”
“空天・灵眸”3.0版内核工作架构是联合团队基于热传导,自主研发的一套小而精的原创性架构――受传热学物理思想启发,联合团队将场景目标间视觉语义传播建模为热能扩散过程,从而使该架构有效突破了遥感模型推理的性能和速度瓶颈,计算速度较传统结构模型提升2.4倍以上。
孙显介绍,这一架构实现了模型数据学习、推理等速度的大幅提升。例如,原来训练1000万张数据样本,需要大约300多块显卡,现在只需要1/3的数量,处理速度还提升了约2.4倍。
“空天・灵眸”3.0版目前已表现出极为优秀的泛化解译性能,在可见光、合成孔径雷达、热红外、多光谱等多传感器卫星数据基础上,拓展至航空遥感飞机、无人机等不同航空平台观测数据的自动化、高精度解译处理。孙显说:“尤其是航空大倾角成像过程中,极易出现畸变、遮挡、缺失等干扰,模型对此依然可以保持高精度的识别能力。”
目前,“空天・灵眸”3.0版在覆盖场景分类、目标检测、语义分割、变化检测等6大类任务的23个国际基准数据集上测试,相较于当前的主流模型,精度平均提升4%至10%,指标均达到领先水平,并已在应急、国土、海洋、住建等多个行业部署试运行,特别是在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越,为天临空地一体化应用提供了一套行之有效的解决方案。未来,研究团队将持续推动“空天・灵眸”3.0版在国民经济各个行业的落地应用。
分享让更多人看到
1.本站内容仅供参考,不作为任何法律依据。用户在使用本站内容时,应自行判断其真实性、准确性和完整性,并承担相应风险。
2.本站部分内容来源于互联网,仅用于交流学习研究知识,若侵犯了您的合法权益,请及时邮件或站内私信与本站联系,我们将尽快予以处理。
3.本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”您需知晓本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
5.本站是非经营性个人站点,所有软件信息均来自网络,所有资源仅供学习参考研究目的,并不贩卖软件,不存在任何商业目的及用途
暂无评论内容