数据:气象融入现代科学的纽带--许小峰VIP专享VIP免费

数据:气象融入现代科学的纽带
许小峰
2023年5月24日
1
2023跨界融合创新应用合作发展大会主题报告
数据信息与现代气象科学的建立
数据信息挖掘与科学范式的转变
2
2023跨界融合创新应用合作发展大会主题报告
数据信息与现代气象科学的建立
早期的气象学,有观察,但没有数据目前世界公认最早的系统性阐述气象科
学的论著《气象汇论》(Meteorologica)是由古希腊著名学者亚里士多德于公
元前340年前后撰写完成的。书中对地球系统各类现象和变化进行了全面的论述、
分类和解释,体现了逻辑推理的魅力。如黑格尔在评价亚里士多德的物理学时所
言,“亚里士多德的物理学著作主要是哲学的,而不是实验的。
15世纪欧洲文艺复兴后,哥白尼、开普勒、伽利略、笛卡尔、牛顿等重量级
的科学家先后登场,亚里士多德的物理学不断遭遇挑战和纠正,如地心说、自由
落体等。其中特别是“近代科学的奠基人”伽利略,对当时人们认识世界方式产
生了重要影响,提出了该相信谁的问题。伽利略1615年在一封信中对科学研究应
遵循的原则提出了明确观点,“在自然问题的争论中,……应顺应最有价值的经
验和相关的实证,……科学家可以通过实验向自然提出问题,然后用获得的数据
来做出解释。
从中可以看到,数据与实证被认为是进行科学探索的重要途径和检验标准。
伽利略将定量、实测的方法引入到气象领域,改变了仅靠观察、思辨而缺验证、
量化的研究方式,推进气象学走向现代科学。
3
2023跨界融合创新应用合作发展大会主题报告
数据:气象融入现代科学的纽带许小峰2023年5月24日12023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立数据信息挖掘与科学范式的转变22023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立早期的气象学,有观察,但没有数据。目前世界公认最早的系统性阐述气象科学的论著《气象汇论》(Meteorologica)是由古希腊著名学者亚里士多德于公元前340年前后撰写完成的。书中对地球系统各类现象和变化进行了全面的论述、分类和解释,体现了逻辑推理的魅力。如黑格尔在评价亚里士多德的物理学时所言,“亚里士多德的物理学著作主要是哲学的,而不是实验的。”15世纪欧洲文艺复兴后,哥白尼、开普勒、伽利略、笛卡尔、牛顿等重量级的科学家先后登场,亚里士多德的物理学不断遭遇挑战和纠正,如地心说、自由落体等。其中特别是“近代科学的奠基人”伽利略,对当时人们认识世界方式产生了重要影响,提出了该相信谁的问题。伽利略1615年在一封信中对科学研究应遵循的原则提出了明确观点,“在自然问题的争论中,……应顺应最有价值的经验和相关的实证,……科学家可以通过实验向自然提出问题,然后用获得的数据来做出解释。从中可以看到,数据与实证被认为是进行科学探索的重要途径和检验标准。伽利略将定量、实测的方法引入到气象领域,改变了仅靠观察、思辨而缺验证、量化的研究方式,推进气象学走向现代科学。32023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立伽利略发明制作出了温度计(GalileoThermoscope),利用空气在顶部圆球内的热胀冷缩来推动玻璃管中水位高度的变化,达到测量温度高低的目的。而与伽利略同时代的人依据同样的原理,以这一温度计的设计为雏形,经过多次改进最终达到了可以应用的阶段。随后,不仅测温仪器不断得到了改进,测风、测湿、测压等设备也先后问世。。存放在佛罗伦萨伽利略博物馆的伽利略温度计和设计图42023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立曾给与了伽利略重要支持并深受伽利略影响的塔斯卡尼大公斐迪南二世·德·美的奇除在温度计、气压计等设备研制中也做出了重要贡献外,还组织建设了世界上第一个观测网:美第奇气象观测网络(1654-1670),采用同样的温度计,由11个观测站组成,7个设在意大利境内,另外4个分别在奥地利的因斯布鲁克(Innsbruck),波兰的华沙(Warsaw),德国的奥斯纳布吕克(Osnabrück),法国的巴黎(Paris)。美的奇气象网络在意大利境内的7个站点和所使用的温度计52023跨界融合创新应用合作发展大会主题报告6气象观测仪器的进步大大地改进了观测记录,观测资料的逐步丰富和观测网的逐渐建立,促生了第一张天气图的出现。1820年,德国H.W.布兰德斯将过去各地的气压和风的同时间观测记录填入地图,绘制了世界上第一张天气图。1851年,英国J.格莱舍在英国皇家博览会上展出第一张利用电报收集各地气象资料而绘制的地面天气图。1863年9月7日,在法国绘制完成了第一张实时欧洲区域的等压线图。气旋型次级气旋型V型反气旋型楔型直线型鞍型英国人根据气压场分布总结出的天气模型6在法国绘制完成的实时欧洲区域等压线图2023跨界融合创新应用合作发展大会主题报告7在这篇文献中,V.皮耶克里斯一开始就指出,如果可以根据物理定律推断空气运动,必须有两个必要并且充分条件:一是必须知道空气准确的初始状态;二是必须知道空气从一个状态到另一个状态的准确规律。V.皮耶克里斯指出可以算出这7个相互独立的方程,从而计算出7个未知参数(也就是:U、V、W、T、P(气压)、p(密度)、q(比湿)),来推断空气运动。71904年,皮叶克尼斯在斯德哥尔摩物理学会发表了名为《一种天气预报的理性方法》的演讲。他把数学方程式应用到原始大气数据信息中,提出一个开展数值天气预报的计划,也是对未来天气预报技术发展的重大推演。2023跨界融合创新应用合作发展大会主题报告81950年,美国科学家查尼(Charney)、冯·诺伊曼(JohnVonNeumann)等人成功计算出了历史上第一张数值预报天气图,对现代气象业务与科技产生了重大且长远的影响。2023跨界融合创新应用合作发展大会主题报告然而,探索与实践的进程并不总是像最初人们认为的那样乐观,著名美国气象学家洛伦茨(Lorenz,1963)发表了一篇堪称经典的论文“确定性的非周期流”,用一个非常简单的云对流数值积分预报模型,通过计算发现大气运动中存在的混沌现象直接限制了天气的可预报性。洛伦茨的发现(即著名的“蝴蝶效应”)在自然科学和社会科学界产生了广泛影响。洛伦茨对流方程中的数值试验非周期性随时间逐渐增强92023跨界融合创新应用合作发展大会主题报告10从长期平均而言,风或温度的微小误差大约4天内会翻了一番。根据目前的观测精度,这意味着一周的预报应该是可以达到的,而一个月的预报则不可能。(洛伦茨,1982)至少在12天以内,数值模式的可预测性是存在的。(洛伦茨,1973)欧洲中期数值天气预报中心ECMWF的模式研发进程表明,10天的天气预报准确率近年来在50%附近徘徊,目前还没有超过洛伦茨的判断。洛伦茨对数值天气预报的可预报性做了深入研究后,给出了既不悲观也不乐观的结论。每个运动尺度都具有内在的有限的可预测范围。……“积云尺度”的运动可以在一小时内预测,“天气尺度”的运动可以在几天内预测,更大尺度的运动可以提前几周预测。(洛伦茨,1969)2023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立数值天气预报的成果令人鼓舞,不确定性的论断又多少令人沮丧,气象学家在不断改进数值模式本身性能的基础上,在两个环节上做出努力,一是持续改进观测系统,二是通过集合预报改进模式结果的不确定性。1955年WMO第二次大会在日内瓦举行,明确提出要建立一个完整、强大的全球气象观测和数据收集系统,并为此开展了一系列卓有成效的工作。112023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立1957至1958年,WMO联合国际大地测量与地球物理联合会(IUGG)及其上级组织国际科学联合会(ICSU)共同推进了国际地球物理年(InternationalGeophysicalYear,IGY)活动,针对南半球常规气象信息的空缺开展了联合观测和数据收集,成功绘制了包括热带区域的完整全球天气图,诸多杰出的科学家共同在联合国框架下参与了该计划。1960年4月1日美国成功发射第一颗气象卫星TIROS-1后,进一步促进了这一领域的合作快速发展。1960年4月1日美国成功发射第一颗气象卫星TIROS-11967年第五届世界气象大会正式通过了《世界天气监视网计划和实施方案》(WWW),经过约十年的努力,在WMO协调下,成功完成了GOS、GTS和GDPS建设,从而使全球气象观测资料可以迅速集中到世界气象中心,经过加工处理变成成品后,又再通过这条环路迅速进行分发。国际地球物理年122023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立随着全球气象探测业务的推进,为了推进对全球大气的研究,WMO和ICSU于1965年又共同提出组织了全球大气研究计划(GARP)的方案,筹划了10年后,决定进行一次大规模全球性试验,即“第一次GARP(全球大气研究计划)全球实验”,简称FGGE(FirstGARPGlobalExperiment),于1978~1979年实施。第一次GARP全球实验FGGE70多个国家参与了实验,以WWW为基础,补充了大量海洋、卫星等全球资料。FGGE的实施极大推动了大气资料的分析与应用。132023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立随着WMO综合观测系统的完善,积累了大量不同类型的历史和实时数据,如何融合大量不同类型探测资料,得到完全反映出天气气候变化动力热力特征和物理意义的高质量、高分辨率、长时效、有机融合的全球观测资料则成为大气科学研究面临的严峻挑战。142023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立随着数值天气预报(NWP)技术的发展,特别是通过资料同化技术使各类观测资料与数值模式相融合‚提供具有物理约束的初始条件。这一进步促使科学家于上世纪80年代开始提出要利用NWP同化技术获取长期、连续、均匀、有约束的所谓大气“再分析”资料。20世纪80年代开始,美国、欧洲、日本、中国等先后组织了全球大气资料再分析计划,为研究、认识天气气候变化规律提供了重要支撑。什么是再分析?15再分析资料发展四个阶段2023跨界融合创新应用合作发展大会主题报告Epstein(1969)和Leith(1974)先后提出了动力随机预报理论框架和实用的集合预报法,开拓了以不确定性方法来解决不确定性问题的新途径。集合预报的产生是针对对大气运动混沌的性质而设计出的解决方案。已在各国数值预报业务中得到广泛应用。集合预报在提高预报可靠性、发现模式系统误差、确定概率预报量化分布等方面体现出优势。这种方法并不是在追求做出更准确的单一预报,而是一种可以定量估计预报误差分布的动力学方法。在这种模式设计的构架下,大气模式的初始场、模式的物理过程、模式本身都不再是唯一,而是依据特定规则设计的一个群,模式的最终预报值也不是唯一结果,而是概率分布。数据信息与现代气象科学的建立2023跨界融合创新应用合作发展大会主题报告欧洲数值预报中心提出的2025年发展目标是要将预报时效提升到两周,也是以集合预报方法为基础的。《自然》杂志2015年9月发表了介绍数值预报模式发展的文章“数值天气预报寂静的革命”(TheQuietRevolutionofNumericalWeatherPrediction),其中以英国气象局36小时降水集合预报为例介绍了这种方法降低不确定性的效果。英国降水36小时集合预报示意图数据信息与现代气象科学的建立2023跨界融合创新应用合作发展大会主题报告小结:观察、分析、逻辑、实证、定量、推演、计算构成了现代大气科学发展的基本范式,而数据是贯穿其中、不可替代的重要因素。数值预报方法的成功与发展实现了大气科学领域一场寂静的革命,从目前提升数值预报能力的的路径看,一是通过完善和优化基础观测系统和数据同化方法,减少初始场的误差;二是继续改进数值模式和完善物理过程,提升模式预报能力,三是通过集合方法改善不确定性问题的影响。182023跨界融合创新应用合作发展大会主题报告数据信息与现代气象科学的建立数据信息挖掘与科学范式的转变192023跨界融合创新应用合作发展大会主题报告ECMWF2017年末,召开了一次名为“揭开灰色地带的谜底”(Sheddinglightonthegreyzone)学术会议。灰色地带,即在数值天气预报和气候模拟活动中,确定性的动力过程无法完整解析或尚缺乏成熟理论依据的区域,这需要AI的帮助。欧洲中心的AndyBrown先生给出了一些涉及灰色地带的因素:长波/短波辐射、对流、云与微物理、大气成分、边界层、湍流混合和重力波拖曳等。20数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告21经验科学(Empiricalscience):达芬奇用画稿描述流体流场(1700年以前)理论科学(Theoreticalscience):用Navier-Stokesequation描述流程(1700年至1950年)计算科学(Computationalscience):用计算机求解N-Sequation(1950年至2000年)数据科学(Datascience):用基于神经网络的新模型(2000年以后)Waterflowaroundanobject,insideaholeandoveranobjectAI技术近期取得了令人瞩目的进展:大模型(FoundationModel)使海量数据成为新的科学研究基础,构造完全基于数据的、开放协同的创新模式,且已被科学界逐渐接受。美国科学家,计算机和数据库领域的传奇人物、1998年图灵奖获得者吉姆·格雷(JimGray)2007年曾发表演讲,认为“计算正在从根本上改变科学的实践(computingwasfundamentallytransformingthepracticeofscience.)”,并把科技发展史总结为四个范式阶段。数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告2021年8月份,一个由一百多名斯坦福大学研究人员组成的团队发表了一篇214页的研究报告《OntheOpportunitiesandRiskofFoundationModels》,深度地综述了当前大规模预训练模型面临的机遇和挑战,文中提到,目前使用的转化器模型(TransformerModels)、大型语言模型(LargeLanguageModels,LLMs)和其他仍在构建的神经网络是基础模型的重要新类别。关于大模型的机会与风险一个基础模型可以集中来自各种方式的所有数据信息,然后适用于广泛的下游任务。22数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告大模型(FoundationModel)或基础模型是在海量数据集上训练出的人工智能神经网络,可以处理多种类型的工作。通过大规模深度学习预训练,达到捕获知识和信息抽取的目的,并将这些信息存储到超过亿级参数中的大模型。在应对不同场景时,则不需再从0开始,只要对少量样本进行微调,这种方式极大扩展了模型的泛化能力。23数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告马斯克也惊呼:“我们离强大到危险的AI不远了”。近期,引起社会震动的事件是ChatGPT的发布,其全称为“chatGenerativePre-trainedTransformer”,即生成型预训练变换模型。它是美国公司OpenAl在2022年11月30日发布研发的对话机器人程序,能用于问答、文本摘要生成、机器翻译、分类代码生成和对话。预训练是机器学习中的一种方法,它指的是使用大量的预先数据训练一个模型,使其能够从数据中学到一些基础知识和模式,并将这些知识用于更加特定的任务。ChatGPT在没有任何特定任务目标的情况下,通过预先学习整个语言模型的方法,然后再在特定的任务上调整模型的参数。相比其他Al,ChatGPT具有更高的语言理解能力,更好的语言生成能力,以及更高的适应性。24数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告2021年4月22日,阿里达摩院联合南京信息工程大学、国家气候中心、国家海洋环境预报中心等机构共同举办的AI气候预测大赛迎来了终极决赛。全球13支团队研发的AI算法,取得了比《Nature》论文模型更优的性能,挖掘出了AI在气候预测领域的新算法,超过了2019年发表于《Nature》的成果。2019年9月,南信大罗京佳教授与韩国研究团队共同发表了一项研究成果,这篇论文名为“Deeplearningformulti-yearENSOforecasts”,论文中,他们利用卷积神经网络(CNN)对厄尔尼诺现象进行了成功预测,登上了《Nature》杂志,产生了广泛影响。25数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告2021年。谷歌又推出Metnet-2,将预报时效延伸至12小时,同时保持1公里的空间分辨率和2分钟的时间分辨率。为了捕捉足够的输入背景,MetNet-2使用来自2048公里×2048公里区域的输入观测数据,并采用新颖的神经网络结构元素,以便有效地处理大背景。METNET2020年初谷歌构建了基于深度学的降水预测模型MetNet,实现了1km空间分辨率以及2min时间分辨率的高精度预报,在实际测试中超过了NOAA的数值预报结果,并实现了全美范围内8小时预报,为通过AI解决复杂气象问题提供了新的解决方案。26数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告272021年9月29日,谷歌母公司Alphabet旗下顶级英国AI研究机构DeepMind在《自然》杂志上发表文章《用雷达深度生成模型进行有技巧的降雨临近预报》(Skilfulprecipitationnowcastingusingdeepgenerativemodelsofradar)。DeepMind专注于预测临近降雨量:提前2小时预测降雨量、时间和地点。采用深度生成模型方法DGMR,以过去的雷达数据为基础,对未来的雷达数据作出可信的预测。研究团队通过比较CPU(10核心AMDEPYC)和GPU(NVIDIAV100)硬件的速度来评估采样速度,发现生成每个样本,CPU所用平均时间为23.7秒,GPU为1.3秒。利用过去20分钟的观测雷达资料,用降雨深度生成模型(DGMR)提供未来90分钟的概率预测。2023跨界融合创新应用合作发展大会主题报告用ClimaX对关键天气变量(温度:T2m,T850,风:U10,V10)的预测结果进行可视化(未来6小时至1个月)。ClimaX在在ERA5数据上进行调整时,在中分辨率(1.40625˚)下,在中短期预测上表现与IFS相当甚至更好,而在长其预测上则有更大的优势。2023年1月,微软团队发布了第一个基于AI的天气和气候基础模型ClimaX。28数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告2022年11月,华为团队在学术文章在线发表服务器arxiv上提交文章《盘古:一个三维高分辨快速准确的全球天气预报系统》,首次在中长期天气预报上超过了传统数值方法。盘古气象大模型训练和测试均在ERA5数据集上进行,据介绍超过了现有的数值预报方法,五天预报均方根误差显著低于欧洲气象中心IFS和AI方法(FourCastNet)。另外,在一张V100显卡上只需要1.4秒就能完成24小时的全球气象预报,相比传统数值预报提速10000倍以上。盘古模型地表温度72小时预报与ERA5资料对比29数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告2022年12月,DeepMind和Google在arXiv上发表文章,推出GraphCast,是一种基于机器学习(ML)的天气模拟器,可以很好地扩展数据,且可以在10秒内生成60天的天气预报。称其性能超越了世界上最准确的确定性中期天气业务预报系统(outperformsthemostaccuratedeterministicoperationalmedium-rangeweatherforecastingsystemintheworld)。30数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告31从AI的冲击已可以感受到科学范式可能发生的重要变革,美国科学史家,科学哲学家,托马斯·库恩(ThomasSamuelKuhn)1962年发表了他最重要的科学哲学著作《科学革命的结构》(TheStructureofScientificRevolutions),提出了科学和科学思想发展的动态结构理论,第一次明确地使用了该理论的核心概念“范式”。库恩认为科学的实际发展是受范式制约的常规科学以及突破旧范式的科学革命的交替过程,引导科学哲学界再认识论上出现了一次大变革。从实践检验的角度,或许我们正处于一个重要的范式突破点。数据信息挖掘与科学范式的转变2023跨界融合创新应用合作发展大会主题报告小结:对科技发展经验科学、理论科学、计算科学、数据科学四个阶段范式的概括和总结,及AI大模型的成功为我们认识当前大气科学发展的可能走向提供了可参照、借鉴的视角,应引起重视和关注。范式的改变更强化了数据的地位,获取和处理好数据在新的变化中将发挥更为重要的作用。322023跨界融合创新应用合作发展大会主题报告谢谢!332023跨界融合创新应用合作发展大会主题报告中国地理信息产业协会公众号——关注地信产业精彩了解协会最新动态——感谢各位院士专家为2023跨界融合创新应用合作发展大会作精彩报告并授权分享!请关注协会公众号,经报告人同意后,会后陆续分享报告PPT(提供下载)等大会精彩内容!转发请保留此页。分享请注明“来源:中国地理信息产业协会”。2023跨界融合创新应用合作发展大会主题报告

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱