首页    数据类型解决方案    气象卫星分系统方案分析
气象方案

气象卫星分系统方案分析

共享文件系统软件是用于把SAN磁盘阵列实现统一管理,实现文件共享并保障数据长期、有效存储的一类系统软件。中科蓝鲸BWFS是共享文件系统软件中的一种,是在国家863重大科研项目支持下,对标国际先进同类系统软件实现了自主可控,不但在国防军工、航空航天、政府科研机构、广播电视实现了国产替代,而且还在国际市场上展开正面竞争,取得了良好的效果。
BWFS(Blue Whale File System)是中科蓝鲸针对FC SAN/IP SAN环境推出的集群文件系统。它可以将多台FC或iSCSI磁盘阵列转换成支持多服务器并行处理的存储集群,提供高性能、可扩展的文件共享服务,并支持多机工作流或集群环境下的各种应用。BWFS的总体结构如图所示,系统主要由元数据控制器(MetaData Controller, 简称MDC)、应用服务器(Application Server,简称AS)组成。 2. layout服务:提供文件layout分配、映射、删除等布局服务,并维护数据块、间接地址块等存储资源状态。

气象遥感存储基础设施面临的挑战

目前,随着国防信息化要求不断提高,气象遥感处理与应用系统各项业务量的快速增长也带来数据爆炸增长,从各气象遥感处理与应用系统建设经验教训来看尤其是在非结构化存储方面,几何级增长的文件级非结构化数据是海量、高增长率和多样化的重要态势感知要素,文件存储作为支撑业务的重要环节,不仅要满足现在应用的需求,同时也要为未来数据增长提供良好的可扩展性。

在进行气象态势感知监测时,气象遥感数据与常规气象信息常常是互为补充的,但气象遥感数据通常因为其非结构化占用空间大、变化剧烈、对空间分辨率时间分辨率要求高、实时性要求高、延迟稳定性要求高等特点容易成为存储系统的瓶颈点,所以应作为最主要关注的信息要素:

暴雨

暴雨是影响国防战略战术部署的重要因素,形成暴雨的中尺度气象结构,可在气象遥感云图中得到反映。气象卫星云图可用于预报降水量和强降水中心区域,特别是对人员稀少和地面气象资料缺乏地区,卫星资料能提供唯一的预报依据。

对某些地区的暴雨和可能造成的灾情,可结合应用陆地卫星与气象卫星所获得的资料进行预报。利用当时的卫星影像与常年卫星影像进行对比,可获得有关洪水泛滥成灾面积和灾情程度的较准确的结果。

雾是一种常见的大气现象,也是影响国防战略战术部署的重要因素之一。当低层大气中的水汽达到饱和状态时,水汽凝洁物悬移浮在空中就形成了经常看到的雾茫茫的天气,也可以说雾就是在近地面产生的云。当这种云使水平能见度下降到<1km时,依据《地面气象观观测规范》的规定,就可以称之为大雾。长期以来,利用常规气象观测很难对于雾的分布进行确切的回答,难以有一个整体的认识。气象卫星的观测给解决上述问题提供了可能,在没有中高云遮挡的条件下,利用气象卫星可见光和红外云图及天气实况综合分析,可以判断出雾的分布范围。大面积、同步的卫星遥感监测有其不可比拟的优越性。将综合利用极轨气象卫星和静止气象卫星的可见光和红外通道资料,运用光谱分析法和结构分析法以及相应的处理技术,进行云雾自动分离技术与应用监测。

热带气旋

气象卫星是监测热带气旋的发生、发展、成熟和衰亡的最好工具,如静止气象卫星30分钟就可发回一份全圆盘数据资料,利用此资料经处理可得到各种卫星图像,估算出温度、水汽、风向、风速等参数,进而计算出台风强度和位置。可以确定热带气旋的中心位置及计算移向、移速,并估计台风强度。

 

在台风季节,通过对静止气象卫星观测到的热带气旋及共邻近区域云图的分析、判识和计算,可以确定热带气旋的中心位置、移向、移速、强度等实况信息。

 

 

 

云量、云厚和云迹风

利用气象卫星,可以进行大范围的云量和云厚分析,云迹风的气象产品提供了中低空风和高空风的风向和风速信息。

云量的观测是气象观测的重要项目,地面上只能观测到云的底部分布情况,而气象观测的是云的顶部,如果把两者结合起来,正确分析云量,在实际预报工作中十分重要。分析云厚在实际天气预报工作中十分重要,一是可以确定是否有降水的可能;二是在复杂气象飞行中可提供准确的预报。云厚的分析首先要确定云底高和云顶高。关于云底高,要根据天气实况、飞机报告、雷达探测和地面观测来确定。确定云顶高时,就需要利用气象卫星云图的红外通道测出云顶温度(层顶),联合地温推算求出云厚。

静止气象卫星导风产品,也称为云迹风产品,是指用连续几幅静止气象卫星图像追踪图像上示踪图像块(以下简称示踪云)的位移,并计算示踪云所代表的云或水汽特征所在的高度层次,以获得这些层次上风的估计值。

用静止气象卫星的图像估算风场,其主要任务是准确地追踪示踪云的位移,以及准确地指定示踪云中图像特征的高度。前者包含图像识别和几何学的两个学科问题,后者在用几何学方法不能达到所需精度的情况下,要利用示踪云中的像元在不同通道处的辐射测值进行估算,这主要是一个物理学问题。

用红外和水汽两个通道的数据共同指定云迹风的高度。首先用红外和水汽通道图像测值的分布,初判示踪云中的图像特征在高层还是在低层。

如果云的高度在水汽通道权重函数峰值高度(400hPa上下)以上,那么红外与水汽通道观测值之间存在线性相关。求出其关系回归线的斜率(斜率应大于阀值)。这时用关系回归线与红外水汽亮温相等关系式的交点求出云迹风的高度。

 

如果云的高度在水汽通道权重函数峰值高度(400hPa上下)以下,那么水汽通道观测不到云。在示踪云目标区内水汽通道测值为常数,此时用最低红外亮温求出云的高度。

 

 

大气探测与大气物理参数反演

大气探测是指利用气象卫星大气探测器光谱通道遥感数据进行大气物理参数反演的过程,通过计算获得大气温度、湿度和位势高度等信息产品,比如典型的数值产品:

15个标准层的大气温度

15个标准层的位势高度

6个标准层的大气湿度

9个标准层的地转风

红外通道晴空辐射亮温和反照率

微波通道亮温

以及整层大气的推导产品,如臭氧总含量、可降水总含量、云顶气压、大气中水汽含量、大气稳定度指数、大气臭氧总含量、云参数(云量、云顶高度和云顶温度)等。

气象卫星大气探测产品能客观地反映大气的垂直结构,因此,在数值天气预报、天气分析、气候研究和气候预测等方面有着广泛的应用前景。卫星大气探测资料可弥补广阔海洋、高原、沙漠和两极地区探空资料的不足,用于补充数值天气预报的初始场。将以上反演的大气参数,即大气温度、湿度和位势高度与无线电探空资料同化,用作数据预报的初始场。;也可以将卫星探测的辐射率值进行晴空检验,经筛选的晴空辐射率值直接与其他初始场资料进行变分同化,用作数值预报的初始场,以弥补常规观测资料的严重不足,提高数值预报的预报精度和预报时效。另外,随着气象卫星大气探测产品的累集和存档资料时间序列的增长,大气探测产品在气候分析和气候探测方面的研究正在逐步深入,并取得了重要的进展。

台风的生成到登陆和消亡,以微波数据AMSU-B通道的亮温图像为例,通过时间序列和对应通道在不同高度层面上的图像,可以看出台风在太平

 
 

洋的发展和在登陆后的消亡过程。

亮温监测图

综上所述,从影响国防战略战术部署的重要气象监测素需求来看,气象遥感处理与应用系统业务非结构化数据量、性能需求以指数级增长,业务对数据要求全天候及时高效的访问,现有文件存储系统从管理、容量、性能、扩展和可靠性上都面临诸多挑战:

1. 存储孤岛:现有多台独立运行的存储服务器或SAN/NAS存储设备,各个厂商存储设备无法形成统一命名空间,各环节各组织间不能实现信息共享,存储系统的整体利用率低下。

2. 数据可靠性:存储数据的来源越来越多样化,对数据可靠性提出更高的要求,在满足数据可靠性的同时,还需要平衡硬盘利用率,避免牺牲大量的存储空间(原始数据几倍的存储空间)来满足数据可靠性要求。

3. 系统性能瓶颈:传统架构的性能无法线性增长,面临海量数据的低时延要求时,往往无法快速响应应用的读写请求,尤其气象非结构化数据对低延迟和延迟的稳定性都有很高的要求。

4. 扩展能力不足:不能进行灵活的扩展以满足快速变化的业务需求、确保数据可用及业务不中断,缺乏可扩展性或大规模文件处理能力。

5. 管理维护难度大:随着应用不断发展,现有的数据规模已经超出原有设计的规模,存储设备的增多带来维护成本居高不下,管理复杂,需要多个IT管理人员维护多套不同的存储设备和网络,TCO急剧上升。

上述问题需要引起重视,在本期项目建设过程中有效解决避免类似的情况发生。

​​​​​​​2.空间和时间分辨率大幅提升带来更高的遥感数据处理要求

遥感的英文是Remote Sensing”, 意即“遥远的感知”。其科学含义一般理解为:在遥远的地方,感测目标物的“信息”,通过对信息的分析研究,确定目标物的属性及目标物之间的关系。也就是说:不与目标物接触,凭借其发来的某些信息,识别目标。

气象遥感处理与应用系统也是一种典型的遥感系统,在遥感标准产品处理环节,卫星、航空遥感数据到达地面处理系统后,会进行数据录入和处理,经帧格式同步、解压缩、解扰后生成0级数据和辅助数据文件与浏览图像,生成相应编目信息。编目信息立即进行发布,供数据查询、浏览和获取。再根据自动化产品生产策略,对获取的相应0级数据和辅助数据经过辐射校正和系统几何校正处理得到1级和2级基础类数据产品,再经过结合地面控制点进行几何精校正、结合数字高程模型进行几何地形校正、融合和参量反演等等一系列处理得到3级以上增值类数据产品。各级产品经质量检查合格后进行发布,用户对数据产品进行查询、订购和下载。遥感数据要成为有用的信息应用到下游应用当中,还会在各行业应用单位经过更进一步的数据处理与信息提取,进行高级产品与专题产品的生产。并最终形成供支撑决策的各行业信息例如:森林火场过火面积与火势蔓延趋势,地震后塌方地点数目与灾情,堰塞湖容积估算,冰雪灾害监测与预报,国土资源土地调查,空间信息系统底图以及标注,城市规划新增建筑,海洋油污染监测,粮食估产等等。

随着应用的拉动和支撑技术的发展,遥感数据量近年存在大幅增加的趋势。

首先,识别目标对清晰度的需求是天然的,因为其直接影响到空间信息的精度,所以无论是人工研判使用还是AI智能处理对清晰度的需求都是越来越高的。随着高分辨率遥感卫星的发展也越来越支撑了清晰度需求的满足。比如有的商用卫星1级标准产品18.5km×18.5km每景的数据量为:4米分辨率多光谱影像150MB1米分辨率全色影像603MB,如果是每景范围更大或者分辨率越高的遥感卫星,数据量将会更大。

其次,信息时间精度的需要。随着各行业对遥感数据的应用发展,很多行业都有多个历史时点这类与时间相关的遥感影像需求用于满足对比、发现、管控和预测的业务需要。历史时点的间距越小版本越多其时间精度也就越高,信息量也就越大,并且随着应用发展和时间推移新的时间点信息也需要增加进来,比如每景1个历史时间点的多光谱+全色影像753MB那么3个时间点的影像就需要2259MB可用存储空间。尤其是随着卫星视频技术的发展,比如有的视频卫星1级标准产品11.0 km×4.6km每景的数据量为:0.92米分辨率红绿蓝光谱2412000*5000分辨视频1229MB

遥感数据处理的生产过程和数据量大幅增加的情况对集群统一存储建设带来了更高的要求:

1. 集群统一存储需要提供高性能文件共享服务;

首先,从遥感数据处理的过程可以看出,步骤与步骤之间紧密地联系着,需要存储能互联互通具有良好的文件共享性,必须要做到下一处理环节马上能够读取到上一处理环节的输出,实现业务流的数据传输零拷贝以保证应急处理能力。其次,遥感数据处理的每一个处理步骤都有其独特性,各处理步骤对存储系统特性(包括单机单文件性能、多机并发性能、文件并发性与随机性等)存在巨大差异化的需求,有的关键处理步骤只有直接通过SANFS客户端直连提供的高性能文件共享服务才能较好满足遥感数据处理大压力的文件存储访问。尤其是在在遥感数据高级产品行业处理与应用环节性能需求方面,比如正射校正和锐化融合之后的格式转换业务因树状索引中粒度写入IO对存储随机处理能力要求较高。并且为避免厂商锁定,集群统一存储应具有跨厂商设备带外管理构建高性能文件共享的能力。

2. 系统建设既要关注实际可用存储容量又要关注存储整体投入和产出;

要满足各行业应用对遥感数据的空间信息精度、时间信息精度的需求,系统建设需要为已有和发展提供足够可用存储空间才能支撑业务应用可持续增长;清晰度每增加1倍,遥感图像栅格数据容量就会增加3倍,并且通过限制清晰度来控制容量的方式越来越不被用户所接受;多个历史时点、多版本遥感图像栅格数据并存,每增加1个时间点,遥感图像栅格数据容量就会增加1倍,版本越多越有利于遥感数据用户的对比、发现、预测和管控目标的达成。基于前述两点容量倍增的原因,集群统一存储必须既要满足越来越大的可用容量需求又要合理控制成本,这就要求用户在选择技术路线是注意空间利用率这一重点因素。同时存储分级和归档迁移功能可以把合适的数据存储在合适的介质,从而更好的提升存储投资的性价比;并且,需要常被访问的数据通常只占总量的20%,分级和归档迁移后在线容量的缩小更有利于镜像保护等高可靠措施的实施,进而实现高性价比下的高可用,可在当期或将来予以考虑。