Google现在研究以机器学习来即时预测天气,目前这项研究仍在初期阶段,但已经能以1公里的预测分辨率,预报接下来6小时内的降雨,总延迟时间只有5到10分钟。Google提到,利用机器学习进行预测,仅需要雷达数据且不需要进行实际的物理仿真,由于在训练好的模型上进行预测运算成本很低,因此即便利用高分辨率的数据,也能执行接近即时的预测。
天气很大程度影响人们的日常生活,而天气预报能够让人们对即将到来的天气,预先采取应对措施,小至改变周末计划,大致风暴来袭撤离居民,但是要能预测局部性暴雨,或是雷暴这种以小时为单位的事件,并非一件简单的事。
目前有许多科技用来预测气象,像是都卜勒雷达可用来即时测量降雨(图下),气象卫星(图上)可提供多谱成像等图像,而地面站则能直接测量风力与降雨。美国国家海洋与大气管理局(NOAA)每天收集的遥测数据多达100TB,NOAA将这些数据以超级计算机上的天气预报引擎运算,提供1到10天的全球天气预报。
但计算资源的可用性,限制了数值天气预报的能力,像是天气预报的空间分辨率约为5公里,而这样的分辨率难以应用在市区或是农地上,而且因为数值方法需要花费数个小时运算,当每次运算需要花费6小时,则一天就只能运算3到4次,且用来预测的数据是6小时前的旧数据,这限制了人们对当前天气状态掌握的程度。
而Google利用机器学习从雷达图像预测降雨,以更快且分辨率更高的方式,预测地区的短期天气,Google的系统可以便用1个小时的雷达图像,预测接下来数小时的雷达图像,时间范围通常是0到6小时。
Google提到,因为雷达数据是以图像的方式呈现,因此可以将天气预测,转换为计算机视觉的问题,以输入的图像串行来判断气象的演变,而气象演变由两个物理程序影响,其一是对流对云移动的影响,以及对流对形成云的影响,而这两个程序都很大程度地受地形与地理环境影响。
由于Google使用非数据驱动的无物理方法,因此只能从样本中,训练神经网络学习近似天气的物理,而非实际仿真大气运行的原理,Google表示,由于是处理计算机视觉的问题,因此他们利用了图像分析技术卷积神经网络。Google利用了2017年到2019年观测数据训练模型,数据以4星期为一个单位,一个单位前3个星期的数据为训练数据,第4周的数据用来评估。
Google将运用机器学习的预侧方法,与HRRR、OF算法和持续型模型三个受到广泛使用的快速预测模型,比较期精确率与召回率(Precision & Recall),Google提到,应用神经网络的方法其预测品质明显高于其他三个模型,不过预测范围在5到6小时后,HRRR的预测结果品质就会超越Google的机器学习方法。
使用机器学习预测的好处是可以即时取得结果,这代表能以最新的数据进行预测,而HRRR则因为需要运算较久,因此时间会延迟1到3小时,整体来说,机器学习方法可以获得较佳的短期预测结果,而HRRR可以获得较佳的长期预测结果,Google解释,因为云的形成是立体的,很难单从2D图像中观察,但把这两个系统结合,将能提供更全面的预测结果。