ニュース

だいち2号搭載レーダーで国土特化の「基盤モデル」構築–SAR画像の利用拡大に期待

2025.06.04 09:00

UchuBizスタッフ

facebook X(旧Twitter) line

 宇宙航空研究開発機構(JAXA)と産業技術総合研究所(産総研)は、「だいち2号」(ALOS-2)に搭載されている合成開口レーダー(SAR)である「PALSAR-2」を活用して「SAR基盤モデル」を構築した。専門的な知識が必要なSAR画像判読の敷居を下げることで、SAR利用の拡大が期待できるという。6月3日に発表した。

 基盤モデルは、教師なし学習や半教師なし学習などで膨大な入力データで学習した大規模な人工知能(AI)モデル。構築するには、大量のデータと大規模な計算が必要だが、一度構築してしまえば、それをベースにした「転移学習」でさまざまなタスクをこなすAIモデルを構築できる(基盤モデルを構築するために必要な学習は「事前学習」と呼ばれる)。

国土に特化したSAR基盤モデルの構築と期待される応用(日本全体の土地利用・土地被覆図に使った高解像度土地利用土地被覆図はJAXAより提供、出典:産総研、JAXA)
国土に特化したSAR基盤モデルの構築と期待される応用(日本全体の土地利用・土地被覆図に使った高解像度土地利用土地被覆図はJAXAより提供、出典:産総研、JAXA)

 SARは、マイクロ波を利用したリモートセンシング技術の一つで、人工衛星や航空機による合成開口技術を使うことで、昼夜に関係なく高解像度の画像を観測データとして得ることができる。

 中でも「Lバンド」と呼ばれる1G~2GHzの周波数帯のマイクロ波は空気中の水蒸気や植生などに対して透過性が高いため、森林の多い日本での地形変化や災害時の状況把握などでの活用が進められている。だいち2号はLバンドのSARであるPALSAR-2を搭載しており、天候や昼夜に影響されずに日本を含め世界中を観測し続けている。

 一方で、SARのより広い分野への利用拡大には課題があると指摘されている。SARデータの判読には専門知識が必要なため、AI技術の導入が進んでいるが、大規模計算や大量のデータ取得にはコストもかかる。

 この問題を解決するために基盤モデルの導入が考えられている。基盤モデルの構築には大量のデータと大規模な計算が必要となるが、構築してしまった後は、それをベースにして、わずかな学習でさまざまなタスクをこなすAIモデルを構築できる。

 PALSAR-2によるSARデータ、日本国土を高解像度観測して得られたSARデータについては、これまで基盤モデルは存在していなかった。産総研とJAXAは協定を締結し、産総研が所有する大規模AIクラウド計算システム「ABCI」を使用してPALSAR-2のデータの大規模計算を実施した。

 PALSAR-2は日本の国土全体を3mなどの高解像度モードでくまなく観測している。地震などによる地殻変動を捉えるために定常的に観測されていて、だいち2号の周回軌道に合わせ、年4回程度の割合で国土のほぼ全体のデータが更新される。

 今回の成果は、画像用に開発された教師なし学習手法の一つである「Masked Auto Encoder(MAE)」から派生した「MixMAE」で大規模事前学習を実施し、国土を観測した豊富なSARデータから基盤モデルを構築した。

 SARの観測では、センサーから電波を地球へ向けて照射し、地表や水面から反射されセンサーに返ってきた電波の強さを計測することで地表や水面の様子を観測する。人間の目で見る波長とは異なるため、SAR画像は気象衛星の画像などで馴染みのあるものと大きく異なり、画像の判読には専門的な知識が必要とされる。

 この判読を助けるためSAR画像へのAI応用が広がっているが、目的に応じて、AIをゼロから構築することはデータの準備、AIの学習に必要な計算などコストの面で課題がある。基盤モデルでは、事前に基本となる学習を完了しておくことでわずかな追加学習(転移学習)でさまざまな問題に適応できる。

 基盤モデルの性能には、データの量はもちろん、データに含まれる情報の多様性も大きく影響する。例えば、日本の国土は70%が森林に覆われており、無作為にデータを学習させると森林に知識が偏ることが予想される。実際には森林以外にも市街地や河川、耕作地帯など国土の土地種別はさまざまだ。

 そこで、すでに得られている国内の土地利用や土地被覆データを参照し、森林や市街地、河川や湖などの水域、耕作地帯を均等に指定。学習に使うデータとするため、指定地点を中心とした256×256画素の小画像に切り分け、30万枚以上の学習データを準備した。

 SAR特有のノイズや反射条件による極端に強い信号の影響を低減するため、極端に反射電波強度の強い領域の影響を無視するような損失関数を考案した。基盤モデルは、作成した学習データセットと考案した損失関数による教師なし学習で構築した。

国土SAR基盤モデルに用いる学習データの構築。土地利用・土地被覆割合を参考にPALSAR-2の観測地点を選択(高解像度土地利用土地被覆図はJAXAより提供、出典:産総研、JAXA)
国土SAR基盤モデルに用いる学習データの構築。土地利用・土地被覆割合を参考にPALSAR-2の観測地点を選択(高解像度土地利用土地被覆図はJAXAより提供、出典:産総研、JAXA)

 基盤モデルは、そのままでは特定の目的をこなすことができないが、目的に合わせた少数のデータセットでの転移学習を実行することで、さまざまな用途に活用可能。今回の成果では基盤モデルの性能を評価することも目的として、土地利用や土地被覆推定を行えるように転移学習を行った。

 基盤モデルを利用した場合は、事前に大規模にSARデータを学習し、SARデータを理解するのに役立つ情報の抽出が完了していることもあり、基盤モデルを利用せずに、土地利用・土地被覆推定を行ったモデルより精度が10%以上向上したという。

転移学習後のAIモデルを活用した茨城県域の土地利用・土地被覆の推定。高解像度土地利用土地被覆図(正解図)はJAXAより提供(出典:産総研、JAXA)
転移学習後のAIモデルを活用した茨城県域の土地利用・土地被覆の推定。高解像度土地利用土地被覆図(正解図)はJAXAより提供(出典:産総研、JAXA)

 今後は構築した基盤モデルを軸に災害検知や都市の変化検知などさまざまな応用し、SARデータの実用例の積み上げと基盤モデルの性能評価を進めていく。これまでは画像からAIが得た情報を、人間が理解しやすい言語説明に変換することは困難だったが、基盤モデルで言語と画像、言語と音響など異なる種別の情報と容易に統合できるため、SARデータの判読結果を言語で説明できるようになるという。

 言語表現された説明を別の言語モデルが理解し、再度観測するべきかなどのタスキングに役立てることも期待できると説明。これまで専門知識を必要としたSARデータの理解をより直観的かつ迅速にし、将来的にはさらなるSARの利用拡大を目指すとしている。

だいち2号(出典:JAXA)
だいち2号(出典:JAXA)

関連情報
産総研、JAXAプレスリリース
だいち2号(JAXA第一宇宙技術部門)
ABCI(AI Bridging Cloud Infrastructure)

Related Articles