【AI研究の素】隠れマルコフモデル（HMM）ってなに？

2024.02.27
用語解説

AIの研究の歴史は古く、今は第３次AIブームと言われています。（70年代中盤と00年代序盤に「冬の時代」があったとのこと）。概念の起源は1950年の著書『計算する機械と人間；アラン・チューリング（英国数学者）』からとのこと。

70年近い歴史を俯瞰した際に、よく見られる単語に「隠れマルコフモデル」があります。結構見かける単語の為どんなものか調べました。

1. 隠れマルコフモデル
2. 「隠れ」ってなに？
- 2.1. マルコフモデル
- 2.2. 隠れマルコフモデル
3. 隠れマルコフモデルのAI発展への寄与
4. まとめ

隠れマルコフモデル

隠れマルコフモデル（Hidden Markov Model、以下HMM※ゾイドではない）は観測しにくい現象のモデリングを可能にし、AIが実世界の複雑な問題に適用される上で重要な役割を果たしました。特に、不完全な情報から意味ある情報を推定する手法として大きく貢献したと言えます。

「隠れ」ってなに？

隠れマルコフモデルを理解する為に、「隠れ」じゃないマルコフモデルと一緒に調べました。

マルコフモデルと隠れマルコフモデルは、どちらも確率モデルの一種です。

マルコフモデルは、状態が直接観測されるモデル
隠れマルコフモデルは、状態が直接観測されないモデル

マルコフモデル

マルコフモデルは、ある状態が直前の状態に依存すると仮定するモデルです。これを「マルコフ性」と呼びます。例えば、天気のモデルを考えてみます。今日の天気が明日の天気に影響を与える場合、これはマルコフ性を持つと言えます。そして、マルコフモデルでは、現在の状態から次の状態への遷移確率が定義されます。これにより、将来の状態を予測することができます。

隠れマルコフモデル

隠れマルコフモデル（HMM）は、このマルコフモデルを拡張したものです。HMMでは、観測される状態とそれに対応する隠れた状態があります。たとえば、天気の場合、外から見える天気が観測される状態であり、その背後にある気圧などの条件が隠れた状態に相当します。

HMMでは、次の３つの要素が重要です：

隠れ状態 (Hidden States): 観測されない内部の状態です。これは直接見ることができませんが、観測される状態に影響を与えます。例えば、天気の場合、気圧のパターンなどが隠れた状態になります。
観測 (Observations): 隠れた状態に対応する外部から観測可能な出力です。天気の例で言えば、外部から見える晴れや雨が観測される状態になります。
状態遷移確率 (Transition Probabilities): 隠れ状態が別の隠れ状態に遷移する確率を示します。これはマルコフ性を表し、隠れた状態が時間と共にどのように変化するかを定義します。

HMMは、観測されたデータから隠れた状態を推定することや、未来の観測を予測することが可能です。言語モデリングや音声認識、バイオインフォマティクスなど、さまざまな分野で幅広く応用されています。

つまり「隠れ」とは観測されない状態を推定することです。

隠れマルコフモデルのAI発展への寄与

隠れマルコフモデルは、AIの発展に大きく貢献してきました。それは

観測されない状態を推測できる
確率モデルである
学習が容易である

というメリットがあったからです。

観測されない状態を推測できる

隠れマルコフモデルは、観測されない状態を推測できるため、さまざまな分野で有用です。例えば、

音声認識では、音声信号から音素の系列を推測するために使用されます。
バイオインフォマティクスでは、DNAやRNAの配列から、タンパク質の構造や機能を推測するために使用されます。
自然言語処理では、テキストから文法構造や意味を推測するために使用されます。

確率モデルである

隠れマルコフモデルは、確率モデルであるため、推定の信頼性を評価できます。これは、AIの信頼性を向上させるために重要です。

学習が容易である

隠れマルコフモデルは、学習が容易であるため、比較的少ないデータで推定できます。これは、AIの普及に貢献しています。

それぞれ顕著な貢献分野

自然言語処理（NLP）: HMMは、言語モデリングや品詞タグ付けなどの自然言語処理の基盤となりました。特に、品詞タグ付けにおいては、単語の隠れた品詞（名詞、動詞など）をモデル化するためにHMMが使用され、文の解析に貢献しました。
音声認識: HMMは音声認識の分野でも広く使用されてきました。音声信号の隠れた言語モデルを構築することで、音声認識システムの精度向上に役立ちました。言語モデルとしてのHMMは、音声を単語やフレーズに変換する際に重要な役割を果たしています。
バイオインフォマティクス: DNAやタンパク質などのバイオロジカルデータに対する解析においても、HMMは頻繁に使用されています。系列データのモデリングやパターン認識において、隠れた構造やパターンを捉えるための手法として活用されています。
時間依存データのモデリング: HMMは時間的な関係性を持つデータをモデル化するための有力な手法です。金融データの予測、動きのある物体のトラッキング、気象データの分析など、様々な時間依存のデータを扱う際に利用されます。

これらの分野でのHMMの活用により、AIシステムはより複雑なデータ構造をモデル化し、パターンを認識する能力が向上しました。また、HMMはその後のモデルや手法の発展の基盤となり、それらの発展にも寄与しています。