大和投資信託 iFree専用サイトはこちら

集団化する人工知能鈴木教授による解説シリーズC


〜時系列データの見えない法則をつかむ〜


2018年4月9日

印刷する場合はこちらをご利用ください。PDF版

<AIで人間の認知能力を超える>

第1回〜第3回のMarket Letterでは「集合知AIモデル」の集合知に着眼しました。今回よりAI(人工知能)についても触れたいと思います。AIを用いる動機の1つとして「人間の認知能力を超える」ためです。伝統的なファイナンス理論では「市場は完全にランダム」と仮定しますが、AIを用いれば人間には気が付かなかった法則性を検出できるかもしれません。その他にもAIは「高速・大量・自動・不休・客観」などの点において人間より優れていますが、これらについては機会を改めてご紹介します。一言にAIといっても学術分野は多岐に渡りますが、アルゴリズム運用では株価という時系列データを扱うため、データ内に隠れた法則性を「機械学習」によって検出します。この機械学習が最近のAIブームのコア技術です。

さて、人間の認知能力の限界を知って頂くために、簡単なクイズを考えてみましょう。以下にの時系列データがあります。どちらが法則的に変動しているでしょうか?



簡単なクイズと言いつつも、残念ながら人間の認知能力では解けません。しかしAIのように、あるアルゴリズムを導入することで大変解き易くなります。そのアルゴリズムとして、縦軸を未来x(t+1)、横軸を過去x(t)のように、時刻tをずらしてグラフを作り直してみます。

すると次のようになります。



これなら「の方が法則的」であることが分かりますね。実は、は「x(t+1) = 4x(t)-4x2(t)」という法則で作成した時系列データであり、は「青をぐちゃぐちゃに並べ替えた乱数」でした。

<AIはデータの法則を「形」で捉える>

青のデータを生み出した法則「x(t+1) = 4x(t)-4x2(t)」を簡単に表現すると

未来 = 関数f(過去)

のように書けます。ここで右辺の「過去」を入力すると、左辺の「未来」が出力されます。関数fは過去と未来の関係性を意味します。だからこそ、横軸を過去、縦軸を未来のグラフに変換すると、これらの関係性が「形となって」グラフ上に浮き出ます。の法則は2次関数なので、確かに「上に凸の放物線」が浮き出ています。一方、は乱数なので形もバラバラです。

法則性を形で捉える発想はあまり馴染みがないと思いますが、実は伝統的な時系列モデルも同様に解釈できます。たとえばARモデル(自己回帰モデル)の場合を以下に示します。座標変換によって直線的な形が浮き出ています。これが未来と過去の関係性であるため、回帰直線によって関数fを表現することができます。



しかし株価に限らず自然現象の多くは複雑であるため、未来と過去の2次元平面で法則(関数f)を捉えられるとは限りません。法則が複雑化する要因は次のとおりです。

1) 未来に影響を与える過去の有効期間が長い
2) 他の変数からも影響を受ける
3) 影響の仕方が非線形的である(足し算や引き算のように簡単ではない)

たとえば、x(t+1) = x2(t) - y3(t) + x(t-1){ x(t-2) - y(t-1) } + ... のような法則を形で捉える場合、未来x(t+1)に影響を与える全ての変数{x(t), x(t-1), x(t-2), y(t), y(t-1), …}を空間の軸に用いる必要があります。すると高次元になるため、人間には見ることができません。



しかしAIや機械学習では、その特性から、どんなに高次元であっても計算上の変化はありません。つまり高次元の形も2次元の場合と同様に認識することができます。

株価予測のように未来を予測する場合、この形を関数fとして利用します。たとえば、過去と未来の関係性を調べたら、次のような曲面が得られたとします。この曲面が関数fに相当するため、予測対象点が曲面にぶつかる高さが未来の予測値になります。これは数学的には「出力 = 関数f(入力)」という関係式を利用して、予測対象点(入力)から未来(出力)を得ることに相当します。



しかし過去のデータは数に限りがありますから、関数fは先述の曲面のように滑らかではありません。基本的には、最初のクイズで示したように空間内に点が散らばっているだけです。その隙間に予測対象点がぶつかってしまうと予測値を出力できないため、なんらかの方法で点と点の隙間を埋める必要があります。これが機械学習の真の目的です。


<時系列データ解析の3ステップ>

たとえば先述の例「x(t+1) = x2(t) - y3(t) + x(t-1){ x(t-2) - y(t-1) } + ... 」では、各変数に2乗や掛け算のような非線形性を含むため、ニューラルネットワークのような非線形な機械学習モデルが必要になります。データへの当てはめ力は高いですが、一般的にブラックボックスになりやすく、他者への説明力に欠ける弱点もあります。そこで説明力を重視する場合は、あえて線形の時系列モデルを適用する場合もあります。

たとえば上式に対して

・X(t) = x2(t)
・Y(t) = -y3(t)
・Z(t) = x(t-1){ x(t-2) - y(t-1) }

のように3つのパートに分割できることが統計解析によって分かったとします。すると座標変換によって「x(t+1) = X(t) + Y(t) + Z(t) + ... 」のように関数fを線形モデルで表現できます。



つまり事前に統計解析をしっかり行えば、わざわざ説明しにくい非線形モデルを用いる必要がない場合もあります。特に数理ファイナンスにおいては金融に関する諸問題の解明や説明が主目的であるため、運用業界においても線形モデルの重要性は薄れません。しかしAI活用ファンドのように、最近のトレンドとして機械学習の実用性を重視するムードも高まっています。つまりアルゴリズム運用を考える上で、統計解析・線形モデル・非線形モデルに関する理解が重要であり、目的に応じて車のギアのように方法論を切り替えるような発想が必要です。そこでこれからのMarket Letterでは、それぞれの方法論についてAIの観点から解説したいと思います。



【鈴木教授プロフィール】
鈴木智也(すずきともや)
新潟県新潟市生まれ.IFTA国際検定テクニカルアナリスト(MFTA).平成17年東京理科大学大学院理学研究科物理学専攻博士課程修了.理学博士.同年東京電機大学工学部電子工学科助手,平成18年より同志社大学工学部情報システムデザイン学科専任講師,平成21年より茨城大学工学部知能システム工学科准教授を経て,平成28年より同大学教授,さらに平成29年より大和証券投資信託委託(株)クウォンツ運用部特任主席研究員を兼務.平成30年より茨城大学大学院理工学研究科機械システム工学専攻長および領域長.研究分野は,時系列解析,テキスト解析,機械学習,人工知能,金融工学など実践的なデータサイエンスに従事.電子情報通信学会,情報処理学会,人工知能学会,日本テクニカルアナリスト協会,日本証券アナリスト協会各会員.

以上

当資料のお取扱いにおけるご注意

  • 当資料は、ファンドの状況や関連する情報等をお知らせするために大和投資信託により作成されたものであり、勧誘を目的としたものではありません。
  • 当資料は、各種の信頼できると考えられる情報源から作成していますが、その正確性・完全性が保証されているものではありません。
  • 当資料の中で記載されている内容、数値、図表、意見等は当資料作成時点のものであり、将来の成果を示唆・保証するものではなく、また今後予告なく変更されることがあります。
  • 当資料中における運用実績等は、過去の実績および結果を示したものであり、将来の成果を示唆・保証するものではありません。
  • 当資料の中で個別企業名が記載されている場合、それらはあくまでも参考のために掲載したものであり、各企業の推奨を目的とするものではありません。また、ファンドに今後組み入れることを、示唆・保証するものではありません。