【鈴⽊教授による解説シリーズ12】集団化する人工知能

  • クウォンツ・インデックスの視点
  • 2019年08月
集合知AIモデルのシミュレーション(前編)
ポイント
  • 2回に分けて、集合知AIモデルが機能するメカニズムを解説します。
  • 今回は、集合知(集団学習) のメカニズムを解説します。
  • 第1次銘柄選択(集合知で予測しやすい銘柄を特定) の効果を解説します。
  • 次回も続きます(第2次タイミング選択など)。

本解説シリーズ第1回(AI運用に挑む)にて「集合知AIモデル」をご紹介しました。その原著論⽂「Consensus Ratio and Two-steps Selection to Detect Profitable Stocks: Modern TechnicalAnalysis Using Machine Learning Approach」では、翌日株価の変動方向の予測において約60%〜80%の正答率を得ています(原著論⽂のTable5)。そこで2回に分けて、何故このような⾼い正答率を実現できるのか、そのメカニズムについて考察したいと思います。なお原著論⽂は、国際テクニカルアナリスト連盟(IFTA) ホームページ別ウインドウで開くより無料で入手できます。

注:上図は「集合知AIモデルのコンセプト:解説シリーズ第1回(AI運用に挑む)」を⼀部変更して再掲しています。

集合知のメカニズム

回帰問題(連続値の予測) の場合

3人寄れば文殊の知恵のように、複数⼈の判断を統合すると判断能⼒が向上します。これは「集合知」という統計的な現象であり、直感的に言えば、各自の予測誤差が互いに打ち消しあって縮小する現象です。

数式で表現するならば、

各自の予測値 \( x_i \) = 正解値 \( \mu \) + 予測誤差 \( \epsilon_i \)

とし、予測誤差 \( \epsilon_i \) は平均0かつ標準偏差\( \sigma \)の乱数(ランダムな値) とします。 なお、予測する⼈数は \( n \)⼈とします\((i=1~n)\)。もし各自の予測が互いに独⽴に⾏われ、各々の予測値を平均することで集合知を得るならば、集合知による予測値 \( \bar x=\frac 1n\sum_{i=1}^{n} x_i \) は中⼼極限定理により、平均 \( \mu \) かつ標準偏差 σ n の正規分布に従います。 予測する⼈数\( n \)が増えるほど標準偏差が小さくなるため、集合知による予測値 \( \bar x \) は正解値 \( \mu \) に近づきます。

⼀方、各自が相談し合って予測するなど互いに独⽴ではないならば、実質的に独⽴な予測者の⼈数 \( n \) が減ると考えられるため、集合知の標準偏差 σ n    は縮小しにくくなります。したがって集合知の効果は低下します。

判別問題(離散値の予測) の場合

上部では回帰問題(予測値 \( x_i \) が連続値) の観点から集合知の効果を示しました。しかしここで示す集合知AIモデルでは株価の変動方向(上昇or 下落) を予測対象とするため「2クラス判別問題」に相当します。そこで \( x_i \) を各自の予測値ではなく、各自の判別能⼒とみなします。そして \( x_i \) が 0 を超えたら判別問題に正解できるとします。したがって正解確率 \( p \) は \( x_i \) > 0 の面積となります。なお \( x_i \) は平均 \( \mu \)かつ標準偏差 \( \sigma \)の乱数とし、平均 \( \mu \)は基本的な判別能⼒であり、標準偏差 \( \sigma \)はその不安定さを意味します。つまり \( \mu \) が大きく \( \sigma \)が小さいほど優れた判別であるため、正解確率 \( p \) が⾼くなります。

さて、集合知による判別を考えてみましょう。平均値 \( \bar x=\frac 1n\sum_{i=1}^{n} x_i \) によって判別する場合と、多数決によって判別する場合の2パターンが考えられます。それぞれの判別結果が正解となる条件は以下のとおりです。

■平均値による判別 \( \bar x \) > 0 ならば集合知は正しい。

回帰問題と同様に、中⼼極限定理によって集合知の効果を説明できます。

■多数決による判別:正解者 ( \( x_i \) > 0 ) の⼈数を \( m \)とすると、 m n > 0.5 ならば集合知は正しい。

\( n \)⼈中 \( m \)⼈が正解する確率は⼆項分布に従うため、⼆項分布の観点から集合知の効果を説明できます。 \( n \) の増加と共に標準偏差 p(1-p) n は縮小するため、各自の正解確率が \( p \) > 0.5 ならば集合知の正解確率は100%に近づきます。

回帰問題と同様に、各自の判断が独⽴ではないならば、実質的に独⽴な多数決の⼈数 \( n \) が減ると考えられるため、集合知の標準偏差 σ n および p(1-p) n は縮小しにくくなります。したがって集合知の効果を得るには、各自の判断を可能な限り独⽴にする⼯夫が必要になります。

独⽴に判断するAIを構築する工夫(集団学習)

集合知AIモデルは、多数の⼈⼯知能(AI) を構築することで集合知の効果を発揮します。しかしAIを鍛える訓練データは基本的に1セットしかありませんので、無策であれば全て同じAIが構築されてしまいかねません。この場合、\( n \)=1と等価であるため、集合知の効果を発揮できません。
そこで、できるだけ特徴が異なるAIを構築する⼯夫として「バギング」という集団学習法をご紹介します。集団学習は本解説シリーズ第10回(ニュースを読んで投資判断する集合知AI) でも登場しました。

まずオリジナルの訓練データ集合すべてを抽選箱に入れ、同⼀のデータ数になるまでランダムにデータを復元抽出することで異なる訓練データ集合を複製します。ここでデータ数はオリジナルと同⼀であるため、⼀部のデータは同⼀集合内で重複します。この複製を繰り返したのち、複製されたデータ集合毎でAIを訓練すれば、特徴の異なる(独⽴性の⾼い) AIを構築できる可能性があります。つまり復元抽出に伴うランダム性を利用して独⽴性を⾼める作戦ですが、オリジナルの訓練データ集合は共通であるため、復元されたデータ集合間においても重複が発⽣します(模式図では2番・4番・8番・7番・10番・99番が重複)。この集合間での重複がAIの独⽴性を下げる要因となるため、たとえ \( n \) 体のAIを構築したとしても、実質的に独⽴な個体数は \( n \) 未満になります。

なおオリジナルの訓練データ集合は、未知の⺟集団に含まれる⼀部の標本に過ぎません。そこでランダムな復元抽出により多様性を回復することで、未観測の⺟集団を再現したいという思惑もあります。これをブートストラップ法と呼び、バギング(Bootstrap Aggregatingの略) の由来になっています。

集合知AIモデルへの応用

集合知と集合愚

先述のように、集合知AIモデルは翌日株価の変動方向(上昇or 下落) を予測対象とするため「2クラス判別問題」に相当します。なお実際には各AIの判別能⼒ \( x_i \) を計測できないため、平均値ではなく多数決によって集合知を得るとします。この場合、 \( n \) 体のAIによる集合知(多数決) の正解確率は

となります。ここで \( p \) は各自の正解確率、 \( m \) は正解したAIの数を意味します。この確率 \( P \) は \( p \) と \( n \) のみに依存するため、両変数を変えながら \( P \) (\( p \),\( n \)) のグラフを作成しました。

上図において、確かに集合知の効果を確認できます。\( p \) > 0.5 ならば、\( P \)( \( p \),\( n \) ) > \( p \) となります。また \( n \) が大きいほど \( P \)( \( p \),\( n \) ) が⾼まる結果は先述の説明と整合的です。⼀方、\( p \) < 0.5 ならば、 \( P \)( \( p \),\( n \) ) < \( p \) となりますが、これはそもそも正解できないタスク ( \( p \) < 0.5 ) です。AIは過去の経験に基づいて訓練しますので、過去の経験に逆らう現象については反対に予測します。このように \( p \) < 0.5 であれば、多数決によってますます正解確率は低下するため、この場合は「集合愚」と呼ぶことにします。

集合知によって予測しやすい銘柄を特定する(第1次銘柄選択)

次に、実際の株価予測らしい正解確率として\( p \) = 0.5~0.6 の範囲に着目します。株価変動が完全にランダムならば \( p \) = 0.5でありますが、少しでも法則性があるならば \( p \) > 0.5 となります。前者は予測不可能な銘柄であり、後者は予測しやすい銘柄と言えます。もし両者の銘柄が混在するならば、後者のみを予測対象にするのが得策です。そこで後者を特定するために、集合知を応用します。

⼀般に、集合知(集団学習を含む) は判断能⼒を向上させる方法として知られていますが、難しい問題と易しい問題を分離する方法としても利用できます。次の模式図は、予測不可能な銘柄( \( p \) =0.5) と予測しやすい銘柄( \( p \) = 0.56) を分離する例ですが、集団学習なし( \( n \) =1 ) に比べて、集団学習を適用した方が両者の正解確率 \( P \)( \( p \),\( n \) )の差を拡大できます。株価銘柄毎の予測可能性は時間変化によって揺らぐならば、正解確率 \( P \)( \( p \),\( n \) )の差は曖昧になりますので、集団学習によってこの差を拡大できる点は銘柄選択において大きなメリットです。そこで集合知AIモデルでは、これを「第1次銘柄選択」と呼び、集団学習による正解実績が⾼い銘柄のみを運用の対象にします。

なお原著論⽂では、500体のAIによる集団学習を実施していますが、先述の訓練データが重複する問題や多数決によって実現できる正答率の観点から、実質的に独⽴に機能するAIは19体程度(\( n \) = 19) だと考えられます。しかしそれでも正解確率を向上でき、さらに銘柄選択においても集団学習を適用するメリットがあります。

次回は、簡単なエージェントシミュレーションによって、集合知AIモデルの妥当性を検証します。本当に第1次銘柄選択によって予測しやすい銘柄を特定できるのか検証し、第2次タイミング選択のメカニズムについても解説します。集合知AIモデルの真価は「選択⼒」にあります。そして原著論⽂で得られた約60%〜80%の正答率をエージェントシミュレーションによって再現します。

【図解シリーズ】投資理論とコンピュータの歴史の続きは10月を予定しています。

鈴木智也(すずきともや)

茨城大学大学院理工学研究科機械システム工学領域教授.理学博⼠.IFTA国際検定テクニカルアナリスト.平成17年東京理科大学大学院理学研究科物理学専攻博⼠課程修了,同年東京電機大学工学部電⼦工学科助⼿,平成18年より同志社大学工学部情報システムデザイン学科専任講師,平成21年より茨城大学工学部知能システム工学科准教授を経て,平成28年より同大学教授.さらに平成29年より大和証券投資信託委託(株)クウォンツ運⽤部特任主席研究員,平成30年よりCollabWiz(株)代表取締役を兼務.研究分野は,時系列解析,テキスト解析,機械学習,人工知能,⾦融工学など実践的なデータサイエンスに従事.電⼦情報通信学会,人工知能学会,日本テクニカルアナリスト協会,日本証券アナリスト協会各会員.

バックナンバー

鈴⽊教授による解説シリーズ

当資料のお取扱いにおけるご注意
  • 当資料は、ファンドの状況や関連する情報等をお知らせするために大和アセットマネジメントにより作成されたものであり、勧誘を目的としたものではありません。
  • 当資料は、各種の信頼できると考えられる情報源から作成していますが、その正確性・完全性が保証されているものではありません。
  • 当資料の中で記載されている内容、数値、図表、意見等は当資料作成時点のものであり、将来の成果を示唆・保証するものではなく、また今後予告なく変更されることがあります。また、記載する指数・統計資料等の知的所有権、その他の一切の権利はその発行者および許諾者に帰属します。
  • 当資料中における運用実績等は、過去の実績および結果を示したものであり、将来の成果を示唆・保証するものではありません。
  • 当資料の中で個別企業名が記載されている場合、それらはあくまでも参考のために掲載したものであり、各企業の推奨を目的とするものではありません。また、ファンドに今後組み入れることを、示唆・保証するものではありません。