大和投資信託 iFree専用サイトはこちら

集団化する人工知能鈴木教授による解説シリーズB


〜「2年目のジンクス」を集合知AIで緩和〜


2018年3月1日

印刷する場合はこちらをご利用ください。PDF版

<実績No.1が真に優れているとは限らない>

ジャンケン日本大会が開催されたとしましょう。成人約1億人が互いにジャンケンをし、最後まで勝ち残った人が優勝です。ざっと27連勝するとNo.1になります。さて、この優勝に何の意味があるのでしょうか?

もちろん何の意味もありません。単にまぐれで優勝したに過ぎません。しかし「27連勝」は紛れもない事実ですから、実績に着眼すると「神業」のように思えてきます。さらに、投資のようにジャンケンに勝つたびに報酬を貰えるとします。みごと27連勝した神業プレーヤーは億万長者になり、伝説の投資家として講演依頼が殺到するかもしれません。でも、みなさんは講演に行きますか?(行きませんよね?)

では囲碁大会ならどうでしょう。ジャンケンとは違って技術介入度(技術が関与する余地) が高いため、なかなかまぐれではNo.1にはなれません。一方、麻雀大会ならある程度はまぐれで勝つ余地がありそうです。つまり「実績 = まぐれ + 実力」であるため、実績No.1になったプレーヤーを評価する際には実力がどの程度反映されているのかを良く見極める必要があります。



<コンピュータでもまぐれに騙される“データスヌーピングバイアス”>

アルゴリズム運用において人工知能(AI)の活用が期待されていますが、AIに学ばせる情報として何を与えるのかが重要です。たとえば27種類の候補があるとすると、与え方は227 = 約1億通りに及びます。先述のジャンケン大会で誰が優勝するかを探り当てるような難しさです。そこでコンピュータを使えば高速でたくさんの候補を自動で調べられるので、すぐに実績No.1の答えが見つかるでしょう。

しかしここで「データスヌーピングバイアス」の罠にはまります。つまり、「No.1を嗅ぎまわる( = 選ぶ)候補数が多いほど、まぐれを引いてしまう危険性」が高まります。実績がまぐれならば、その後は平均的な成績に低下します。これを「平均回帰性」と言います。少し議論があるところかもしれませんが、スポーツの分野では「2年目のジンクス」と言うように、初年度は優れた成績にも関わらず、2年目は成績が振るわないケースがあります。この場合でも、比較する選手数が多いほどNo.1の実績はまぐれのバイアスを受けるため、実績に基づいた「来年もNo.1」の期待は平均回帰性によって裏切られることが多くなります。この怖さはNo.1を選ぶこと自体によって多かれ少なかれバイアスが発生する点にあります。



<フォワードテストだからといって安心できない>

アルゴリズム運用においては、まずバックテスト(過去の実績)に基づいて運用成績を評価します。しかし金融市場は不確実性が強いため、まぐれ(もしくは過学習)によって成績が良かった可能性があります。そのためバックテストだけでなく、それ以降の新規データに対するフォワードテストによって運用成績を再評価する必要があります。しかしフォワードテストで失敗してもその戦略を破棄するだけで、次の戦略をスヌーピングするでしょう。もしくは全戦略についてランキングを付けて比較する場合もあるでしょう。その結果、フォワードテストにおいてもまぐれで高成績な戦略に遭遇します。これもまた「データスヌーピングバイアス」の罠にはまっています。

このバイアスを回避するには、まぐれの発生を和らげるしかありません。その対策として、


【対策1】実績を評価するサンプル数(計測期間)を増やす

【対策2】合理的な判断基準によって、スヌーピングする候補数を減らす


が有効です。【対策1】は統計学的に妥当ですが、実績の評価に時間を要すため、実際の運用に適用する頃には学習したパラメータが古びて時代遅れになる危険性があります。そこで【対策2】の前処理に着眼し、候補数の削減に集合知のアイデアが役立つと考えています。



<集合知によるデータスヌーピングバイアスの緩和>

第1回のMarket Letterで解説した「集合知AIモデル」(http://www.daiwa-am.co.jp/market/html_ml/ML20171207_1.html)では、異なる学習データで鍛えたAIをたくさん用意し、毎日の予測会議で最も投資判断が一致する銘柄を探しました。この理由として、複数のAIは互いに独立に投資判断するにもかかわらず、特定の銘柄において意見が一致するのは何か特別な理由がある、という考えに基づいています。しかし予測困難な銘柄においては、理由もないのに単にまぐれで複数のAIの意見が一致してしまう可能性も考えられます。



そこでまず、予測困難な銘柄を特定して除外します。第1回のMarket Letterでお伝えしたように集合知を用いれば予測力を強化できますが、そもそも予測困難な銘柄においては何の効果も得られません。一方、予測可能性を持つ銘柄においてはさらに可能性が高まります。この両者の差を利用することで予測可能性を持つ銘柄を特定(第1次選択)し、絞り込まれた候補の中から複数のAIの意見が一致する銘柄をスヌーピングすること(第2次選択)で、まぐれによる誤判断を避ける工夫をします。スポーツに置き換えますと、「二年目のジンクス」に陥ってしまう選手を選択するリスクが緩和できると言うことになります。


以上

当資料のお取扱いにおけるご注意

  • 当資料は、ファンドの状況や関連する情報等をお知らせするために大和投資信託により作成されたものであり、勧誘を目的としたものではありません。
  • 当資料は、各種の信頼できると考えられる情報源から作成していますが、その正確性・完全性が保証されているものではありません。
  • 当資料の中で記載されている内容、数値、図表、意見等は当資料作成時点のものであり、将来の成果を示唆・保証するものではなく、また今後予告なく変更されることがあります。
  • 当資料中における運用実績等は、過去の実績および結果を示したものであり、将来の成果を示唆・保証するものではありません。
  • 当資料の中で個別企業名が記載されている場合、それらはあくまでも参考のために掲載したものであり、各企業の推奨を目的とするものではありません。また、ファンドに今後組み入れることを、示唆・保証するものではありません。