ファイナンス、情報通信技術のスキル・アグリゲーション・サイト
CSVをドロップするだけで、LSTMが学習して翌営業日の予測終値を出力します。
ブラウザ完結・データ送信なし。Finance × AI の入門体験ツールです。
本ツールは、機械学習ライブラリ TensorFlow.js をブラウザ上で実行し、株価の時系列データから LSTM(Long Short-Term Memory) モデルを構築・学習して、翌営業日の予測終値を算出するデモツールです。
株価データの著作権保護の観点から、CSVファイルはご自身でご用意いただく仕様です。 初めての方向けに、動作確認用の合成データ(架空の株価)もダウンロード提供しています。 すべての計算はお使いのブラウザ内で完結し、データが外部に送信されることはありません。
※ パラメータを完全に自由設定できる詳細版ソースコードは gwaw.jp 実験ページ でご覧いただけます。
過去の株価パターンを記憶し、翌営業日の終値を予測します
小規模モデルでは WebGL より CPU が高速。ブラウザで快適に学習できます
学習曲線・予測 vs 実測・翌日予測チャートで結果を可視化
CSVはブラウザ内のみで処理。外部サーバーへの送信は一切ありません
Yahoo!ファイナンス・株探(かぶたん)などから時系列データをエクスポートしてください。
列の順序は 日付, 終値, 始値, 高値, 安値 の形式が必要です。
250件(約1年分)以上を推奨します。
初めての方は下記ツール内の「サンプル CSV をダウンロード」でまずお試しください。
ドロップゾーンにファイルをドラッグ&ドロップするか、クリックしてファイルを選択します。 読み込みに成功すると、件数・期間・価格レンジが表示されます。
ウィンドウサイズ(参照する過去日数)と 訓練データ比率(学習に使うデータの割合)を選択します。 迷ったらデフォルト値(20日 / 80%)のままで問題ありません。
ボタンを押すと CPU バックエンドで学習が始まります。 30 エポックの学習で、通常 10〜60 秒程度かかります (データ件数・端末性能による)。 ログエリアに進捗が随時表示されます。
学習完了後、翌営業日の予測終値・評価指標・3種のグラフが表示されます。 各指標の見方はページ下部の「入力と出力の解説」を参照してください。
LSTM(Long Short-Term Memory)は、時系列データの学習に特化したニューラルネットワークの一種です。 通常の RNN(再帰型ニューラルネットワーク)が「遠い過去」を忘れてしまう問題を、 「記憶セル」と「ゲート機構」によって解決しています。
列順:日付, 終値, 始値, 高値, 安値
日付形式:yyyy/mm/dd(例: 2024/01/15)
推奨件数:250件以上(1年分以上)
文字コード:UTF-8 / Shift-JIS 自動判定
過去何日分を「1つの入力ベクトル」として LSTM に渡すか。
大きいほど長期パターンを学習しますが、計算時間が増加します。
選択肢:10日 / 20日(推奨) / 40日
全データのうち学習(訓練)に使う割合。残りの割合がテストデータとして予測精度の検証に使われます。
選択肢:70% / 80%(推奨) / 90%
最も重要な出力。直近のウィンドウサイズ分のデータを入力として、翌日の終値を予測します。
30 エポック中の最小損失(平均二乗誤差)。値が小さいほど学習が進んでいます。
テストデータでの平均絶対誤差。「平均して何円ズレているか」の直感的な指標です。
価格の上下方向の的中率。50% がランダム基準。60% 以上であればモデルに一定のパターン認識力があります。
学習の進捗・精度・翌日予測を視覚的に確認できます。
| パラメータ | 固定値 | 設定理由 |
|---|---|---|
| LSTM ユニット数(第1層) | 48 | 株価の短〜中期パターン抽出に十分なサイズ。ブラウザ負荷とのバランスを考慮 |
| LSTM ユニット数(第2層) | 24 | 第1層の特徴量をさらに圧縮。過学習を抑制 |
| Dropout 率 | 0.2 | ノードを20%間引き、過学習(訓練データへの過適合)を防ぐ標準的な値 |
| エポック数 | 30 | ブラウザでの待機時間と精度のバランス点。通常10〜60秒で完了 |
| バッチサイズ | 16 | 小バッチで学習の安定性を確保。CPUバックエンドとの相性が良い |
| 学習率 | 0.001 | Adam オプティマイザーのデフォルト値。収束安定性が高い |
| バックエンド | CPU | このモデルサイズではWebGLのオーバーヘッド(テクスチャ転送コスト)が割高。CPUの方が高速 |