ファイナンス、情報通信技術のスキル・アグリゲーション・サイト

3. 市場データの統計的特徴（Finance × Data Science）

市場データ（株価・指数・為替レートなど）は、金融におけるデータサイエンスの中心的な素材です。とくに時系列データとしての特性が明確で、Python と非常に相性が良い領域となります。

本章では、市場データを分析するうえで欠かせない基礎テーマである

① リターンの計算
② ボラティリティ
③ 相関・共分散
④ リスク指標

について整理します。

3-1. リターン計算：価格の“変化率”を見る

市場データ分析の基本は、「価格そのもの」ではなく 「価格の変化率＝リターン」 を扱うことです。

リターンには複数の種類があります。

● 単純リターン

rₜ = (Pₜ − Pₜ₋₁) / Pₜ₋₁

● 対数リターン

rₜ = ln(Pₜ) − ln(Pₜ₋₁)

統計処理やモデル化で扱いやすいため、多くの金融分析で使われます。

● 年率換算リターン

日次や月次リターンを年間換算し、他資産と比較できるようにします。

リターンへの変換は、価格データに潜むパターンや特徴を数値として扱える形にするための “入口” です。

3-2. ボラティリティ：価格の“揺れ”を測る

金融における「リスク」は、損失そのものではなく “どれくらい値動きがぶれるか（不確実性）” を示します。

これを定量化する指標が ボラティリティ（Volatility） です。

● 代表的な指標

標準偏差（リターンのばらつき）
年率ボラティリティ（日次の標準偏差 × √252 など）
ローリングボラティリティ（一定期間ごとの変動性の変化）

ボラティリティを分析することで、平常時は低いが危機時には急激に上昇するという 市場特有の“リスクの時間変動” を捉えられます。

3-3. 相関・共分散：資産間の関係性を理解する

複数の銘柄・資産クラスを扱う際には、それぞれの動きがどの程度似ているかを示す 相関・共分散 が重要です。

● 分析ポイント

銘柄間の相関：分散投資の効果を左右する
セクター比較：業種ごとの値動きの違いを見る
共分散行列：ポートフォリオ理論の基盤となる

相関が低い資産を組み合わせることで、リスクを下げながらリターンを保つ 分散効果（Diversification） が期待できます。

3-4. リスク指標：パフォーマンスの良し悪しを測る

市場データからは、投資のパフォーマンスを評価するための多様な指標を計算できます。

● 代表的なリスク指標

シャープレシオ： リスク1単位あたりのリターン
最大ドローダウン（MDD）： 過去ピークからの下落率

これらは、単なる収益率の高さだけでは見えない “投資の質” を評価するために欠かせない指標です。

3-5. Python による分析との相性

市場データの統計的特徴は、Pandas や NumPy、Matplotlib などを使えば 数行のコードで算出 できます。

例（概念）

# リターン
returns = price.pct_change()

# ボラティリティ
vol = returns.std() * (252 ** 0.5)

# 相関
corr = returns.corr()

# 最大ドローダウン（簡易）
running_max = price.cummax()
drawdown = (price - running_max) / running_max
max_dd = drawdown.min()

このように、「市場データ → 時系列処理 → リスク分析」という流れが一貫してコード化できるため、 Finance × Data Science の学習効果が非常に高い領域 となっています。