Kurs:Modellierung und Numerische Methoden von Finanzderivaten/5 Die Monte-Carlo-Methode

Der Preis einer europäischen (plain vanilla) Option kann mit der Black-Scholes-Formel aus Kapitel 4 berechnet werden. Leider existieren zu komplexeren Optionen im allgemeinen keine expliziten Formeln mehr. In diesem Kapitel stellen wir die Monte-Carlo-Methode zur Integration von stochastischen Differentialgleichungen vor, mit der faire Preise von komplizierten Optionen numerisch berechnet werden können. Zuerst führen wir in Abschnitt 5.1 in die Thematik ein. Das Monte-Carlo-Verfahren erfordert die Simulation von Realisierungen eines Wiener-Prozesses. Die Simulation wiederum benötigt normalverteilte Zufallszahlen. Die Erzeugung von Zufallszahlen ist Gegenstand von Abschnitt 5.2. In Abschnitt 5.3 erläutern wir die numerische Lösung stochastischer Differentialgleichungen. Die Präzision von Monte-Carlo-Simulationen kann mit Hilfe der Technik der Varianzreduktion, die wir in Abschnitt 5.4 vorstellen, erhöht werden. Schließlich wenden wir die vorgestellten Methoden in Abschnitt 5.5 zur Simulation einer asiatischen Call-Option mit stochastischer Volatilität an.

5.1 Grundzüge der Monte-Carlo-Simulation

Die Berechnung des fairen Preises einer komplexen Option ist im Allgemeinen eine anspruchsvolle Aufgabe, die nur numerisch gelöst werden kann. Bei vielen Optionen ist es notwendig, stochastische Differentialgleichungen bzw. stochastische Integrale numerisch zu lösen. Beispiele für derartige Situationen stellen wir im Folgenden vor.

Beispiel 5.1: Asiatischer Call im Heston-Modell

Berechne den fairen Preis einer asiatischen Call-Option mit der Auszahlungsfunktion

V (S_{T}, T) = {(S_{T} - \frac{1}{T} \int_{0}^{T} S_{τ} d τ)}^{+},

wobei die Dynamik von $S_{t}$ und $σ_{t}$ durch das Heston-Modell

d S = μ S d t + σ S d W_{1}, d σ^{2} = κ (θ - σ^{2}) d t + ν σ d W_{2}

gegeben sei. Dieses Beispiel erfordert die Integration von stochastischen Differentialgleichungen und des stochastischen Integrals $\int_{0}^{T} S_{τ} d τ$ . Die Integration kann mit Hilfe der Monte-Carlo-Methode durchgeführt werden. Wir erläutern dies im Detail in Abschnitt 5.5.

Beispiel 5.2: Basket-Option

Berechne den fairen Preis einer europäischen Option auf $n$ Aktien (Basket-Option) mit der Auszahlungsfunktion $V_{0} (S_{1}, \dots, S_{n})$ . Ist die Dynamik der Aktienkurse $S_{1} (t), \dots, S_{n} (t)$ wie in Abschnitt 4.5 durch

d S_{i} = μ_{i} S_{i} d t + σ_{i} S_{i} d W_{i}, i = 1, \dots, n

und durch eine mehrdimensionale Brownsche Bewegung $(W_{1}, \dots, W_{n})$ mit der Kovarianz-Matrix $Σ$ (siehe Definition 5.7) gegeben, so berechnet sich der Optionspreis nach dem Black-Scholes-Modell analog zu (4.18) nach

V (S_{1}, \dots, S_{n}, t) = \frac{e^{- r (T - t)}}{\sqrt{(\det Σ) (2 π (T - t))^{n}}} \times \int_{0}^{\infty} \dots \int_{0}^{\infty} e^{- T Σ^{- 1} / 2} V_{0} (S'_{1}, \dots, S'_{n}) \frac{d {S_{1}}^{'} \dots d {S_{n}}^{'}}{{S_{1}}^{'} \dots {S_{n}}^{'}}

mit $Σ = (Σ_{i j})_{i, j = 1}^{n}, α = (α_{1}, \dots, α_{n})$ und

α_{i} : = - \frac{\ln (S'_{i} / S_{i}) - (r - Σ_{i i}^{2} / 2) (T - t)}{\sqrt{T - t}} .

Hier muss also ein $n$ -dimensionales (Riemann-)Integral ausgewertet werden, wobei die Dimension n je nach Größe des Baskets sehr groß sein kann. Numerische Quadraturformeln sind hier ungeeignet, da zu viele Funktionswerte ausgewertet werden müssen (bei $n = 100$ z. B. $2^{100} \approx 1 0^{30}$ Auswertungen). Einen Ausweg bietet die Monte-Carlo-Integration. Ein Beispiel, wie das geht, geben wir in Kap. 5.2, Beispiel 5.7.

Zur Vereinfachung betrachten wir im folgenden eine europäische Plain-Vanilla-Put-Option auf einen Basiswert, dessen Kurs sich gemäß einer geometrischen Brownschen Bewegung entwickelt:

(5.1)

d S_{t} = r S_{t} d t + σ S_{t} d W_{t}

mit Anfangswert $S_{0}$ , konstantem risikofreien Zinssatz $r \geq 0$ , konstanter Volatilität $σ > 0$ und einem Wiener-Prozess $W_{t}$ (siehe Abschnitt 3.2). In Bemerkung 4.10 haben wir gezeigt, dass der Optionspreis $V (S_{t}, t)$ zur Zeit $t = 0$ gegeben ist durch den diskontierter Erwartungswert

(5.2)

V (S_{0}, 0) = e^{- r T} E (V (S_{T}, T)) .

Die Grundidee der Monte-Carlo-Simulation besteht nun darin, den Erwartungswert in (5.2) durch Simulation von $N$ Pfaden $S_{t} : 0 < t < T$ des Basiswert-Kurses zu approximieren. Der Algorithmus besteht aus vier Schritten:

• Simulation der Basiswert-Pfade: Berechne für

k = 1, \dots, N

den Itô-Prozess (5.1) zum Anfangswert

S_{0}

mit den Lösungen

(S_{t})_{k}

.

• Berechnung der Auszahlungsfunktion: Bestimme für alle

k = 1, \dots, N

die Auszahlungsfunktion entsprechend zum Pfad

(S_{t})_{k}

:

V_{T, k} : = (K - (S_{T})_{k})^{+} .

• Berechnung eines Schätzers: Berechne einen Schätzer für den Erwartungswert in (5.2). Naheliegend ist etwa die Wahl

\hat{E} (V_{T}) : = \frac{1}{N} \sum_{k = 1}^{N} V_{T, k},

wobei

V_{T} = (V_{T, 1}, \dots, V_{T, N})

.

• Bestimmung des Optionspreises: Berechne eine Approximation des fairen Optionspreises durch

\hat{V} : = e^{- r T} \hat{E} (V_{T}) .

Die Schritte 2-4 bereiten keine Schwierigkeiten. Schritt 3 beruht darauf, dass nach dem Gesetz der großen Zahlen das arithmetische Mittel von gleichverteilten und unabhängigen Zufallsvariablen fast sicher gegen den Erwartungswert konvergiert (siehe z.B. [3]). Schritt 1 benötigt die numerische Integration von stochastischen Differentialgleichungen, die aus zwei Teilaufgaben besteht:

Simulation von $N$ unabhängigen Realisierungen eines Wiener-Prozesses und
approximative Berechnung der Lösung der stochastischen Differentialgleichung zum jeweiligen Pfad des Wiener-Prozesses.

Eine sehr einfache Approximation der Gleichung (5.1) ist gegeben durch

(5.3) Δ S_{t} = r S_{t} Δ t + σ S_{t} Δ W_{t},

wobei $Δ W_{t} = W_{t + Δ t} - W_{t}$ $𝒩 (0, Δ t)$ -verteilt ist (siehe Satz 3.10 (3)). Wir benötigen nun Realisierungen des Wiener-Prozesses $Δ W_{t}$ . Wegen

Δ W_{t} = Z \cdot \sqrt{Δ t}

genügt es, Realisierungen einer $𝒩 (0, 1)$ -verteilten Zufallsgröße $Z$ zu bestimmen. Das folgende Matlab-Programm simuliert einen Wiener-Prozess.

% Simulation eines Wiener-Prozesses
h = 0.01; W(1) = 0;
for i=1:999
  W(i+1) = W(i) + randn*sqrt(h);
end

Die Matlab-Funktion randn liefert standardnormalverteilte Zufallszahlen. Tatsächlich handelt es sich um Pseudo-Zufallszahlen, da der Algorithmus zur Erzeugung dieser Zahlen deterministisch ist. Wir können die Approximation (5.3) auch schreiben als

(5.4)

S_{k + 1} - S_{k} = Δ S_{k} = r S_{k} Δ t + σ S_{k} Z \sqrt{Δ t}, S_{0} gegeben, k = 0, 1, 2, \dots

% Approximative Loesung von (5.1)
h = 0.01; mu = 0.1; sigma = 0.4;
S(1) = 1; 
for i=1:999
  dW(i) = randn*sqrt(h);
  S(i+1) = S(i)*(1 + mu*h + sigma*dW(i));
end

Damit sind wir in der Lage, unsere erste Monte-Carlo-Simulation gemäß der obigen vier Schritte durchzuführen. Die Realisierung erfolgt mit einem Matlab-Programm.

Der Funktionsaufruf randn(’state’,3) bedeutet, dass der Pseudo-Zufallszahlengenerator von Matlab mit der Zahl 3 initialisiert wird. Dies hat den Zweck, die Simulationsergebnisse reproduzierbar zu machen. In Abbildung 5.12 illustrieren wir die Entwicklung der Preise $\hat{V}$ einer europäischen Put-Option in Abhängigkeit der Anzahl $N$ der Monte-Carlo-Simulationen. Der Black-Scholes-Optionspreis beträgt $V = 16.98$ . Der Monte-Carlo-Preis weicht von dem Black-Scholes-Preis stark ab, wenn die Anzahl $N$ der Monte-Carlo-Simulationen zu klein gewählt wurde. Allerdings schwanken die Werte auch für große $N$ noch recht stark. Natürlich ist es für dieses Beispiel wesentlich effizienter, die Black-Scholes-Formel zur Bestimmung des Optionspreises zu verwenden. Für komplexere Optionen wie die asiatische Option im Heston-Modell aus Beispiel 5.1 sind wir jedoch auf die Monte-Carlo-Methode angewiesen, da keine expliziten Formeln existieren.

% Monte-Carlo-Simulation fuer einen europaeischen Put
clear all, randn(’state’,3)
K = 100; r = 0.05; sigma = 0.2; T = 1;
n = 50; h = 1/n; S(1) = 80;
for j=1:100
  N=j*100;
  for k=1:N
    for i=2:n
      S(i) = S(i−1)*(1 + r*h + sigma*randn*sqrt(h)); S
    end
    payoff(j,k) = max(0,K−S(n));
  end
  V(j) = exp(−r*T)*sum(payoff(j,:))/N;
end
plot(V)

Die oben präsentierten Beispiele und Simulationen geben Anlass zu den folgenden Fragen:

Wie können wir standardnormalverteilte Pseudo-Zufallszahlen erzeugen?
Wie genau ist die Approximation von Gleichung (5.4)? Wie kann die Approximation verbessert werden?
Wie kann das hochdimensionale Integral aus Beispiel 5.2 mittels der Monte-Carlo-Methode approximiert werden?

Diese Fragen werden wir in den nächsten Abschnitten beantworten.

5.2 Pseudo-Zufallszahlen

Für die Simulation des Wiener-Prozesses benötigen wir standard-normalverteilte Zufallszahlen $Z$ , um die Inkremente $Δ W = \sqrt{Δ t} Z$ zu berechnen. Wir benutzen dafür die Notation

Z \sim 𝒩 (0, 1) .

Erzeugen wir Zufallszahlen im Rechner, so handelt es sich letztlich immer um eine deterministische Vorgehensweise. Man spricht daher von Pseudo-Zufallszahlen. Im Folgenden benutzen wir jedoch den Begriff Zufallszahlen auch, wenn wir Pseudo-Zufallszahlen meinen. Zuerst erzeugen wir im Intervall $[0, 1]$ gleichverteilte (Pseudo-)Zufallszahlen $Y$ ,

Y \sim 𝒰 [0, 1],

und transformieren sie dann auf normalverteilte Zufallszahlen:

Z : = h (Y) \sim 𝒩 (0, 1) .

Um die obigen Begriffe zu präzisieren, hier eine Definition:

Definition 5.1

Eine Zufallsvariable $X$ heißt gleichverteilt auf dem Intervall $[a, b]$ (in Zeichen: $X \sim 𝒰 [a, b]$ ), wenn sie die Dichtefunktion $f (x) = \frac{1}{(b - a)}, x \in [a, b]$ besitzt.
Eine Folge von Zufallszahlen heißt nach $F$ verteilte Zufallszahlen, wenn sie unabhängige Realisierungen einer nach einer Verteilungsfunktion $F$ verteilten Zufallsvariablen sind.

Gleichverteilte Zufallszahlen:
Ein einfacher Algorithmus, um auf $[0, 1]$ gleichverteilte Zufallszahlen zu erzeugen, ist durch die lineare Kongruenz-Methode gegeben: Seien $M \in ℕ, a, b, X_{0} \in {0, \dots, M - 1}$ .

Für

k = 1, 2, \dots

X_{k} : = (a X_{k - 1} + b) mod M, U_{k} : = X_{k} / M .

Offenbar müssen wir $a = 0$ und (wenn $b = 0$ ) $X_{0} = 0$ ausschließen. Außerdem sollte $a \neq 1$ sein, denn ansonsten wäre $X_{k} = (X_{0} + k b) mod M$ zu leicht vorhersagbar. Die Folge $X_{k}$ hat die folgenden Eigenschaften:

Die Folge $(X_{k})_{k \in ℕ}$ ist periodisch mit einer Periode, die kleiner oder gleich $M$ ist, denn: Wegen $X_{k} \in {0, \dots, M - 1}$ muss es ein $p \in ℕ$ geben, so dass $X_{p} = X_{0}$ und daher $X_{k} = X_{k + p}$ für alle $k \in ℕ$ ist.
Die Verteilung der Zufallsvektoren $(U_{k}, \dots, U_{k + m})$ ist leider korreliert (also nicht unabhängig voneinander); siehe das folgende Beispiel.

Beispiel 5.3

Wir betrachten den Fall $m = 2$ mit den Daten $M = 2048, a = 1229, b = 1$ und $X_{0} = 1$ . Die Punkte liegen auf parallelen Geraden. Solche Zahlen können wir kaum Zufallszahlen nennen!

In dem folgendem Matlab-Programm ist die lineare Kongruenz-Methode implementiert.

% Pseudo-Zufallszahlen nach der linearen Kongruenz-Methode
a = 1229; b = 1; M = 2048; N = 500;
X(1) = 1; 
for i = 2:N
  X(i) = mod(a*X(i−1)+b,M);
end
plot(X([1:N−1]),X([2:N]),’.’)

Wegen der Eigenschaft, dass die Zufallszahlen auf parallelen Geraden liegen, ist die lineare Kongruenz-Methode nicht sehr brauchbar. Besser sind sogenannte Fibonacci-Generatoren geeignet. Die Idee ist hier, die Fibonacci-Folge zu verwenden:

Für

k = 3, 4, \dots

X_{k} : = (X_{k - 1} + X_{k - 2}) mod M, U_{k} : = X_{k} / M

mit $M, X_{1}, X_{2} \in ℕ$ . Je nach Wahl von $M$ können aber die Ergebnisse recht unbefriedigend sein. Es sind weit weniger als 2000 Punkte zu sehen, da die Folge $(U_{k})$ sich wiederholt.

Geeigneter sind sogenannte lagged Fibonacci-Generatoren (oder Fibonacci-Generatoren mit ”Verzögerung”) der Form

Für

k \geq \max {μ, ν}

X_{k} : = (X_{k - μ} - X_{k - ν}) mod M,

if

X_{k} < 0

then

X_{k} : = X_{k} + M

;

U_{k} : = X_{k} / M,

wobei die Anfangszahlen $X_{1}, \dots, X_{\max {μ, ν}}$ etwa mittels einer linearen Kongruenz-Methode bestimmt werden können. In dem folgenden Matlab-Programm werden diese Zahlen allerdings mittels des bereits implementierten Zufallszahlen-Programms rand berechnet.

% Pseudo-Zufallszahlen nach dem lagged Fibonacci-Generator
rand(’state’,2) 
M = 2048; nu = 17; mu = 5; N = 5000;
X = M*rand(1,max(nu,mu));
for i=max(mu,nu)+1:N
  X(i) = mod(X(i−mu)−X(i−nu),M);
  U(i) = X(i);
end 
plot(U([1:N−1]),U([2:N]),’.’)

Die Punkte erscheinen genügend zufällig verteilt. Fibonacci-Generatoren haben außerdem den Vorteil, dass sie sehr einfach zu implementieren sind.

Normalverteilte Zufallszahlen:
Wir erzeugen normalverteilte Zufallszahlen durch Transformation gleichverteilter Zufallszahlen. Dies kann geschehen durch

Invertierung der Verteilungsfunktion oder
Transformation zwischen Zufallszahlen.

Grundlage für die Invertierung ist der folgende Satz:

Satz 5.1

Sei $U \sim 𝒰 [0, 1]$ eine gleichverteilte Zufallsvariable und $F$ eine stetige, streng monotone Verteilungsfunktion. Dann ist die Zufallsvariable $F^{- 1} (U)$ nach $F$ verteilt.

Beweis:

Die Umkehrfunktion $F^{- 1}$ existiert gemäß Voraussetzungen. Die Annahme der Gleichverteilung impliziert für alle $ξ \in [0, 1]$ : $P (U \leq ξ) = ξ$ . Somit folgt

P (F^{- 1} (U) \leq x) = P (U \leq F (x)) = F (x) .

Dies bedeutet, dass $F^{- 1} (U)$ nach $F$ verteilt ist.

q.e.d.

Ist dieser Satz auf die Normalverteilung $ϕ$ anwendbar? Es liegen weder für $ϕ$ noch für $ϕ^{- 1}$ geschlossene Formelausdrücke vor. Die nichtlineare Gleichung $ϕ (x) = u$ müsste numerisch invertiert werden, etwa mittels des in Abschnitt 4.2 vorgestellten Newton-Verfahrens. Allerdings ist das Problem für $u \approx 1$ schlecht konditioniert (kleine Änderungen in $u$ bewirken sehr große Änderungen in $x$ ). Als Ausweg kann man $ϕ^{- 1}$ ähnlich wie in Abschnitt 4.2 durch eine rationale Funktion $G$ approximieren und $x = G (u) \approx ϕ^{- 1} (u)$ setzen. Bei der rationalen Approximation ist das asymptotische Verhalten von $ϕ^{- 1}$ (senkrechte Tangenten bei $u = 0$ und $u = 1$ ) sowie die Punktsymmetrie zu $(u, x) = (\frac{1}{2}, 0)$ zu berücksichtigen.

Wir wählen allerdings die zweite Idee: Transformation der Zufallszahlen. Grundlage hierfür ist der folgende Satz.

Satz 5.2

Sei $X$ eine Zufallsvariable auf $ℝ^{n}$ mit der Dichtefunktion $f > 0$ auf der Menge $S : = {x \in ℝ^{n} : f (x) > 0}$ von $f$ . Die Transformation $h : S \to B : = h (S)$ sei umkehrbar mit stetig invertierbarer Inversen $h^{- 1}$ . Dann hat $Y : = h (X)$ die Dichtefunktion

y \to f (h^{- 1} (y)) \cdot | \det (\frac{d h^{- 1} (y)}{d y}) |, y \in B .

Beweis:

Wir geben nur eine grobe Beweisskizze. Nach dem Transformationssatz im $ℝ^{n}$ gilt (sei $A$ der Wertebereich von $h$ , d. h. $h : D (h) \mapsto A$ ):

P (Y = h (X) \in A) = P (X \in h^{- 1} (A)) = \int_{h^{- 1} (A)} f (u) d u = \int_{A} f (h^{- 1} (y)) \cdot | \det (\frac{d h^{- 1} (y}{d y}) | d y .

q.e.d.

Im Falle $n = 1$ und $f (x) = 1$ (Gleichverteilung in $[0, 1]$ ) suchen wir also eine Transformation y = h(x)</math>, so dass die transformierte Dichtefunktion gleich der Normalverteilung ist:

1 \cdot | \frac{d h^{- 1} (y)}{d y} | = \frac{1}{\sqrt{2 π}} \exp (- \frac{y^{2}}{2}) .

Dies ist eine gewöhnliche Differentialgleichung für $h^{- 1}$ , die leider keine geschlossene Formel für die Transformation liefert. Verblüffenderweise erhalten wir eine geschlossene Formel, wenn wir nicht in $ℝ$ , sondern in $ℝ^{2}$ transformieren. Das geht folgendermaßen. Wir wenden Satz 5.2 auf $S = [0, 1]^{2}$ und $f (x) = 1, x \in S$ an. Wähle die Transformation y = h(x)</math> mit

h (x) = (\begin{matrix} \sqrt{- 2 \ln x_{1}} \cos (2 π x_{2}) \\ \sqrt{- 2 \ln x_{1}} \sin (2 π x_{2}) \end{matrix}), x = (x_{1}, x_{2})^{T} \in S .

Die Umkehrabbildung lautet

h^{- 1} (y) = (\begin{matrix} \exp (\frac{- | y |^{2}}{2}) \\ \frac{1}{2 π} \arctan (\frac{y_{2}}{y_{1}}) \end{matrix}), y = (y_{1}, y_{2})^{T}, | y |^{2} = y_{1}^{2} + y_{2}^{2} .

Für die Determinante ergibt sich mit $y = h (x)$ :

\det (\frac{d h^{- 1}}{d y}) = \det (\begin{matrix} - y_{1} x_{1} & - y_{2} x_{1} \\ \frac{1}{2 π} \frac{- y_{2} / y_{1}^{2}}{1 + y_{2}^{2} / y_{1}^{2}} & \frac{1}{2 π} \frac{1 / y_{1}}{1 + y_{2}^{2} / y_{1}^{2}} \end{matrix}) = - \frac{x_{1}}{2 π} = - \frac{1}{2 π} \exp (- \frac{| y |^{2}}{2}) .

Dies ist die Dichtefunktion der Standardnormalverteilung in $ℝ^{2}$ (von zwei unabhängigen Zufallsvariablen). Also ist $h (X)$ standardnormalverteilt, falls $X$ auf $[0, 1]$ gleichverteilt ist.

Daraus folgt der Algorithmus von Box-Muller: Generiere $U_{1}, U_{2} \sim 𝒰 [0, 1]$ und setze $θ = 2 π U_{2}$ und $ρ = \sqrt{- 2 \ln U_{1}}$ . Dann sind

Z_{1} = ρ \cos θ

und

Z_{2} = ρ \sin θ

standardnormalverteilt. Das Histogramm zeigt, dass dieser Algorithmus tatsächlich normalverteilte Zufallszahlen $Z_{1}$ liefert. Hierfür wurden 50 000 Zufallszahlen nach dem folgenden Matlab-Programm erzeugt.

% N(0,1)-Zufallszahlen nach Box-Muller
N = 50000; rand(’state’,2)
Z = sqrt(−2*log(rand(1,N))).*cos(2*pi*rand(1,N));
x=[−3.8:0.2:3.8];
hist(Z,x)

Es muss natürlich sichergestellt werden, dass die gleichverteilten Zufallszahlen keine Struktur haben, da diese auf die transformierten normalverteilten Zufallsvariablen bertragen werden. Eine Linienstruktur in $[0, 1]^{2}$ würde auf Kurven in der $(Z_{1}, Z_{2})$ -Ebene abgebildet werden.

Beim Box-Muller-Algorithmus sind drei Funktionsaufrufe (sqrt, log und cos bzw. sin) erforderlich, um zwei normalverteilte Zufallszahlen zu erhalten. Dies kann beim sogenannten Marsaglia-Algorithmus durch Verwendung der Polartransformation verbessert werden.

Für weitere Hinweise auf Techniken zur Erzeugung von Zufallszahlen verweisen wir auf verschiedene Monographien.

Korreliert normalverteilte Zufallszahlen:
Bei der Simulation einer mehrdimensionalen Brownschen Bewegung benötigen wir i. a. Zufallsvektoren, die einer korrelierten mehrdimensionalen Verteilung folgen:

X = (X_{1}, \dots, X_{n}) \sim 𝒩 (μ, Σ) .

Definition 5.2

(1) Sei $X = (X_{1}, \dots, X_{n})$ ein Zufallsvektor, $μ \in ℝ^{n}$ und $Σ$ eine symmetrische, positiv definite $(n \times n)$ -Matrix. Dann heißt der Vektor $X$ mit $μ$ und $Σ$ normalverteilt, also $𝒩 (μ, Σ)$ -verteilt, wenn X</math> die Dichtefunktion

f (x) = \frac{1}{\sqrt{(2 π)^{n} \det (Σ)}} \exp (- \frac{1}{2} (x - μ)^{T} Σ^{- 1} (x - μ)), x \in ℝ^{n}

besitzt.

(2) Sei $X = (X_{1}, \dots, X_{n})$ eine $𝒩 (μ, Σ)$ -verteilte Zufallsvariable. Dann heißt die Matrix $Σ = (Σ_{i j})$ die Kovarianz-Matrix und es gilt

Σ_{i j} = E [(X_{i} - μ_{i}) (X_{j} - μ_{j})],

wobei $μ = (μ_{1}, \dots, μ_{n})^{T} = (E (X_{1}), \dots, E (X_{n}))^{T}$ der Erwartungswert von $X$ ist. Die Matrix $P = (ρ_{i j})$ , die aus den Elementen

ρ_{i j} : = \frac{Σ_{i j}}{\sqrt{Σ_{i i} Σ_{j j}}}

besteht, heißt die Korrelation.

Der Begriff ”korreliert” bedeutet also, dass die Korrelation einer $𝒩 (μ, Σ)$ -verteilten Zufallsvariablen keine Diagonalmatrix ist.

Wir betrachten nun einen Vektor $Z = (Z_{1}, \dots, Z_{n})$ aus unabhängigen, standard-normalverteilten Zufallsvariablen $Z_{k}$ mit der Dichtefunktion $f$ . Wir konstruieren mittels $Z$ eine $𝒩 (μ, Σ)$ -verteilte Zufallsvariable $Y$ . Es sei $μ \in ℝ^{n}$ und $Σ \in ℝ^{n \times n}$ symmetrisch und positiv definit $(Σ = Σ^{T} > 0)$ . Dann existiert eine Cholesky-Zerlegung

Σ = L L^{T} .

Wir zeigen, dass $Y = μ + L Z$ die Eigenschaft der $𝒩 (μ, Σ)$ -Korrelation besitzt:
Sei $x = L z$ (für die Vektoren schreiben wir $x, y, z, \dots$ ), dann folgt

f (z) d z = \frac{1}{(2 π)^{n / 2}} \exp (- \frac{z^{T} z}{2}) d z

= \frac{1}{(2 π)^{n / 2}} \exp (- \frac{(L^{- 1} x)^{T} (L^{- 1} x)}{2}) d z

(mit

x = L z

)

= \frac{1}{(2 π)^{n / 2}} \exp (- \frac{x^{T} (L L^{T})^{- 1} x}{2}) d z

= \frac{1}{(2 π)^{n / 2} | \det L |} \exp (- \frac{x^{T} Σ^{- 1} x}{2}) d x

(weil

d x = | \det L | d z

)

= \frac{1}{(2 π)^{n / 2} (\det (Σ)^{1 / 2}} \exp (- \frac{x^{T} Σ^{- 1} x}{2}) d x

Damit ist $X \sim 𝒩 (0, Σ)$ und $Y = μ + X \sim 𝒩 (μ, Σ)$ .

Der Algorithmus lässt sich wie folgt zusammenfassen:

Berechne die Cholesky-Zerlegung $Σ = L L^{T}$ .
Berechne unabhängige $X_{k} \sim 𝒩 (0, 1), k = 1, 2, \dots, n$ (z.B. mit dem Box-Muller-Verfahren). Setze $Z = (X_{1}, \dots, X_{n})$ .
Die Zufallsvariable $Y = μ + L Z$ ist $𝒩 (μ, Σ)$ -verteilt.

Beispiel 5.4

Gesucht ist eine 2D- $𝒩 (0, Σ)$ -verteilte Zufallsvariable $(X_{1}, X_{2})$ . Dabei sei

Σ = (\begin{matrix} σ_{1}^{2} & ρ σ_{1} σ_{2} \\ ρ σ_{1} σ_{2} & σ_{2}^{2} \end{matrix}) .

Der Vektor $X = (X_{1}, X_{2})$ heißt durch $ρ$ korreliert. Mit dem Ansatz

L = (\begin{matrix} a & 0 \\ b & c \end{matrix})

liefert die Cholesky-Zerlegung \Sigma = LL^T</math>:

(\begin{matrix} σ_{1}^{2} & ρ σ_{1} σ_{2} \\ ρ σ_{1} σ_{2} & σ_{2}^{2} \end{matrix}) = (\begin{matrix} a & 0 \\ b & c \end{matrix}) \cdot (\begin{matrix} a & b \\ 0 & c \end{matrix}) = (\begin{matrix} a^{2} & a b \\ a b & b^{2} + c^{2} \end{matrix}) .

Durch Koeffizientenvergleich ergibt sich (man beachte, dass $| ρ | \leq 1$ gilt!)

L = (\begin{matrix} σ_{1} & 0 \\ ρ σ_{2} & σ_{2} \sqrt{1 - ρ^{2}} \end{matrix})

Sind $Z_{1}, Z_{2}$ unabhängig und $𝒩 (0, 1)$ -verteilt, so ist

(\begin{matrix} X_{1} \\ X_{2} \end{matrix}) = L (\begin{matrix} Z_{1} \\ Z_{2} \end{matrix}) = (\begin{matrix} σ_{1} Z_{1} \\ σ_{2} (ρ Z_{1} + \sqrt{1 - ρ^{2}} Z_{2}) \end{matrix})

normalverteilt mit den Parametern $μ = 0$ und $Σ$ wie beschrieben.

Beispiel 5.5:

Gesucht ist eine dreidimensionale Verteilung $(X_{1}, X_{2}, X_{3})$ , die normalverteilt sein soll, den Erwartungswert $μ = (- 5, 0, 10)^{T}$ und die Kovarianzmatrix

Σ = (\begin{matrix} 5 & 4 & 3 \\ 4 & 5 & 4 \\ 3 & 4 & 5 \end{matrix})

besitzt. Das folgende Matlab-Programm realisiert den beschriebenen Algorithmus. Die Funktion randn wird zur Erzeugung standard-normalverteilter Zufallszahlen benutzt.

% Berechnung korrelierter normalverteilter Zufallszahlen
Sigma = [5 4 3; 4 5 4; 3 4 5];
mu = [−5 0 10]’; N = 10000;
L = chol(Sigma);
for i=1:N
  X(:,i) = mu + L*[randn randn randn]’;
end
x=[−14.5:0.5:14.5];
subplot(1,3,1), hist(X(1,:),x), axis([−20 20 0 1500])
subplot(1,3,2), hist(X(2,:),x), axis([−20 20 0 1500])
subplot(1,3,3), hist(X(3,:),x), axis([−20 20 0 1500])

Zahlenfolgen niedriger Diskrepanz: In einem einführenden Beispiel wurde erläutert, dass mehrdimensionale Integrale mit Hilfe der Monte-Carlo-Methode berechnet werden können. Grundidee ist dabei, zur Approximation von

\int_{Ω} f (x) d x, Ω \subset ℝ^{m}, (\approx vol (Ω) E (f (x)))

die Summe

\frac{vol (Ω)}{N} \sum_{k = 1}^{N} f (x_{k}), vol (Ω) -

Volumen/Maß von

Ω

(endlich)

mit geeigneten Zahlen $x_{1}, \dots, x_{N} \in Ω$ zu approximieren. Sind diese Zahlen (Pseudo-)Zufallszahlen, so sprechen wir von einer stochastischen Monte-Carlo-Integration, benutzt man dagegen geschickt vorgegebene Zahlen $x_{1}, \dots, x_{N}$ , so ist der Begriff "deterministische Monte-Carlo-Integration” üblich. Die Zahlen sollten möglichst gleichmäßig verteilt sein. Die Diskrepanz einer Menge ${x_{1}, \dots, x_{N}}$ definieren wir als Abweichung der Verteilung dieser Zahlen von einer angestrebten gleichmäßigen Verteilung. Damit lässt sich auch die Qualität von Pseudo-Zufallszahlen testen. Wir definieren im folgenden den Begriff der Diskrepanz und betrachten ein Beispiel.

Definition 5.3

Die Diskrepanz einer Menge ${x_{1}, \dots, x_{N}}$ mit $x_{k} \in [0, 1]^{m}$ ist definiert durch

$D_{n} : = \sup_{Q \in [0, 1]^{m}} | \frac{# {x_{k} : x_{k} \in Q}}{N} - vol Q |, Q - m$ -dim. Quader.

Hinter der Definition der Diskrepanz steckt die Idee, dass bei einer gleichmäßig verteilten Punktmenge die relative Anzahl der Punkte, die in einem Quader $Q \subset [0, 1]^{m}$ liegen, dem Volumen des Quaders entsprechen sollte, d. h. man vergleicht die Ausdrücke

\frac{# x_{k} \in Q}{# aller Punkte} \approx \frac{vol (Q)}{vol ([0, 1]^{m})} .

Definition 5.4

(1) Eine Folge ${x_{1}, x_{2}, \dots}$ mit $x_{k} \in [0, 1]^{m}$ heißt gleichmäßig verteilt in $[0, 1]^{m}$ , wenn gilt:

\lim_{N \to \infty} D_{N} = 0 .

(2) Eine Folge ${x_{1}, x_{2}, \dots}$ mit $x_{k} \in [0, 1]^{m}$ heißt von niedriger Diskrepanz, wenn es eine Konstante $C_{m} > 0$ gibt, so dass für alle genügend große $N \in ℕ$ gilt:

D_{N} \leq C_{m} \frac{(\log N)^{m}}{N} .

Die Maßzahl der Diskrepanz ermöglicht die Angabe einer Schranke für den Fehler der Monte-Carlo-Integration. Zahlenfolgen von niedriger Diskrepanz werden auch Quasi-Zufallszahlen genannt. Das ist jedoch nicht sehr logisch, weil es sich um deterministische Folgen handelt. Wir untersuchen Beispiele und geben eine Tabelle für das Verhalten verschiedener Nullfolgen an:

\begin{matrix} N & \frac{1}{\sqrt{N}} & \frac{\log N}{N} & \frac{(\log N)^{2}}{N} & \frac{(\log N)^{3}}{N} \\ 1 0^{1} & 0.3162277660 & 0.2302585093 & 0.5301898110 & 1.2208071554 \\ 1 0^{2} & 0.1000000000 & 0.0460517019 & 0.2120759244 & 0.9766457243 \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋮ \\ 1 0^{9} & 0.0000316228 & 0.0000000207 & 0.0000004295 & 0.0000088997 \end{matrix}

Beispiel 5.6

(1) Die Menge ${x_{1}, \dots, x_{N}}$ mit $x_{k} = k / N$ liefert eine Folge von niedriger Diskrepanz, weil $D_{N} = 1 / N$ ist. Allerdings muss für jedes $N$ eine neue Folge $x_{k}$ berechnet und im Falle der Monte-Carlo-Integration eine neue Funktionswertauswertung vorgenommen werden. Es ist praktisch viel effizienter, bereits berechnete Zahlen $x_{k}$ für wachsendes $N$ zu verwenden. Daher ist eine so konstruierte Folge ungeeignet. Der Wert $D_{N}$ lässt sich allerdings für $m = 1$ nicht weiter verbessern.

(2) Seien $U_{k} \in {0, \frac{1}{M}, \frac{2}{M}, \dots, \frac{M - 1}{M}}$ Pseudo-Zufallszahlen, die durch Kongruenz-Generatoren erzeugt werden. Diese sind nicht gleichmäßig verteilt, denn mit $Q^{'} = [\frac{1}{2 M + 2}, \frac{1}{M + 1}]$ folgt (wegen $U_{k} \notin Q^{'}$ )

D_{N} : = | \frac{# {U_{k} : U_{k} \in Q^{'}}}{N} - vol Q^{'} | = vol Q^{'} = \frac{1}{2 M + 2}

für

M \in ℕ

.

(3) Das Ziel, eine Punktfolge von niedriger Diskrepanz zu erzeugen, so dass mit wachsendem $N$ die Verteilung zunehmend feiner wird, wird mit der Corput-Folge erreicht:

{\frac{1}{2}, \frac{1}{4}, \frac{3}{4}, \frac{1}{8}, \frac{5}{8}, \frac{3}{8}, \frac{7}{8}, \frac{1}{16}, \dots} .

Das $k$ -te Element dieser Folge erhält man einfach durch Bit-Umkehr der Dualdarstellung von $k$ , d. h.

k = (d_{j} \dots d_{0})_{2} : = \sum_{ν = 0}^{j} d_{ν} \cdot 2^{ν} \mapsto x_{k} = (. d_{0} \dots d_{j})_{2} : = \sum_{ν = 0}^{j} d_{ν} \cdot 2^{- ν - 1} .

Beispielsweise erhält man

k = 6 = (110)_{2} \mapsto x_{k} = (. 011)_{2} = \frac{0}{2^{1}} + \frac{1}{2^{2}} + \frac{1}{2^{3}} = \frac{3}{8} .

Dieser Ansatz läßt sich auf eine Basis $b \geq 2$ verallgemeinern, indem definiert wird

k = \sum_{ν = 0}^{j} d_{ν} \cdot b^{ν} \mapsto x_{k} = ϕ_{b} (ν) : = \sum_{ν = 0}^{j} d_{ν} \cdot b^{- ν - 1} .

Man nennt $ϕ_{b}$ die Radix-inverse Funktion. Das folgende Matlab-Programm erzeugt die ersten $N$ Corput-Zahlen zur Basis $b$ .

% Berechnung der ersten N Corput-Zahlen zur Basis b
function x = corput(N,b)
  m = fix(log(N)/log(b)); % hoechste Potenz bestimmen
  D = [ ];
  n = 1:N;
  for i = 0:m % bestimme alle x(i) simultan
    d = mod(n,b);
    n = (n−d)/b;
    D = [D;d];
  end
  x = ((1/b).^(1:(m+1)))*D;

Die Idee des Algorithmus basiert auf der Formulierung

k = (d_{ν} b^{ν - 1} + \dots + d_{1}) \cdot b + d_{0},

d. h. die Ziffern $d_{j}$ werden durch Abdividieren von $b$ ermittelt.

(4) Die Radix-inverse Funktion erlaubt auch die Konstruktion von Punkten in $[0, 1]^{m}$ . Es seien $p_{1}, \dots, p_{m}$ paarweise teilerfremde natürliche Zahlen. Dann heißt die Menge der Vektoren

x_{k} = (ϕ_{p_{1}} (k), \dots, ϕ_{p_{m}} (k)), k \in ℕ,

Halton-Folge. Für $p_{1} = 2$ und $p_{2} = 3$ erzeugt man mit dem folg. Matlab-Programm.

% Berechnet zwei-dimensionale Halton-Folge
p1 = 2; p2 = 3; N = 10000;
x = [corput(N,p1); corput(N,p2)];
plot(x(1,:),x(2,:),’.’)

Beispiel 5.7

Die Halton-Folge kann dazu benutzt werden, um den Preis einer Basket-Option auf eine große Zahl von Basiswerten (vgl. Bsp. 5.2) zu berechnen. Wir betrachten das Integral

θ = \int_{(0, 1)^{m}} e^{- | x |^{2} / 2} d x, x = (x_{1}, \dots, x_{m})^{T},

wobei $m ≫ 1$ ; zum Vergleich steht der exakte Wert des Integrals zur Verfügung. Mit $ϕ (x) - \frac{1}{2} = \frac{1}{2} \erf (\frac{x}{\sqrt{2}})$ und $ϕ (x) = \sqrt{2 π} \int_{- \infty}^{x} \exp (- ξ^{2} / 2) d ξ$ folgt nämlich

θ = \prod_{k = 1}^{m} \int_{0}^{1} \exp (- \frac{x_{k}^{2}}{2}) d x_{k}

, (Satz von Fubini, feste Grenzen)

= \prod_{k = 1}^{m} (\int_{- \infty}^{1} \exp (- \frac{x_{k}^{2}}{2}) d x_{k} - \int_{- \infty}^{0} \exp (- \frac{x_{k}^{2}}{2}) d x_{k})

= \prod_{k = 1}^{m} \sqrt{2 π} (ϕ (1) - ϕ (0)) = \prod_{k = 1}^{m} \sqrt{2 π} (ϕ (1) - \frac{1}{2})

= {(\sqrt{\frac{π}{2}} \erf (\frac{1}{\sqrt{2}}))}^{m} .

Als Schätzer für das Integral $θ$ verwenden wir

θ_{N} = \frac{1}{N} \sum_{j = 1}^{N} \exp (\frac{| x^{(j)} |^{2}}{2}) d x,

wobei $x^{(1)}, \dots, x^{(N)}$ $m$ -dimensionale Halton-Zahlen sind. Das folgende Matlab-Programm realisiert die Konstruktion.

\begin{matrix} N & m = 10 & m = 20 & m = 50 & CPU-Zeit [s] \\ 1000 & 0.213699 & 4.7695135 e-02 & 5.4333431 e-03 & 0.08 \\ 10000 & 0.210716 & 4.4806662 e-02 & 8.9903270 e-04 & 1.16 \\ 100000 & 0.210343 & 4.4285053 e-02 & 4.6574057 e-04 & 15.02 \\ 200000 & 0.210323 & 4.4257742 e-02 & 4.4108892 e-04 & 30.33 \\ 500000 & 0.210306 & 4.4241263 e-02 & 4.2502363 e-04 & 79.80 \\ exakt & 0.21029627 & 4.42245209 e-02 & 4.11299177 e-04 \end{matrix}

% Approximation des Integrals von exp(-|x|^2/2)dx ueber (0,1)^m
% mit Hilfe von Halton-Zahlen
m = 50; % Dimension des Integrals
n = 10000; % Anzahl der Punkte
p = primes(10*n); % die ersten 10*n Primzahlen
% Konstruktion der m-dimensionalen Haltonzahlen
x = [ ];
for i=1:m
  x = [x;corput(n,p(i))];
end
% Berechnung der Approximation
q = zeros(n,1)’;
for i=1:m
  q = q + x(i,:).*x(i,:);
end
int = mean(exp(−q/2))

In der obigen Tabelle sind die berechneten Werte im Vergleich mit den exakten Werten angegeben. Für größere Dimensionen müssen recht viele Halton-Punkte benutzt werden, um eine vertretbare Genauigkeit zu erhalten. Allerdings ist die Anzahl dieser Punkte wesentlich geringer als bei einer Auswertung mit Quadraturformeln.

5.3 Numerische Integration stochastischer Differentialgleichungen

Wir leiten einige Approximationen für stochastische Differentialgleichungen her und untersuchen, in welchem Sinne diese Approximationen gegen die ”exakte” Lösung der Differentialgleichung konvergieren.

Starke und schwache Konvergenz:
Für eine gewöhnliche Differentialgleichung

\frac{d x (t)}{d t} = a (x (t), t)

bzw.

d x = a (x (t), t) d t, t > 0

,

mit Lipschitz-stetiger Funktion $x \mapsto a (x, t)$ kann man zeigen, dass das Euler-Verfahren mit der Schrittweite $h > 0$

y_{k + 1} = y_{k} + h a (y_{k}, t_{k}), k = 0, 1, \dots,

wobei $t_{k} = k h$ gilt, die Konvergenzordnung 1 hat, d. h.

\sup_{k = 0, \dots, n} | x (t_{k}) - y_{k} | \leq C \cdot h .

Hierbei ist $C > 0$ eine von $h$ unabhängige Konstante. Gilt diese Aussage auch für das Euler-Maruyama-Verfahren (5.4) für stochastische Differentialgleichungen?

Wir betrachten zunächst für $0 < t < T$ die skalare stochastische Differentialgleichung (Abkürzung: SDE)

(5.5)

d x_{t} = a (x_{t}, t) d t + b (x_{t}, t) d W_{t}

für einen gegebenen Wiener-Prozess $W_{t}$ . Das Euler-Maruyama-Verfahren für diese SDE lautet (mit der Schrittweite $h = t_{k + 1} - t_{k}, T = n h$ und Startwert $y_{0} = x_{0}$ ):

(5.6) Für

k = 0, \dots, n - 1

:

t_{k + 1} = t_{k} + h,

Δ W_{k} = W_{t_{k + 1}} - W_{t_{k}},

y_{k + 1} = y_{k} + a (y_{k}, t_{k}) h + b (y_{k}, t_{k}) Δ W_{k},

wobei die Realisierungen des Wiener-Prozesses $W_{t}$ dieselben sind, wie diejenigen für die SDE (5.5). Das erlaubt es, die Trajektorien $x_{t_{k}}$ mit $y_{k}$ paarweise zu vergleichen und einen punktweisen Fehler $| x_{t_{k}} - y_{k} |$ oder $| x_{T} - x_{T}^{h} |$ einzuführen, wobei $x_{T}^{h} : = y_{n}$ ist. Uns interessiert ein ”gemittelter” Fehler:

Definition 5.5

Der absolute Fehler der Differenz $x_{T} - x_{T}^{h}$ ist definiert durch

(5.7)

ε (h) = E (| x_{T} - x_{T}^{h} |) .

Analog zum Fall gewöhnlicher Differentialgleichungen definieren wir die Konvergenz wie folgt:

Definition 5.6

Sei $x_{t}$ eine Lösung einer SDE und $x_{t}^{h}$ eine Approximation von $x_{t}$ . Wir sagen, $x_{T}^{h}$ konvergiert stark mit der Ordnung $γ > 0$ gegen $x_{T}$ , falls eine Konstante $C > 0$ existiert, so dass für alle (genügend kleinen) $h > 0$ gilt:

(5.8)

ε (h) \leq C h^{γ} .

Die Folge ${x_{T}^{h}}$ heißt stark konvergent gegen $x_{T}$ , wenn

\lim_{h \to 0} ε (h) = 0 .

Zur Berechnung des Erwartungswertes (5.7) bestimmen wir für die Stichprobe $X = (X_{1}, \dots, X_{n})$ den Wert, den der Schätzer (d. h. eine Approximation) für den Erwartungswert $E (X)$ liefert:

θ_{n} = \frac{1}{n} \sum_{k = 1}^{n} X_{k} .

Der Schätzer ist erwartungstreu, d. h.

E (θ_{n}) = \frac{1}{n} \sum_{k = 1}^{n} E (X_{k}) = \frac{1}{n} \sum_{k = 1}^{n} E (X) = E (X)

und die Varianz konvergiert gegen Null für $n \to \infty$ :

Var (θ_{n}) = \frac{1}{n^{2}} \sum_{k = 1}^{n} Var (X_{k}) = \frac{1}{n} Var (X) \to 0 (n \to \infty) .

Wir untersuchen das Euler-Maruyama-Verfahren, angewandt auf die bekannte SDE

(5.9)

d X_{t} = μ X_{t} d t + σ X_{t} d W_{t},

empirisch auf starke Konvergenz. Nehmen wir an, die Ungleichung (5.8) gilt annähernd als Gleichung. Dann folgt

\log ε (h) \approx \log C + γ \log h .

Wenn wir also $ε (h)$ über $h$ mit einer doppeltlogarithmischen Skala plotten, so können wir die Konvergenzordnung als Steigung der Geradengleichung

y (x) \approx \log C + γ x

mit

y (x) = \log ε (h), x = \log (h)

bestimmen. Hierzu erzeugen wir $N$ Realisierungen $W_{t}^{1}, \dots, W_{t}^{N}$ eines Wiener-Prozesses und lösen für jede dieser Realisierungen

die SDE (5.5) exakt, nämlich (vgl. Kap. 3.3)

x_{t}^{k} = x_{0} \exp ((μ - \frac{1}{2} σ^{2}) t + σ W_{t}^{k}), k = 1, \dots, N

und notieren

x_{T}^{k}

.

die Approximation (5.6) mit Schrittweiten $h_{1}, \dots, h_{m}$ numerisch und notieren $x_{T}^{k, h_{1}}, \dots, x_{T}^{k, h_{m}}$ .

% Test auf starke Konvergenz des Euler-Maruyama-Verfahrens
randn(’state’,3)
mu = 2; sigma = 1; X0 = 1; T = 1;
N = 1000; % Anzahl der Pfade der Brownschen Bewegung
m = 6;    % Anzahl der verschiedenen Schrittweiten
K = 2^9;  % Anzahl der Gitterpunkte, wenn T = 1
h = T/K;  % kleinste Schrittweite
for s=1:N
  dW = sqrt(h)*randn(1,K);
  W = sum(dW);
  Xexakt = X0*exp((mu−sigma^2/2)+sigma*W(end));
  for p=1:m
    R = 2^(p−1);
    dt = R*h; % aktuelle Schrittweite
    L = K/R;  % Anzahl der Euler-Schritte
    X = X0;
    for j=1:L
      Wink = sum(dW(R*(j−1)+1:R*j));
      X = X + mu*X*dt + sigma*X*Wink;
    end
  Xerr(s,p) = abs(X − Xexakt);
  end
end
% Plotten der Fehler und einer Geraden mit Steigung 1/2
dtlist = h*(2.^(0:m−1));
loglog(dtlist,mean(Xerr),’*-’), hold on
loglog(dtlist,(dtlist.^(0.5)),’--’), hold off
% Kleinste-Quadrate-Methode Ax = b mit x = (logC gamma)
A = [ones(m,1), log(dtlist)’];
b = log(mean(Xerr)’);
x = A\b;
gamma = x(2), residuum = norm(A*x−b)

Der absolute Fehler $ε (h)$ wird durch den Schätzer

(5.10)

\hat{ε} (h_{j}) = \frac{1}{N} \sum_{k = 1}^{N} | x_{T}^{k} - x_{T}^{k, h_{j}} |

approximiert.

Das angegebene Matlab-Programm zum Euler-Maruyama-Verfahren realisiert diese Vorgehensweise zur Approximation von (5.9) für $μ = 2, σ = 1$ und $T = 1$ und erzeugt eine Abbildung, die den Fehlerschätzer $\hat{ε} (h)$ für verschiedene Schrittweiten $h$ darstellt. Die eingezeichnete Vergleichsgerade legt $γ = 0.5$ als Konververgenzordnung nahe. Tatsächlich ergibt eine lineare Ausgleichsrechnung $γ = 0.536$ bei einem Residuum von 0.026.

In vielen Anwendungen ist man nicht an den Trajektorien $x_{T}$ selbst, sondern nur an Momenten von $x_{T}$ (etwa dem Erwartungswert oder der Varianz) interessiert. Demzufolge suchen wir nur Approximationen von $E (x_{T})$ bzw. von $Var (x_{T})$ , nämlich $E (x_{T}^{h})$ bzw. $Var (x_{T}^{h})$ . Das führt auf den folgenden abgeschwächten Konvergenzbegriff.

Definition 5.7

Sei $x_{t}$ eine Lösung einer SDE und $x_{t}^{h}$ eine Approximation von $x_{t}$ . Wir nennen $x_{t}^{h}$ schwach konvergent bezüglich $g$ mit der Ordnung $γ > 0$ , wenn eine Konstante $C > 0$ existiert, so dass für alle (genügend kleinen) $h > 0$ gilt:

| E (g (x_{t})) - E (g (x_{t}^{h})) | \leq C h^{γ} .

Im Falle $g = i d$ (id - identischer Operator) nennen wir $x_{t}^{h}$ schwach konvergent mit der Ordnung $γ$ .

Da wir nicht an einer pfadweisen Konvergenz interessiert sind, können wir auch verschiedene Pfade für jeden Zeitschritt $y_{k} \mapsto y_{k + 1}$ im Algorithmus (5.6) verwenden.

Wir untersuchen die schwache Konvergenzordnung des Euler-Maruyama-Verfahrens. Es wird ein Test ähnlich dem obigen für die SDE (5.9) mit $μ = 2, σ = 0.1$ und $T = 1$ in einem Matlab-Programm realisiert.

% Test auf schwache Konvergenz des Euler-Maruyama-Verfahrens
randn(’state’,100)
mu = 2; sigma = 0.1; X0 = 1; T = 1;
N = 50000; % Anzahl der Pfade der Brownschen Bewegung
m = 5;     % Anzahl der verschiendenen Schrittweiten
for p=1:m
  h = 2^(p−10); % aktuelle Schrittweite
  L = T/h;      % Anzahl der Euler-Schritte
  X = X0*ones(N,1);
  for j=1:L
    dW = sqrt(h)*randn(N,1);
    X = X + mu*X*h + sigma*X.*dW;
  end
  Xerr(p) = abs(mean(X) − exp(mu));
end
% Plotten der Fehler und einer Geraden mit Steigung 1
dtlist = 2.^([1:m]−10);
loglog(dtlist,Xerr,’*-’), hold on
loglog(dtlist,dtlist,’--’), hold off
% Kleinste-Quadrate-Methode Ax = b mit x = (logC gamma)
A = [ones(m,1), log(dtlist)’];
b = log(Xerr)’;
x = A\b;
gamma = x(2), residuum = norm(A*x−b)

Man beachte, dass der Erwartungswert der exakten Lösung $x_{t}$ von (5.9) gleich $E (x_{t}) = \exp (μ t)$ ist.

Diesmal vermuten wir eine Konvergenzordnung von 1. Eine lineare Ausgleichsrechnung ergibt $γ = 0.9858$ bei einem Residuum von 0.0508.

Wir wollen nun Verfahren höherer Konvergenzordnung entwickeln. Dazu greifen wir auf eine spezielle Klasse von Integrationsverfahren zurück, die auch für gewöhnliche Differentialgleichungen verwendet werden, nämlich auf Taylorreihen-Verfahren.

Stochastische Taylorentwicklungen:
Zuerst betrachten wir das gewöhnliche (autonome) Anfangswertproblem

x^{'} (t) = a (x (t)), x \in ℝ^{n}, t > t_{0}, x (t_{0}) = 0 .

Um Verfahren höherer Ordnung als das Euler-Verfahren

y_{k + 1} = y_{k} + a (y_{k}) h, k = 0, 1, 2, \dots, y_{0} = x_{0}

für die Approximation $y_{k}$ von $x (t_{k})$ (mit $t_{k} = k h, h > 0$ ) herzuleiten, entwickeln wir die Lösung $x (t)$ in eine Taylorreihe um $t$ , wobei genügend hohe Regularität der Lösung vorausgesetzt wird:

x (t + h) = x (t) + h x^{'} (t) + \frac{h^{2}}{2} x^{″} (t) + \frac{h^{3}}{6} x^{‴} (t) + O (h^{4}) .

Rekursives Einsetzen der rechten Seite der DGl. liefert die Entwicklung

x (t + h) = x (t) + h a (x (t)) + \frac{h^{2}}{2} (a (x (t)))^{'} + \frac{h^{3}}{6} (a (x (t)))^{″} + O (h^{4})

= x (t) + h a (x (t)) + \frac{h^{2}}{2} a^{'} (x (t)) \cdot a (x (t)) + \frac{h^{3}}{6} [a^{″} (x (t)) (a (x (t)))^{2} + (a^{'} (x (t)))^{2} \cdot a (x (t))] + O (h^{4}),

wobei $a (x (t))^{2}$ das Argument des Tensors $a^{″} (x (t))$ ist, d. h.

a^{″} (x (t)) \cdot (a (x (t)))^{2} = a^{″} (x (t)) (a (x (t)), a (x (t))) \in ℝ^{n} .

Wählen wir $t = t_{k}$ und $y_{k} \approx x (t_{k})$ und vernachlässigen wir den Restterm $O (h^{4})$ , so erhalten wir das Taylor-Einschrittverfahren:

Für

k = 0, \dots, n - 1

:

a_{k} : = a (y_{k}), a'_{k} : = a^{'} (y_{k}), a^{'}'_{k} : = a^{″} (y_{k}),

y_{k + 1} = y_{k} + h a_{k} + \frac{h^{2}}{2} a'_{k} \cdot a_{k}^{2} + \frac{h^{3}}{6} [a^{'}'_{k} \cdot (a_{k})^{2} + (a'_{k})^{2} \cdot a_{k}]

Wir können diese Idee auf SDE übertragen, indem wir die Taylorentwicklung durch eine stochastische Version ersetzen. Diese liefert gerade das Lemma von Itô.

Wir betrachten zunächst zur Vereinfachung der Notation die skalare, eindimensionaleund autonome SDE

(5.11)

d x_{t} = a (x_{t}) d t + b (x_{t}) d W_{t} .

Das Lemma von Itô für $f (x_{t})$ lautet in Integralform für die nicht explizit von $t$ abhängige Funktion $f (x_{t})$

(5.12)

f (x_{t}) = f (x_{t_{0}}) + \int_{t_{0}}^{t} (f^{'} (x_{s}) a (x_{s}) + \frac{1}{2} f^{″} (x_{s}) (b (x_{s}))^{2}) d s + \int_{t_{0}}^{t} b (x_{s}) f^{'} (x_{s}) d W_{s} .

Speziell für $f (x) = x$ folgt

(5.13)

x_{t} = x_{t_{0}} + \int_{t_{0}}^{t} a (x_{s}) d s + \int_{t_{0}}^{t} b (x_{s}) d W_{s} .

Wir setzen (5.12) für $f = a$ und $f = b$ in (5.13) ein:

(5.14)

x_{t} = x_{t_{0}} + \int_{t_{0}}^{t} (a (x_{t_{0}}) + \int_{t_{0}}^{s} (a^{'} a + \frac{1}{2} a^{″} b^{2}) d z + \int_{t_{0}}^{s} a^{'} b d W_{z}) d s

+ \int_{t_{0}}^{t} (b (x_{t_{0}}) + \int_{t_{0}}^{s} (b^{'} a + \frac{1}{2} b^{″} b^{2}) d z + \int_{t_{0}}^{s} b^{'} b d W_{z}) d W_{s}

Dabei wurden die Abkürzungen $a = a (x_{z}), b = b (x_{z})$ usw. benutzt.

Fassen wir die Doppelintegrale zu einem Restterm $R$ zusammen, so erhalten wir

x_{t} = x_{t_{0}} + a (x_{t_{0}}) (t - t_{0}) + b (x_{t_{0}}) \int_{t_{0}}^{t} d W_{s} + R .

Vernachlässigen von $R$ liefert eine (recht umständliche) Herleitung des Euler-Maruyama-Verfahrens. Wir erhalten ein Verfahren höherer Ordnung, indem wir das Doppelintegral bezüglich $d W_{z} d W_{s}$ aus dem Restterm herausnehmen und den Integranden $b^{'} (x_{z}) \cdot b (x_{z})$ durch $b^{'} (x_{t_{0}}) \cdot b (x_{t_{0}})$ ersetzen:

x_{t} = x_{t_{0}} + a (x_{t_{0}}) (t - t_{0}) + b (x_{t_{0}}) \int_{t_{0}}^{t} d W_{s} + b^{'} (x_{t_{0}}) b (x_{t_{0}}) \int_{t_{0}}^{t} \int_{t_{0}}^{s} d W_{z} d W_{s} + \tilde{R} .

Die zugrunde liegende Idee ist, dass sich $\int_{t_{0}}^{t} f (x_{s}) d W_{s}$ durch $O (\sqrt{h})$ abschätzen lässt (motiviert durch die Merkregel $d W_{t} = \sqrt{d t}$ ; siehe Abschnitt 4), also sind alle anderen Terme in $\tilde{R}$ von höherer Ordnung als der zusätzliche Term mit $d W_{z} \cdot d W_{s}$ . Für die Fehlerterme gilt damit: $R = O (h)$ und $\tilde{R} = O (h^{3 / 2})$ . Wir berechnen die Doppelintegrale (analog wie in Kap. 4):

(5.15)

\int_{t_{0}}^{t} \int_{t_{0}}^{s} d W_{z} d W_{s} = \int_{t_{0}}^{t} (W_{s} - W_{t_{0}}) d W_{s} = \frac{1}{2} (W_{t}^{2} - W_{t_{0}}^{2}) - \frac{t - t_{0}}{2} - W_{t_{0}} (W_{t} - W_{t_{0}})

= \frac{1}{2} ((W_{t} - W_{t_{0}})^{2} - (t - t_{0})) .

Das führt auf das Milstein-Verfahren für die nicht-autonome SDE (5.5):

Für

k = 0, \dots, n - 1

:

t_{k + 1} : = t_{k} + h,

Δ W : = Z \sqrt{h}

mit

Z \sim 𝒩 (0, 1)

,

y_{k + 1} : = y_{k} + a (y_{k}, t_{k}) h + b (y_{k}, t_{k}) Δ W + \frac{1}{2} b^{'} (y_{k}, t_{k}) b (y_{k}, t_{k}) ((Δ W)^{2} - h)

, wobei

b^{'} = \frac{\partial b}{\partial x}

.

Um das Milstein-Verfahren für die SDE (5.9) mit $μ = 2, σ = 1$ und $T = 1$ in Matlab zu implementieren, genügt es, den Term $\frac{1}{2} σ^{2} X ((Δ W)^{2} - h)$ zu der Euler-Maruyama-Approximation von $X$ hinzuzufügen. Eine lineare Ausgleichsrechnung liefert $γ = 0.971$ bei einem Residuum von 0.048. Tatsächlich beträgt die starke Konvergenzordnung des Milstein-Verfahrens 1 (also um 1/2 besser als das Euler-Maruyama-Verfahren). Für einen Konvergenzbeweis verweisen wir auf [10].

Stochastische Runge-Kutta-Verfahren:
Als Beispiel für ein derartiges Verfahren leiten wir einen Algorithmus vom Milstein-Typ her. Um die Ableitung b'(x_t) zu ersetzen, entwickeln wir formal:

b (x_{t} + Δ x_{t}) - b (x_{t}) = b^{'} (x_{t}) Δ x_{t} + 𝒪 (| Δ x_{t} |^{2}) = b^{'} (x_{t}) (a (x_{t}) h + b (x_{t}) Δ W_{t}) + 𝒪 (h) = b^{'} (x_{t}) b (x_{t}) Δ W_{t} + 𝒪 (h) .

Ersetzen wir $Δ W_{t}$ durch den Mittelwert $\sqrt{h}$ (wieder wie in Kapitel 4), so folgt

b^{'} (x_{t}) b (x_{t}) = \frac{1}{\sqrt{h}} (b (x_{t} + Δ x_{t}) - b (x_{t})) + 𝒪 (\sqrt{h}) = \frac{1}{\sqrt{h}} (b (x_{t} + a (x_{t}) h + b (x_{t}) Δ W_{t}) - b (x_{t})) + 𝒪 (\sqrt{h}) .

Damit erhalten wir die stochastische Runge-Kutta-Variante des Milstein-Verfahrens:

(5.16) Für

k = 0, \dots, n - 1

:

t_{k + 1} : = t_{k} + h,

Δ W : = Z \sqrt{h}

mit

Z \sim 𝒩 (0, 1)

,

\hat{y} : = y_{k} + a (y_{k}, t_{k}) h + b (y_{k}, t_{k}) \sqrt{h},

y_{k + 1} : = y_{k} + a (y_{k}, t_{k}) h + b (y k, t k) Δ W + \frac{1}{2 \sqrt{h}} (b (\hat{y}, t_{k}) - b (y_{k}, t_{k})) ((Δ W)^{2} - h) .

Bemerkung:

Wie kann eine allgemeine Klasse von stochastischen Runge-Kutta-Verfahren aussehen? Ein Versuch wäre die Definition

y_{k + 1} = y_{k} + h \sum_{j = 1}^{s} d_{j} a ({\hat{y}}_{j}) + Δ W \sum_{j = 1}^{s} e_{j} b ({\hat{y}}_{j})

mit den Zuwächsen

{\hat{y}}_{j} = y_{j} + h \sum_{ν = 1}^{s} D_{j ν} a (y_{ν}) + Δ W \sum_{ν = 1}^{s} E_{j ν} b (y_{ν}), j = 1, \dots, s .

Leider gibt es hierfür eine Schranke für die Konvergenzordnung. Derartige Verfahren können höchstens eine (starke) Konvergenzordnung von 1 haben und sind folglich nicht besser als das Milstein-Verfahren oder die oben konstruierte Runge-Kutta-Methode. Umgehen kann man diese Schranke nur, wenn weitere Zufallsvariable benutzt werden, um die Integrale der stochastischen Taylor-Entwicklung zu approximieren. Dann ersetzt man die Ausdrücke $e_{j} Δ W$ bzw. $E_{j ν} Δ W$ durch Zufallsvariable $Z_{j}$ bzw. $Z_{j k}$ . Details findet man in der Literatur [1].

Systeme von SDE:
Wir können das Milstein-Verfahren auf Systeme von SDE der Dimension $n$ mit $m$ Wiener-Prozessen $W_{t} = (W_{t}^{1}, \dots, W_{t}^{m})$ verallgemeinern:

d x_{t} = a (x_{t}, t) d t + b (x_{t}, t) d W_{t},

wobei gilt

a : ℝ^{n} \times ℝ \to ℝ^{n}, b = (b^{j ν}) : ℝ^{n} \times ℝ \to ℝ^{n \times m} .

Solche Fälle treten etwa bei der Modellierung von Optionen mit stochastischer Volatilität (Bsp. 5.1) oder bei der Modellierung von Basket-Optionen (Bsp. 5.2) auf. Ist $(W_{t}^{1}, \dots, W_{t}^{n})$ eine $n$ -dimensionale Bewegung, so lautet die Gleichung, die die Dynamik der Aktienkurse $S_{t}^{1}, \dots, S_{t}^{n}$ beschreibt,

d S_{t}^{j} = μ_{t}^{j} S_{t}^{j} d t + \sum_{k = 1}^{n} σ_{t}^{j k} d W_{t}^{k}, j = 1, \dots, n .

Der Fall eines einzigen Wiener-Prozesses $m = 1$ ist einfach. Der Term $b^{'} b$ geht für $b = (b^{1}, \dots, b^{n})^{T}$ über in

D b (x_{t}, t) b (x_{t}, t) = (\begin{matrix} \frac{\partial b^{1}}{\partial x_{1}} & \dots & \frac{\partial b^{1}}{\partial x_{n}} \\ ⋮ & ⋱ & ⋮ \\ \frac{\partial b^{n}}{\partial x_{1}} & \dots & \frac{\partial b^{n}}{\partial x_{n}} \end{matrix}) (\begin{matrix} b^{1} \\ ⋮ \\ b^{n} \end{matrix})

und das Milstein-Verfahren schreibt sich als

y_{k + 1} = y_{k} + a (y_{k}, t_{k}) h + b (y_{k}, t_{k}) Δ W + \frac{1}{2} ((Δ W)^{2} - h) D b (y_{k}, t_{k}) b (y_{k}, t_{k}) .

Ähnlich lässt sich das obige stochastische Runge-Kutta-Verfahren umformulieren.

Der allgemeine Fall von $m > 1$ Wiener-Prozessen ist komplizierter. Wiederholen wir die Herleitung des Milstein-Verfahrens für skalare SDE, so erhalten wir das Milstein-Verfahren für Systeme:

(5.17)

y_{k + 1}^{s} = y_{k}^{s} + a^{s} (y_{k}, t_{k}) h + \sum_{j = 1}^{m} b^{s j} (y_{k}, t_{k}) Δ W^{j} + \sum_{i, j = 1}^{m} \sum_{l = 1}^{n} b^{l j} \frac{\partial b^{s i}}{\partial x_{l}} (y_{k}, t_{k}) \int_{t_{k}}^{t_{k + 1}} \int_{t_{k}}^{τ} d W_{z}^{j} d W_{τ}^{i}, s = 1, \dots, n .

Wir sind hier mit zwei Problemen konfrontiert:

Die stochastischen Integrale

I_{j i} : = \int_{t_{k}}^{t_{k + 1}} \int_{t_{k}}^{τ} d W_{z}^{j} d W_{τ}^{i}

sind nicht mehr einfach auf elementare Integrale der Form

(5.18)

Δ W^{ν} = \int_{t_{k}}^{t_{k + 1}} d W_{τ}^{ν}

zurückführbar. Die Frage ist, wie sie sich berechnen lassen.

Die Differentialoperatoren

L_{j} : = \sum_{l = 1}^{n} b^{l j} \frac{\partial}{\partial x_{l}}

müssen auf alle Spaltenvektoren

b^{ν} = (b^{s ν})_{s = 1}^{n}

angewendet werden. Dies ist sehr mühsam, wie kann es vermieden werden?

Eine Möglichkeit, das erste Problem zu lösen, ist, die Integrale $I_{j i}$ bis auf einen Fehler $𝒪 (h)$ zu approximieren, denn damit bleibt die Konvergenzordnung 1 des Milstein-Verfahrens erhalten. Interessanterweise sind die Integrale Lösungen eines (einfachen) Systems von SDE. Approximieren wir die Lösungen, so erhalten wir auch Approximationen der Integrale $I_{j i}$ . Wir zeigen, wie das Integral $I_{21}$ approximiert werden kann; der allgemeine Fall funktioniert analog. Die Behauptung ist, dass $I_{21}$ die erste Komponente der Lösung des Systems

d x_{t} = (\begin{matrix} x_{t}^{2} & 0 \\ 0 & 1 \end{matrix}) d W_{t}, t_{k} \leq t \leq t_{k + 1}, x_{t} = (\begin{matrix} 0 \\ 0 \end{matrix})

an der Stelle $t = t_{k + 1}$ ist. Dies beweisen wir in dem folgenden Lemma.

Lemma 5.1

Die Lösung $x_{t}$ von (5.19) lautet an der Stelle $t = t_{k + 1}$ :

$x_{t_{k + 1}} = (\begin{matrix} I_{21} \\ Δ W^{2} \end{matrix})$ , wobei gilt $Δ W^{2} = W_{t_{k + 1}}^{2} - W_{t_{k}}^{2}$ .

Beweis:

Aus der zweiten Gleichung $d x_{t} = d W_{t}^{2}$ ergibt sich mit dem Anfangswert $x_{t_{k}}^{2} = 0$ durch Integration

x_{t_{k + 1}}^{2} = x_{t_{k}}^{2} + \int_{t_{k}}^{t_{k + 1}} d W_{s}^{2} = \int_{t_{k}}^{t_{k + 1}} d W_{s}^{2} = W_{t_{k + 1}}^{2} - W_{t_{k}}^{2} .

Für die erste Komponente folgt

x_{t_{k + 1}}^{1} = x_{t_{k}}^{1} + \int_{t_{k}}^{t_{k + 1}} x_{s}^{2} d W_{s}^{2} = \int_{t_{k}}^{t_{k + 1}} x_{s}^{2} d W_{s}^{2} = \int_{t_{k}}^{t_{k + 1}} \int_{t_{k}}^{s} d W_{τ}^{2} d W_{s}^{1} .

q.e.d.

Wir zerlegen das Intervall $[t_{k}, t_{k + 1}]$ in $N$ Teilintervalle der Länge $δ = (t_{k + 1} - t_{k}) / N$ . Sei $z_{ν}$ die Approximation von $x_{t_{k + ν δ}}$ . Dann ist $z_{0} = (0, 0)^{T}$ . Die Euler-Maruyama-Approximation von (5.19) lautet dann:

(5.20) Für

k = 0, \dots, n - 1

:

Δ W_{k} : = W_{t_{k} + (ν + 1) δ} - W_{t_{k} + ν δ}

z_{ν + 1} : = z_{ν} + (\begin{matrix} z_{k}^{2} & 0 \\ 0 & 1 \end{matrix}) Δ W_{ν} .

Diese Methode liefert tatsächlich eine Approximation von $I_{21}$ der Ordnung 1, wenn $N = 1 / h$ und $h = t_{k + 1} - t_{k}$ gilt, denn das Euler-Maruyama-Verfahren hat die Konvergenzordnung 1/2, und damit gilt wegen $δ = h^{2}$ :

E (| z_{N}^{1} - I_{21} |) \leq C δ^{1 / 2} = C h .

Wir kommen nun auf das zweite Problem zurück. Die Differentiation der Spaltenvektoren $b^{ν} = (b_{s}^{s ν})_{s}$ kann vermieden werden, indem wir ein stochastisches Runge-Kutta-Verfahren – wie im skalaren Fall beschrieben – verwenden.

Lemma 5.2

Es gilt die Approximation:

(5.21)

L_{j} b^{ν} (y_{k}, t_{k}) = \sum_{l = 1}^{n} b^{l j} (y_{k}, t_{k}) \frac{\partial b^{ν}}{\partial x_{l}} (y_{k}, t_{k}) = \frac{1}{\sqrt{h}} (b^{ν} ({\hat{y}}^{j}, t_{k}) - b^{ν} (y_{k}, t_{k})) + 𝒪 (\sqrt{h}),

wobei gilt

(5.22)

{\hat{y}}^{j} = y_{k} + a (y_{k}, t_{k}) h + b^{j} (y_{k}, t_{k}) \sqrt{h} .

Beweis:

Für die rechte Seite von (5.21) liefert eine Taylorentwicklung:

\frac{1}{\sqrt{h}} (b^{ν} ({\hat{y}}^{j}, t_{k}) - b^{ν} (y_{k}, t_{k})) = \frac{1}{\sqrt{h}} (D b^{ν} \cdot ({\hat{y}}^{j} - y_{k}) + 𝒪 (h))

= \frac{1}{\sqrt{h}} (D b^{ν} \cdot (a h + b^{j} \sqrt{h}) + 𝒪 (h)) = D b^{ν} \cdot b^{j} + 𝒪 (\sqrt{h}),

wobei wir das Argument $(y_{k}, t_{k})$ weggelassen haben. Die $s$ -te Komponente von (5.24) ist gleich

(D b^{ν} \cdot b^{j})_{s} = \sum_{l = 1}^{n} \frac{\partial b^{s ν}}{\partial x_{l}} b^{l j} = (L_{j} b^{ν})_{s}

und das ist gerade die linke Seite von (5.21).

q.e.d.

Wir erhalten zusammengefasst das stochastische Runge-Kutta-Verfahren erster Ordnung für Systeme:

y_{k + 1} : = y_{k} + a (y_{k}, t_{k}) h + b (y_{k}, t_{k}) Δ W + \frac{1}{\sqrt{h}} \sum_{j, ν = 1}^{m} (b^{ν} ({\hat{y}}^{ν}, t_{k}) - b^{ν} (y_{k}, t_{k})) I_{j ν} .

Dies ist die Verallgemeinerung des stochastischen Runge-Kutta-Verfahrens (5.17) für den skalaren Fall. Die Zwischenwerte ${\hat{y}}_{j}$ sind in (5.22) definiert, $Δ W$ ist durch (5.18) gegeben und die Integrale $I_{j ν}$ können mittels (5.21) approximiert werden.

Bemerkung:

In speziellen Fällen können die Integrale $I_{j ν}$ explizit berechnet werden:

1. Für $j = ν$ erhalten wir wegen (5.16)

I_{j j} = \frac{1}{2} ((Δ W_{k}^{j})^{2} - h)

mit $Δ W_{k}^{j} = W_{t_{k + 1}}^{j} - W_{t_{k}}^{j}$ und $h = t_{k + 1} - t_{k}$ .

2. Hängt $b$ nicht von $x$ ab (man spricht auch von additivem Rauschen), verschwindet die Ableitung $\partial b / \partial x_{l}$ und das Milstein- und das Runge-Kutta-Verfahren reduzieren sich zum Euler-Maruyama-Verfahren.

3. Falls $b = diag (b_{1} (x_{1}, t), \dots, b_{n} (x_{n}, t))$ (sog. diagonales Rauschen), folgt

L_{j} b^{ν} = {\begin{matrix} 0, & j \neq ν \\ b_{j} \frac{\partial b_{j}}{\partial x_{j}}, & j = ν \end{matrix}

und es sind nur Auswertungen von $I_{j j}$ erforderlch.

Weitere Diskretisierungen von SDE und Konvergenzbeweise sind in [10] zu finden; für Matlab-Routinen siehe [6], [7].

5.4 Varianzreduktion

In Abschnitt 5.1 haben wir gesehen, dass sehr viele Monte-Carlo-Simulationen notwendig sind, um einen halbwegs akkuraten Preis einer Option zu erhalten. In Abbildung 5.12 schwankt der Preis einer europäischen Put-Option zwischen 16.7 und 17.3 (bei einem exakten Wert von 16.98), selbst bei mehr als 10 000 Simulationen. In diesem Abschnitt geben wir einen Grund für dieses langsame Konvergenzverhalten an und stellen zwei Methoden vor, mit denen die Genauigkeit ohne großen Aufwand verbessert werden kann.

Sei $θ_{n}$ die Monte-Carlo-Approximation eines exakten Wertes $θ$ . Beispiele für $θ_{n}$ und $θ$ sind

die Lösung einer stochastischen Differentialgleichung (SDE):

θ = x_{T}

Lösung einer SDE

d x = a (x, t) d t + b (x, t) d W

,

θ_{N} = y_{N}

Approximation von

x_{T}

bei

t_{N} = T

,

die stochastische Integration:

θ = \int_{Ω} g (x) d x = \int_{Ω} \frac{g (x)}{f (x)} f (x) d x = E (ϕ (x)),

θ_{n} = \frac{1}{n} \sum_{k = 1}^{n} ϕ (X_{k}),

wobei

ϕ (x) = g (x) / f (x)

und

X_{k}

sind Stichproben einer nach

F

verteilten Zufallsvariablen mit

F^{'} = f

sind.

Der Fehler der Monte-Carlo-Methode $| θ_{n} - θ |$ ist selbst eine Zufallsvariable und so können wir nur Fehlergrenzen für gewisse Sicherheitswahrscheinlichkeiten angeben. Wir illustrieren dies für den Fall, dass $θ_{n}$ eine stochastische Approximation eines Integrals mit dem Wert $θ$ darstellt (siehe oben). Wir nehmen an, dass $E (ϕ (X_{k})) = θ$ und $Var (ϕ (X_{k})) = σ^{2}$ für alle $k = 1, \dots, n$ gilt. Dann folgt

Var (θ_{n}) = \frac{1}{n^{2}} \sum_{k = 1}^{n} Var (ϕ (X_{k})) = \frac{σ^{2}}{n},

E (θ_{n}) = \frac{1}{n} \sum_{k = 1}^{n} E (ϕ (X_{k})) = θ .

Wir benutzen nun die Chebychev-Ungleichung für beliebige quadratisch integrierbare Zufallsvariable $Y$

P (| Y - E (Y) | \geq δ) \leq \frac{Var (Y)}{δ^{2}}, δ > 0

für $δ = σ / \sqrt{ε n}$ , um die elementare Fehlerabschätzung

P (| θ_{n} - θ | \geq \frac{σ}{l \sqrt{ε n}}) \leq ε

oder äquivalent

P (| θ_{n} - θ | < \frac{σ}{l \sqrt{ε n}}) \geq ε

zu erhalten. Diese Ungleichung bedeutet, dass der Fehler $| θ_{n} - θ |$ umso kleiner wird, je größer die Stichprobenzahl $n$ ist. Allerdings muss zur Reduktion des Fehlers (oder der Standardabweichung $\sqrt{Var (θ_{n})}$ ) um eine Dezimalstelle (also um den Faktor 10) die Stichprobenzahl um den Faktor 100 erhöht werden! Dies erklärt die langsame Konvergenz der Monte-Carlo-Simulationen. Eine andere Idee, den Fehler zu verkleinern, ist es, die Varianz $Var (θ_{n})$ möglichst klein zu halten. Diese Möglichkeit der Konvergenzverbesserung bezeichnet man als Technik der Varianzreduktion. Wir skizzieren zwei Techniken:

die Methode der Abtrennung des Hauptteils und
die Methode der antithetischen Variablen.

Die Methode der Abtrennung des Hauptteils versucht, durch geschicktes Hinzuaddieren eines zweiten Integranden die Gesamtvarianz des Schätzers zu verkleinern. Wir nehmen an, dass das Integral $θ^{*} = \int_{Ω} ψ (x) f (x) d x$ für eine Funktion $ψ$ (Hauptteil genannt) analytisch berechenbar ist. Die Formulierung

θ = \int_{Ω} (ϕ (x) - ψ (x)) f (x) d x + \int_{Ω} ψ (x) f (x) d x

motiviert dann den neuen Schätzer

{\hat{θ}}_{n} = \frac{1}{n} \sum_{k = 1}^{n} (ϕ (X_{k}) - ψ (X_{k})) + \int_{Ω} ψ (x) f (x) d x = θ_{n} - θ_{n}^{*} + θ^{*}

, wobei

θ_{n}^{*} = \frac{1}{n} \sum_{k = 1}^{n} ψ (X_{k})

.

Der Hauptteil $ψ$ sollte möglichst ”einfach” sein, so dass das Integral $θ^{*}$ analytisch bestimmt werden kann, aber zugleich der Funktion $ϕ$ möglichst ”ähnlich” sein, damit die Varianz von ${\hat{θ}}_{n}$ kleiner wird als die Varianz von $θ_{n}$ . Warum sollte das funktionieren? Wenn $ϕ$ und $ψ$ sehr ”ähnlich” sind, erwarten wir, dass sowohl $θ$ und $θ^{*}$ als auch die Approximationen $θ_{n}$ und $θ_{n}^{*}$ ”ähnlich” sind. Dann sollte auch die Korrelation zwischen $θ_{n}$ und $θ_{n}^{*}$ groß sein und nahe der oberen Schranke liegen, also:

(5.24)

Cov (θ_{n}, θ_{n}^{*}) \approx \frac{1}{2} (Var (θ_{n}) + Var (θ_{n}^{*})) > \frac{1}{2} Var (θ_{n}^{*}) .

Die obere Schranke lautet tatsächlich $\frac{1}{2} (Var (θ_{n}) + Var (θ_{n}^{*}))$ , denn aus der Beziehung

(5.25)

Var (X \pm Y) = Var (X) + Var (Y) \pm 2 Cov (X, Y)

für die zwei Zufallsvariablen $X$ und $Y$ folgt wegen $Var (X \pm Y) \geq 0$ die Ungleichung

(5.26)

Cov (X, Y) \leq \frac{1}{2} (Var (X) + Var (Y)) .

Dann folgt für die neue Zufallsvariable:

Var ({\hat{θ}}_{n}) = Var (θ_{n} - θ_{n}^{*})

(denn

θ^{*}

ist konstant)

= Var (θ_{n}) + Var (θ_{n}^{*}) - 2 Cov (θ_{n}, θ_{n}^{*})

(wegen (5.25))

< Var (θ_{n})

(wegen (5.24))

und die Varianz ist tatsächlich verringert worden.

Die zweite Methode führt eine sogenannte antithetische Variable ein. Sei $θ_{n}$ mittels einer Zufallsvariablen $Z \sim 𝒩 (0, 1)$ erzeugt worden. Definiert man dann eine Approximation $θ_{n}^{-}$ , die genauso wie $θ_{n}$ erzeugt wurde, aber mit $- Z \sim 𝒩 (0, 1)$ ist. Die antithetische Variable lautet

{\hat{θ}}_{n} = \frac{1}{2} (θ_{n} + θ_{n}^{-}) .

Wir behaupten, dass die Varianz von ${\hat{θ}}_{n}$ kleiner ist als die von $θ_{n}$ (zumindest wenn $Var (θ_{n}) \approx Var (θ_{n}^{*})$ . Aus (5.25) folgt

Var {\hat{θ}}_{n} = \frac{1}{4} Var (θ_{n} + θ_{n}^{-}) = \frac{1}{4} (Var (θ_{n}) + Var (θ_{n}^{-}) + 2 Cov (θ_{n}, θ_{n}^{*}))

und unter Berücksichtigung von (5.26) erhalten wir

Var {\hat{θ}}_{n} < {\begin{matrix} \frac{1}{4} (Var (θ_{n}) + Var (θ_{n}^{-})), & wenn Cov (θ_{n}, θ_{n}^{-}) \leq 0 \\ \frac{1}{2} (Var (θ_{n}) + Var (θ_{n}^{-})), & wenn Cov (θ_{n}, θ_{n}^{-}) > 0 \end{matrix}

Im Falle $Var (θ_{n}) \approx Var (θ_{n}^{-})$ erhalten wir also $Var ({\hat{θ}}_{n}) < Var (θ_{n})$ .

Wir illustrieren diese Methode mit einer Monte-Carlo-Simulation der europäischen Put-Option aus Beispiel 5.1. Die Variablen $θ_{n}$ bzw. $θ_{n}^{-}$ seien die Auszahlungsfunktionen zu den Aktienkursen $S_{k}$ bzw. $S_{k}^{-}$ , die durch

S_{k + 1} = S_{k} (1 + r h + Z \sqrt{h}),

S_{k + 1}^{-} = S_{k}^{-} (1 + r h + Z \sqrt{h}), k = 1, \dots, N - 1

mit $Z \sim 𝒩 (0, 1)$ definiert sind. Die Auszahlungsfunktion ist dann gegeben durch $\frac{1}{2} ((K - S_{N})^{+} + (K - S_{N}^{-})^{+})$ . Dies ist in dem angegebenen Matlab-Programm realisiert.

% Monte-Carlo-Simulation fuer einen europaeischen Put
% mittels antithetischen Variablen
clear all, randn(’state’,10)
K = 100; r = 0.05; sigma = 0.2; T = 1;
N = 50; h = 1/N;
S(1) = 80; S1(1) = S(1);
for j=1:100 % 100
  M=j*100;
  for k=1:M
    for i=2:N
      dW = randn*sqrt(h);
      S(i) = S(i−1)*(1 + r*h + sigma*dW);
      S1(i) = S1(i−1)*(1 + r*h − sigma*dW);
    end
    payoff(j,k) = 0.5*(max(0,K−S(N))+max(0,K−S1(N)));
  end
  V(j) = exp(−r*T)*sum(payoff(j,:))/M;
  fprintf(’V = %f in Simulation Nr. %d\n’, V(j), j)
end
plot(V)
xlabel(’Anzahl der Simulationen ( \times 10^2)’,’FontSize’,12)
ylabel(’Optionspreis’,’FontSize’,12)

Die Abbildung stellt die Entwicklung des Optionspreises in Abhängigkeit der Anzahl der Monte-Carlo-Simulationen dar. Der exakte Wert für die gewählten Parameter beträgt 16.98. Bereits nach etwa 2000 Simulationen ist die Varianz sehr klein. Die Rechenzeit (XEON 2 GHz, Matlab) beträgt für 100 Durchläufe (genauer: 10⁴ Simulationsschritte) ca. 3 Minuten.

5.5 Beispiel: Asiatischer Call im Heston-Modell

In den vorangegangenen Abschnitten haben wir die Techniken kennengelernt, mit denen wir die in Beispiel 5.1 vorgestellte asiatische Option im Heston-Modell bewerten können. Die Aufgabe lautet, den fairen Preis einer asiatischen Call-Option mit Auszahlungsfunktion

V_{0} (S_{T}) = {(S_{T} - \frac{1}{T} \int_{0}^{T} S_{τ} d τ)}^{+}

zu berechnen, wobei die Dynamik von $S_{t}$ und $σ_{t}$ durch das Heston-Modell

d S = r_{t} S d t + σ S d W^{1},

d σ^{2} = κ (θ - σ^{2}) d t + ν σ d W^{2}

gegeben ist. Die risikofreie Zinsrate sei zeitabhängig und definiert durch

r_{t} = \frac{1}{100} (\sin (2 π t) + t + 3), 0 \leq t \leq T .

Der Wiener-Prozess $(W^{1}, W^{2})$ sei $𝒩 (0, Σ)$ -verteilt mit der Kovarianzmatrix

Σ = (\begin{matrix} 1 & ρ \\ ρ & 1 \end{matrix}) .

Die Parameter seien

κ = 2, θ = 0.4, ν = 0.2, T = 1 .

In Beispiel 5.4 haben wir eine Formel zur Berechnung einer zweidimensionalen $𝒩 (μ, Σ)$ -verteilten Zufallsvariablen hergeleitet. Seien $Z^{1}, Z^{2}$ standardnormalverteilte Zufallsvariable. Dann ist

(\begin{matrix} W^{1} \\ W^{2} \end{matrix}) = (\begin{matrix} 1 & 0 \\ ρ & \sqrt{1 - ρ^{2}} \end{matrix}) (\begin{matrix} Z^{1} \\ Z^{2} \end{matrix}) = (\begin{matrix} Z^{1} \\ ρ Z^{1} + \sqrt{1 - ρ^{2}} Z^{2} \end{matrix})

$𝒩 (0, Σ)$ -verteilt. Wie in Abschnitt 5.1 erläutert, wird der Optionspreis approximativ über die Formel

V_{0} = \exp (- \int_{0}^{T} r_{t} d t) \frac{1}{M} \sum_{k = 1}^{M} {(S_{T}^{k} - \frac{1}{N} \sum_{i = 1}^{N} S_{t_{i}}^{k})}^{+}

berechnet, wobei $M$ die Anzahl der Monte-Carlo-Simulationen und $N$ die Anzahl der Zeitschritte ist.

Die Berechnung erfolgt also in drei Schritten:

1. Schritt: Berechne $d W^{1}$ und $d W^{2}$ aus

d W_{k}^{1} = Z_{k}^{1} \sqrt{h}, d W_{k}^{2} = ρ Z_{k}^{1} \sqrt{h} + \sqrt{1 - ρ^{2}} Z_{k}^{2} \sqrt{h} .

2. Schritt: Löse das SDE-System mit dem Euler-Maruyama-Verfahren:

(σ^{2})_{i + 1}^{k} = (σ^{2})_{i}^{k} + κ (θ - (σ^{2})_{i}^{k}) h + ν σ_{i}^{k} d W_{k}^{2},

S_{i + 1}^{k} = S_{i}^{k} (1 + r (t_{i}) h + σ_{i}^{k} d W_{k}^{1}), i = 1, . . ., N - 1 .

3. Schritt: Berechne die Approximation des Optionspreises:

\overset{k}{\overline{S}} = \frac{1}{N} \sum_{i = 1}^{N} S_{i}^{k}, V_{0} = \exp (- \int_{0}^{T} r_{t} d t) \frac{1}{M} \sum_{k = 1}^{M} {(S_{N}^{k} - \overset{k}{\overline{S}})}^{+} .

Wir erhalten das weiter unten angegebene Matlab-Programm zur Preisbestimmung einer asiatischen Option im Heston-Modell.

Mit diesen Parametern erhalten wir die in der unteren Tabelle dargestellten Werte. Der ”faire” Preis der asiatischen Option beträgt also etwa 13.6.

Welchen Effekt hat die stochastische Volatilität? Der Preis einer asiatischen Option mit konstanter Volatilität $σ = 0.25$ beträgt (bei 200 000 Simulationen) $V = 6.5$ . Warum ist diese Option deutlich preiswerter als diejenige mit stochastischer Volatilität? Wir sehen, dass die Volatilität überwiegend größer als der Startwert $σ = 0.25$ ist. Dies begründet den höheren Preis. Berechnen wir den Preis einer asiatischen Option mit konstanter Volatilität $σ = 0.55$ , so erhalten wir bei 200 000 Simulationen $V = 13.3$ – ein Wert, der nahe bei dem Wert der asiatischen Option im Heston-Modell liegt.
Wir sehen in unterer Tabelle, dass die Monte-Carlo-Methode recht langsam konvergiert und sehr viele Simulationen für halbwegs genaue Werte notwendig sind. Es ist also sinnvoll, ein Verfahren höherer Ordnung als das Euler-Maruyama-Verfahren zu wählen, etwa das Milstein-Verfahren (5.18) (vgl. Abschnitt 5.3):

y_{k + 1}^{s} = y_{k}^{s} + a^{s} (y_{k}, t_{k}) h + \sum_{j = 1}^{m} b^{s j} (y_{k}, t_{k}) Δ W^{j} + \sum_{j, ν = 1}^{m} \sum_{l = 1}^{n} \frac{\partial b^{s ν}}{\partial x_{l}} (y_{k}, t_{k}) \int_{t_{k}}^{t_{k + 1}} \int_{t_{k}}^{τ} d W_{z}^{j} d W_{τ}^{ν}, s = 1, 2,

wobei

y_{k} = (\begin{matrix} σ_{k}^{2} \\ S_{k} \end{matrix}), a (y_{k}, t_{k}) = (\begin{matrix} κ (θ - σ_{k}^{2}) \\ r_{t_{k}} S_{k} \end{matrix}), b (y_{k}, t_{k}) = (\begin{matrix} ν σ_{k} & 0 \\ 0 & σ_{k} S_{k} \end{matrix})

\begin{matrix} 𝐒 𝐢 𝐦 𝐮 𝐥 𝐚 𝐭 𝐢 𝐨 𝐧 𝐞 𝐧 & 𝐎 𝐩 𝐭 𝐢 𝐨 𝐧 𝐬 𝐩 𝐫 𝐞 𝐢 𝐬 \\ (Anzahl) & (berechnet) \\ 1000 & 14.42 \\ 5000 & 12.65 \\ 10000 & 13.06 \\ 50000 & 13.51 \\ 100000 & 13.49 \\ 200000 & 13.60 \end{matrix}

und $\frac{\partial b^{s ν}}{\partial x_{l}}$ die partiellen Ableitungen nach $x_{1} = S$ bzw. $x_{2} = σ^{2}$ bezeichnet. Eine (etwas langwierige Rechnung) ergibt

S_{k + 1} = S_{k} + r_{t_{k}} S_{k} h + σ_{k} S_{k} Δ W_{k}^{2} + \frac{1}{2} σ_{k}^{2} S_{k} ((Δ W_{k}^{2})^{2} - h) + \frac{ν}{2} S_{k} I_{12},

σ_{k + 1}^{2} = σ_{k}^{2} + κ (θ - σ_{k}^{2}) h ν σ_{k} Δ W_{k}^{1} + \frac{ν^{2}}{4} ((Δ W_{k}^{1})^{2} - h) .

Wie in Abschnitt 5.3 erläutert, können die Integrale $I_{21}$ und $I_{12}$ mit dem Verfahren (5.21) approximiert werden.

Versuchen Sie, den Algorithmus zu implementieren.

% Bestimmung des Preises einer asiatischen Option
% im Heston-Modell
clear all, randn(’state’,2)
M = 1000; % Anzahl der Simulationen
N = 100; % Anzahl der Zeitschritte
T = 1; h = T/N;
S_0 = 100; sigma2_0 = 0.25*0.25; % Startwerte
kappa = 2; theta = 0.4; nu = 0.2; rho = 0.2;
% zeitabhaengige Zinsrate und Integral von 0 bis T
t=0:h:T;
r = 0.01*(sin(2*pi*t) + t) + 0.03;
intr = T*(T/200 + 0.03) − cos(2*pi*T)/(200*pi) + 1/(200*pi);
% zweidimensionaler Wiener-Prozess
dW1 = randn(M,N+1)*sqrt(h);
dW2 = rho*dW1 + sqrt(1−rho^2)*randn(M,N+1)*sqrt(h);
% Initialisierung von S und sigma^2
S = S_0*ones(M,N+1);
sigma2 = sigma2_0*ones(M,N+1);
% Loesung des SDE-Systems mit dem Euler-Maruyama-Verfahren
for i=1:N
  sigma2(:,i+1) = sigma2(:,i) + kappa*(theta−sigma2(:,i))*h . . . + nu*sqrt(sigma2(:,i)).*dW2(:,i);
  S(:,i+1) = S(:,i).*(1 + r(:,i)*h + sqrt(sigma2(:,i)).*dW1(:,i));
end
payoff = max(0,S(:,N+1)−mean(S,2));
V = exp(−intr)*mean(payoff)

Literatur

[1] Burrage, K., Burrage, P.M.: High strong order explicit Runge-Kutta methods for stochastic ordinary differential equations. Appl. Numer. Math. 22 (1996), 81-101.

[2] Cox, J., Ross, S., Rubinstein, M.: Option Pricing: A Simplified Approach. J. Financ. Econom. 7 (1979), 228 - 263.

[3] Fisz, M.: Wahrscheinlichkeitsrechnung und mathematische Statistik. Deutscher Verlag der Wissenschaften, Berlin

[4] Günther, M., Jüngel, A.: Finanzderivate mit MATLAB. Vieweg & Sohn, Wiesbaden 2003

[5] Hastings, C.: Approximations for Digital Computers. Princeton University Press, Princeton 1955

[6] Higham, D.: An algorithmic introduction to the numerical solution of stochastic differential equations. SIAM Review 43 (2001), 525-546.

[7] Higham, D.; Kloeden, P.: MAPLE and MATLAB for stochastic differential equations in finance. Preprint, 2002.

[8] Hull, J.C.: Options, Futures, and other Derivates. Prentice Hall 1997.

[9] Klimov, G.: Probability Theory, Mir 1988

[10] Kloeden, P.; Platen, E.: Numerical Solution of Stochastic Differential Equations. Springer, Berlin, 1995.

[11] Korn, R., Korn, E.: Optionsbewertung und Portfolio-Optimierung. Vieweg, Braunschweig 1999

[12] Kwok: Mathematical Models of Financial Derivatives. Springer, Singapur, 1998.

[13] Øksendal, B.: Stochastic Differential Equations. Springer, Berlin 1998

[14] Seydel, R.: Einführung in die numerische Berechnung von Finanzderivaten, Springer, Berlin-Heidelberg-New York 2000.

[15] Wilmott, P., Howison, S., Dewyenne, J.: The Mathematics of Financial Derivatives. Cambridge University Press, Cambridge 1996.

[16] Zhang, P.: Exotic Options, World Scientific, Singapure 1997.

Kurs:Modellierung und Numerische Methoden von Finanzderivaten/5 Die Monte-Carlo-Methode

Inhaltsverzeichnis

5.1 Grundzüge der Monte-Carlo-Simulation

Beispiel 5.1: Asiatischer Call im Heston-Modell

Beispiel 5.2: Basket-Option

5.2 Pseudo-Zufallszahlen

Definition 5.1

Beispiel 5.3

Satz 5.1

Beweis:

Satz 5.2

Beweis:

Definition 5.2

Beispiel 5.4

Beispiel 5.5:

Definition 5.3

Definition 5.4

Beispiel 5.6

Beispiel 5.7

5.3 Numerische Integration stochastischer Differentialgleichungen

Definition 5.5

Definition 5.6

Definition 5.7

Bemerkung:

Lemma 5.1

Beweis:

Lemma 5.2

Beweis:

Bemerkung:

5.4 Varianzreduktion

5.5 Beispiel: Asiatischer Call im Heston-Modell

Literatur

Navigationsmenü

Kurs:Modellierung und Numerische Methoden von Finanzderivaten/5 Die Monte-Carlo-Methode

5.1 Grundzüge der Monte-Carlo-Simulation

Beispiel 5.1: Asiatischer Call im Heston-Modell

Beispiel 5.2: Basket-Option

5.2 Pseudo-Zufallszahlen

Definition 5.1

Beispiel 5.3

Satz 5.1

Beweis:

Satz 5.2

Beweis:

Definition 5.2

Beispiel 5.4

Beispiel 5.5:

Definition 5.3

Definition 5.4

Beispiel 5.6

Beispiel 5.7

5.3 Numerische Integration stochastischer Differentialgleichungen

Definition 5.5

Definition 5.6

Definition 5.7

Bemerkung:

Lemma 5.1

Beweis:

Lemma 5.2

Beweis:

Bemerkung:

5.4 Varianzreduktion

5.5 Beispiel: Asiatischer Call im Heston-Modell

Literatur

Navigationsmenü

Suche