Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik

Aus testwiki
Version vom 31. Januar 2024, 17:58 Uhr von imported>Bert Niehaus (Menge aller Wörter)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Einleitung

Diese Seite zum Thema Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:

  • (1) Buchstabenhäufigkeiten in einer Sprache,
  • (2) Bijektive Abbildung von einem Klartextalphabet in ein Geheimtextalphabet,
  • (3) Möglichkeiten und Beispiele, sich mit Stochastik und Texten Verschlüsselung und Kryptoanalyse zu beschäftigen

Zielsetzung

Diese Lernressource zu Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik in der Wikiversity hat das Ziel, elementare Kryptoanalyse mit Häufigkeitsverteilungen von Buchstaben bei einem bijektiven Schlüssel zwischen einem Quelltextalphabet und einem Geheimtextalphabet herzustellen.

Zielgruppe

Die Zielgruppe der Lernressource zum Thema Kryptoanalyse und Stochastik Textanalyse und Textgenerierung sind

  • Lehramtstudierende im Fach Mathematik und Informatik
  • Schüler:innen im Fach Mathematik und Informatik

Aufgaben für Lernende / Studierende

Mit den folgenden Aufgaben zum Thema Kryptoanalyse und Stochastik wird ein Teilbereich von Stochastik mit Texten und Alphabeten bearbeitet.

  • Versuchen Sie, die Wahrscheinlichkeitsverteilung auf dem deutschen Alphabet mit Sonderzeichen zu bestimmen (Internet, konkrete Text, ...).
  • Wie hilft die Kenntnis über diese Wahrscheinlichkeitsverteilung dabei, einen kodierten Buchstaben mit einem bijektiven Alphabet-Kodierer zu entschlüsseln?

Alphabet

Ein Alphabet ist im diesem Kontext eine Menge von Zeichen, die allerdings ggf. nicht nur Buchstaben, sondern auch Zahlen, Sonderzeichen und das Leerzeichen enthalten kann. Diese Alphabet wird im Folgenden mit 𝒜 bezeichnet.

Wörter

Wörter sind Sequenzen von Zeichen. Das Worter "EIMER" besteht aus einer Sequenz (Tupel) von 5 Zeichen aus dem Alphabet. Dabei ist es zulässig, dass ein Zeichen (z.B. das "E") mehrfach in einem Wort auftritt.

Menge aller Wörter

Wörter sind mathematisch gesehen n-Tupel, wobei diese eine beliebige Länge n besitzen können. Formal schreibt man:

𝒜+:=n=1𝒜n=n=1𝒜××𝒜nfach

Beispiel: EIMER𝒜5, wobei als 𝒜:={A,,Z} z.B. das Alphabet mit allen Großbuchstaben gewählt wird.

Häufigkeiten von Buchstaben

In der deutschen Sprachen kommen nicht alle Buchstaben in Texten mit der gleichen Häufigkeit vor. Sei nun unser Ergebnisraum Ω:=𝒜, Sigma-Algebra 𝒮:=𝒫(Ω) die Potenzmenge des Alphabets 𝒜 und P:𝒮[0,1] die Wahrscheinlichkeitsverteilung, mit der jedem Zeichen ω𝒜 die Wahrscheinlichkeit P({ω}) für das Auftreten in einem deutschen Text zugeordnet wird.

Bijektiver Schlüssel

Ein bijektiver Schlüssel ist eine bijektive Abbildung von f:𝒜𝒜.

Literatur/Quellennachweise


Siehe auch

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Textanalyse und Textgenerierung' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.