Skip to content
WortWize

Unsere Methodik

Sie haben das Recht zu wissen, woher die Zahlen und Definitionen kommen, die Sie auf WortWize sehen. Diese Seite legt in klarem Deutsch unsere Quellen, unsere Verarbeitung und die Grenzen unserer Daten offen. Nichts versteckt sich hinter der Phrase „proprietäre Daten“.

Primäre Frequenzquelle

Unsere deutsche Wortschatzdatenbank ist auf Frequenzlisten aufgebaut, die aus öffentlich zugänglichen deutschen Sprachkorpora und etablierten lexikografischen Referenzen abgeleitet sind. Für jedes Wort extrahieren wir die kanonische Form, die Wortart (Substantiv, Verb, Adjektiv, Adverb usw.), die phonetische Transkription, sofern verfügbar, und die Verwendungshäufigkeit im Referenzkorpus.

Verwendete lexikografische Referenzen

Für Definitionen, Etymologien und Beispiele stützen wir uns auf die großen deutschen Referenzwerke. Dies sind auch die Quellen, die wir Ihnen zur Überprüfung jedes Eintrags empfehlen:

Klassifizierung nach Niveau (A1 bis C2)

Jedes Wort erhält ein Lernniveau, das auf einer Kombination aus seiner Korpusfrequenz und seiner Zugehörigkeit zu weit verbreiteten Wortschatzlisten basiert, insbesondere:

Wörter, die im Alltag häufig sind, erhalten das Niveau „Grundwortschatz“ (A1-A2); jene, die hauptsächlich in Presse und beruflicher Kommunikation vorkommen, das Niveau „Mittelstufe“ (B1-B2); jene aus Qualitätszeitungen und zeitgenössischer Literatur das Niveau „Oberstufe“ (C1); und jene aus dem akademischen oder juristischen Register das Niveau „akademisch“ (C2). Die Zuordnung ist regelbasiert und vollständig reproduzierbar.

Bauprozess und Aktualisierung

  1. Einlesen— die Quell-Frequenzlisten werden in eine lokale SQLite-Datenbank importiert.
  2. Bereinigung— nicht-deutsche Inhalte, Kodierungsartefakte und leere Felder werden entfernt.
  3. Ableitung— Niveaus, Frequenzperzentile, Synonym/Antonym-Beziehungen und Indizes nach Buchstabe und Länge werden deterministisch aus den bereinigten Datensätzen berechnet.
  4. Verknüpfung— Übersetzungen einer Untergruppe von Wörtern werden mit unseren Schwesterwörterbüchern (VocabWize für Englisch, VocabLibre für Französisch, DicionarioWize für Portugiesisch, KalimaWize für Arabisch, KotobaPeek für Japanisch) verknüpft, um direkte sprachübergreifende Verweise aufzubauen.
  5. Veröffentlichung— die Datenbank wird zur Bauzeit mit der Website verpackt, sodass jede Seite aus demselben überprüften Snapshot generiert wird.

Aktualisierungshäufigkeit

Lexikografische deutsche Daten ändern sich langsam; das Lexikon wandelt sich nicht stündlich. Wir aktualisieren unseren Datensatz monatlich oder sofort, wenn eine Quelle eine wesentliche Korrektur veröffentlicht. Jede Wortseite trägt eine menschenlesbare Kennzeichnung „letzte Aktualisierung“, damit Sie immer die Herkunft des Inhalts kennen.

Querverweise

Wir bitten Sie nicht, uns blind zu vertrauen. Bei jedem Eintrag, bei dem Sie unsicher sind, empfehlen wir Ihnen, ihn mit diesen autoritativen öffentlichen Referenzen zu vergleichen:

Grenzen, die Sie kennen sollten

Korrekturen und Feedback

Wenn Sie eine fehlerhafte Definition, eine fehlende Bedeutung oder ein Niveau finden, das nicht Ihrer Erfahrung entspricht, möchten wir das wissen. Bitte kontaktieren Sie uns mit dem Wort und Ihrer vorgeschlagenen Änderung. Wir verfolgen jede Korrekturanfrage.

Diese Methodikseite wurde zuletzt im März 2026 überprüft. Wesentliche Änderungen an unserem Datenaufbau werden hier widergespiegelt, bevor sie die Produktionsseiten erreichen.