Token und Type sind Begriffe, die häufig in der Linguistik und Informatik verwendet werden, insbesondere im Zusammenhang mit der Verarbeitung natürlicher Sprache. - **Token**: Ein Token ist eine einzelne Einheit von Text, die aus einem Wort, einem Satzzeichen oder einer anderen bedeutungstragenden Einheit bestehen kann. In der Textverarbeitung wird ein Text in Tokens zerlegt, um ihn analysieren oder verarbeiten zu können. Zum Beispiel wird der Satz "Das ist ein Beispiel." in die Tokens "Das", "ist", "ein", "Beispiel" und "." zerlegt. - **Type**: Ein Type bezieht sich auf die einzigartigen Tokens in einem Text. Es handelt sich also um die Anzahl der verschiedenen Wörter oder Einheiten, ohne Wiederholungen zu zählen. Im obigen Beispiel wären die Types "Das", "ist", "ein" und "Beispiel" insgesamt vier, da das Satzzeichen nicht als Type gezählt wird. Zusammengefasst: Tokens sind die einzelnen Einheiten eines Textes, während Types die einzigartigen Einheiten sind.