Die Grundlage für die folgende Stoppwortliste bilden drei Stoppwortlisten, die miteinander kombiniert wurden.1 Die Besonderheit der Stoppwortliste und der Grund für die Publikation beruhen darauf, dass wir diese für die Anwendung auf ein bezüglich der Diakritika nicht normalisiertes und nicht lemmatisiertes Textkorpus optimiert haben. Das bedeutet konkret, dass wir uns darum bemüht haben, weitestgehend vollständig mögliche Varianten der Schreibweise aufzunehmen (abgesehen von Groß-/Kleinschreibung), so z.B. bei Lemmata mit Akut auf der Endsilbe auch die Variante mit Gravis sowie bei vokalisch auslautenden Formen auch die apokopierte Form mit Apostroph (in zwei Varianten) sowie entsprechende behauchte Varianten.2 Für flektierbare Lemmata, die in der Liste aufgeführt waren, haben wir die möglichen Formen (Sonderformen ausgenommen) ergänzt. |
Verben wurden, abgesehen von der Kopula εἶναι (sein) samt den zugehörigen Formen und der sehr häufigen Form δεῖ (es ist nötig), aus der Liste entfernt. Dem Verfahren liegt die Überlegung zugrunde, dass der philologisch arbeitende Forscher bei Suchanfragen im Bereich des Textmining in der Regel ein Lemma mit all seinen Formen und Schreibvarianten ausschließen oder auch beibehalten möchte, was durch Anwendung dieser Liste ermöglicht wird. ist publiziert als gedruckte Publikation im Open Access wie auch als eBook in einer HTML-Ansicht (https://doi.org/10.11588/propylaeum.451). Erstellt/geprüft von: Eva Wöckener-Gade, Stephan Jödicke, Henning Ohst, Erik Pulz, Kevin Protze, Joachim Rautenberg, Friederike Schellhardt, Felix Schulze und André L. Visinoni |