31. March '08, 20:57

Deutsche Stopwords

Viele Blogs nutzen so genannte “Tagclouds” / “Schlagwort Wolken” diese sind spätestens im aufblühendem SEO (Search Engine Optimization) Wahn modern geworden. Neben dem Seitenbesucher möglicherweise interessante Schlagwörter zu präsentieren leiten Sie so Besucher und Suchmaschinen in Bereiche der Seite in die sonst vielleicht kaum jemand surft.

Das Problem dieser Tagclouds ist nun jedoch auch die verwendete Sprache, Wörter wie z.B. “jene, welche, sein, seine, ihre, unser, jedes, wessen” sind als Schlagwörter unbeliebt. Meist versucht man sämtliche Präpositionen, Adverben und Determinative auszugliedern da diese schlichtweg überall vorkommen können ohne eine relevante Aussage an sich treffen zu müssen.

Um dies zu unterbinden nutzt man nun o.g. “Stopword Lists”; Dies sind also nichts weiter als Aufzählungen von unerwünschten Tags. Ich habe auf Frage eines Seitenbesuchers meine Liste mal zum Download verfügbar gemacht.

Die meisten Addons & Plugins für aktuelle CMS oder Blogsysteme wie WordPress, Joomla, Drupal u.v.m. unterstützen die Verwendung von Stopwords.

  • German Stopwords, ver. 2009-03-13, 8.53 KB

  • Related Posts

    • No Related Post

     

    Der Artikel hat dir gefallen oder war hilfreich ?

  • Trackback Blog Trackback senden, Share/Bookmark Beitrag Verlinken oder Empfehlen
  • RSS Icon Blog RSS-Feed abonnieren, email Blog Blog per E-Mail zu abonnieren

  • 4 Kommentare zu “Deutsche Stopwords”

    1. Dr. B says:

      superb idea… thanks

    2. Sigmund says:

      Very useful … vielen Dank

    3. Sombra says:

      Super!! Danke viel mal für die Liste :)

    4. Gregor says:

      Diese Liste kann ich auch gleich brauchen. Danke