Als Data Mining wird die Kunst bezeichnet aus einem Berg von Informationen die relevanten Stücke heraus zu filtern. Wie ein Minenarbeiter im Bergbau (Mining) müssen bei der Auswertung von Informationen die Edelsteine vom Geröll getrennt werden.
Populär wurde der Ausdruck Data Mining durch die Plattform Miningo, eine Web-Site die Inhalte zu vielen Themen durch freiwillige Editoren sammelte und bereitstellte.
Im heutigen Informationszeitalter ist Data Mining wichtiger den je, es wird
immer schwieriger die relevanten Informationen aus der Flut der Spam-Mails und belanglosen Web-Sites
zu filtern.
SMS
Dead Link ist die englische Bezeichnung für toter Link. Gemeint ist damit ein in einer HTML-Seite enthaltener Link der nicht mehr aufgerufen werden kann. Es gibt verschiedene Gründe warum ein Link nicht mehr funktioniert. Vielleicht ist zur Zeit der Server nicht verfügbar oder der Site Betreiber hat die Seite verschoben oder gelöscht.
Wenn Suchmaschinen auf sehr viele Dead Links in einem Web stoßen werden irgendwann die Links nicht mehr verfolgt. Es ist also sehr wichtig seine Website aktiv zu pflegen damit die Besucher und die Suchmaschinen nicht in die Irre geführt werden.
Suchmaschinen überprüfen ihren Datenbestand nur periodisch, deshalb sollten Sie nicht mehr benötigte Dateien nicht sofort löschen, sondern lediglich die Links zu den Seiten oder Dateien entfernen. So läuft der Suchende nicht ins lehre wenn er über die Suchergebnisseiten der Suchmaschinen auf die Datei stößt.
Deep Link ist englisch und lässt sich in etwa mit tiefer Link übersetzen. Gemeint ist damit eine Verlinkung direkt auf ein Verzeichnis oder eine Datei in einem Web.
Die Meisten Webmaster möchten am liebsten, dass Ihre Homepage also die Startseite direkt verlinkt wird um so den Besucher selbst zu einer entsprechenden Site zu leiten. Viele Autoren verlinken aber lieber direkt auf eine Datei die für ihre Website oder ihren Artikel relevant sind. Durch einen Deep Link wird dann der Surfer direkt zu dem relevanten Artikel geführt.
Einige Web-Präsenzen der Online-Medien sind dazu übergegangen Deep Links auf ihre Seiten zu verbieten. Die Ignoranz dieser Medien geht dabei manchmal so weit, dass man Betreiber verlinkender Sites sogar verklagt. Das Interesse der Online-Medien liegt darin den Surfer über die Startseite zu ihren Online-Werbeangeboten zu führen und erst dann die Informationen zugänglich zu machen.
Der META-Tag Description soll dazu verwendet werden der Web-Seite eine kurze sachliche Beschreibung zu geben. Diese Informationen werden vom Browser nicht angezeigt, jedoch nutzen die Suchmaschinen diese Beschreibung in den Suchergebnisseiten. Die Description (Beschreibung) der Website sollte möglichst kurz und treffend sein. Eine attraktive Beschreibung der Web-Site verleitet den Suchenden dazu den Link anzuklicken und bringt somit Besucher.
Beim Ranking der Suchmaschinen spielen die Descriptions heute keine Rolle mehr. Es ist also sinnlos hier durch Spam-Techniken zu versuchen die Position der Web-Site zu verbessern.
Wenn es für eine Web-Site keine Beschreibung (Description Meta-Tag) gibt, generiert die Suchmaschinen eine Beschreibung aus dem Text-Inhalt der Website und benutzt diesen als Beschreibung in den Suchergebnisseiten.
DHTML ist die Abkürzung für Dynamic Hypertext Markup Language. Hinter diesem Schlagwort verbirgt sich nicht eine Technologie sondern hiermit wird eine Kombination aus HTML, JavaScript und Dom zur Dynamisierung von HTML-Dokumenten bezeichnet.
Dynamisierung eines HTML-Dokuments sollte allerdings nur dort wo es angebracht ist eingesetzt werden. Bei Suchmaschinen führt ein exzessiver Gebrauch dieser Techniken zur Abwertung und für viele Surfer bedeutet es eine Barriere.
Aus Sicherheitsgründen wird in größeren Firmen und auch bei immer mehr sicherheitsbewussten Privatanwendern die Ausführung von JavaScript unterbunden. Somit werden DHTML Seiten bei dieser Gruppe von Servern nicht korrekt dargestellt und funktionieren.
Jedes HTML-Dokument muss einen Dokumententyp zugeordnet werden, damit das Dokument als gültig betrachtet werden kann.
Viele Webmaster sind sich der Tatsache nicht bewusst, dass wenn Sie auf eine Deklaration des Dokumententyps versichten, sie sich der Willkür der Browser aussetzen. Das heißt es bleibt dem Browser überlassen wie er das Dokument rendert, der Browser rendert das Dokument im so genannten Quirksmodus. Erschwerend kommt auch noch hinzu, dass jeder Browser ein Dokument ohne Dokumententyp-Deklaration unterschiedlich rendert. Dokumente ohne Dokumententyp-Deklaration lassen sich nicht nach W3C validieren.
Die Dokumententyp-Deklaration besteht aus zwei Teilen, der Angabe des Dokumententyps(dem sog. Public Identifier) und der URI, unter der das Anwendungsprogramm die Definition findet, diese wird auch als System Identifier bezeichnet.
Heute gültige Dokumententyp-Deklarationen sind:
Eine Ausführliche Beschreibung der Problematik rund um den Dokuemtnetyp finden Sie unter: Dokumententypen
Die Domain ist ein hierarchisch aufgebauter Teil einer durch Punkte voneinander getrennten Internet-Adresse nach den Vorgaben des Domain Name System kurz DNS. Eine Internet-Adresse besteht aus der Top Level Domain, zum Beispiel ".de", ".com" oder ".org", und einer oder mehrerer Sub-Level Domains. Die Adresse http://www.sonnenstudio-joli.de/ besteht aus der Top-Level-Domain ".de" und der Second-Level Domain ".sonnenstudio-joli" und der Sub-Domain "www". Die Sub-Domain (zum Beispiel "www") bezeichnet üblicherweise den angebotenen Dienst.
Die Domain wird durch einen Provider bei der zuständigen Organisation registriert und verwaltet. In Deutschland ist das DENIC (externer Link).
Als Dynamische Seiten werden Web-Sites bezeichnet, die durch Programmausführung im Moment des Seitenabrufs erstellt werden. Solche Seiten werden meist aus Layout-Schablonen und Inhalten aus einer Datenbank erstellt. Als Beispiel für eine Dynamische Seite, können Sie schon diese Seite selbst nehmen. Der Inhalt wird aus einer Datenbank ausgelesen und über XSLT zu einem HTML-Dokument transformiert. Das Layout der Seite wird über CSS (Cascading-Style-Sheets) gesteuert. Das Programm das diese Komponenten zu einer HTML-Seite generiert ist ein ASP.Net-Programm.
Es gibt natürlich noch viele andere Techniken um eine HTML-Seite dynamisch zu erstellen. Auch durch "Server Side Inlcudes" modifizierte Seiten zählen zu den Dynamischen Seiten.
Erwähnenswert ist vielleicht noch, dass man versuchen sollte eine natürliche URL zu generieren. Also einen Dateinamen der sprechend ist und von den Suchmaschinen auch aufgenommen wird. URLs mit vielen Parametern z. Beispiel /web?name=2&t=4&x=7 werden von den Suchmaschinen selten aufgenommen. Auch hier ist diese Seite selbst wieder ein gutes Beispiel für eine Dynamische Seite.