PageRank-Algorithmus

Der PageRank-Algorithmus bewertet Webseiten nach deren externen Verlinkungsstruktur: in dem rekursiven Algorithmus wird jeder Webseite ein Gewicht, dass sich aus der Anzahl auf sie verweisender Seiten (Linkpopularität) ergibt, zugeordnet. 

Linkpopularität
Die Linkpopularität bezieht sich dabei auf Backlinks: Backlinks sind Rückverweise auf eine Webseite: es handelt sich aus dem Betrachtungsstandpunkt einer  Webseite gesehen um Hyperlinks auf anderen Webseiten, die auf diese Seite verweisen. Weiterhin spielt das Gewicht der verweisenden Seiten eine Rolle: je höher deren Gewicht, desto grösser ist der  Effekt. Der PageRank ist somit dem Verhalten eines zufällig durch das Internet surfenden Users nachempfunden: er korreliert mit der Wahrscheinlichkeit, dass ein Surfer auf eine bestimmte Internet-Präsenz stösst. 

Web-Spam und Erweiterung des PageRank um qualitative Kriterien
Diese Form des PageRank-Algorithmus ist wegen der Übergewichtung von Verlinkungen (Problem des Web-Spam: Link-Farmen, Doorway-Pages, Google-Bombs, Forum-, Blog- und Gästebuch-Spam),  die keine qualitativen Aussagen machen in die Kritik geraten. Heute hat Google diese Form des PageRank um qualitative Kriterien erweitert um Web-Spam zu bekämpfen:  bei der Linkpopularität spielt es eine Rolle, um welche Art von Seite es sich handelt, insbesondere, ob diese thematisch verwandt ist mit der verlinkten Webseite. Weiterhin spielen eine Rolle:  die relevante Keyword-Dichte bezogen auf das Thema der Seite, die Aktualität und der Umfang der Webseite.

TrustRank
Der PageRank könnte bald durch den TrustRank abgelöst oder ergänzt werden.  Eventuell sind die Kriterien heute schon so verändert, dass es dem TrustRank nahe kommt.  Beim TrustRank werden Webseiten nach einem bestimmten Verfahren bewertet. Es entsteht ein semantisches "Trusted Web", bei dem die qualitative Nachbarschaft von Webseiten, die verlinkt sind, bedeutend ist. Dies wird erreicht, indem bestimmte, SPAM-freie  Webseiten als vertrauenswürdige Autorität (Authority-Sites) hervorgehoben werden: diese werden vor der Einstufung entsprechend überprüft und dann festgelegt. Danach wird die gesamte externe Linkstruktur des Internets  ausgehend von diesen Authority-Sites bewertet. Dieser Prozess kann sich in mehrere Ebenen aufsplitten. Mit TrustRank soll Web-Spam und Doorway-Pages sowie Google-Bombs bekämpft werden.                                   
Siehe auch:    Google   Backlink   suchmaschinen   Volltext-Suchmaschinen   Hyperlink   Rekursiv   algorithmus   Spam   Link-Popularität   Search-Engine-Optimization

  Google

Google wird Marktführer
Google ist die weltweit am meisten genutzte Suchmaschine des Internet. Die Firma Google Inc. wurde 1998 von Lawrence Page und Sergey Brin gegründet. Im Jahr 2006 verfügte Google über einen Marktanteil von über 80%,  bei einer Indexgrösse von über 8 Milliarden Webseiten und ca. 60 Milliarden Dokumenten und über 1,1 Milliarden Bildern. Der Name von Google leitet sich von Googol ab, dies ist der Name der Zahl 1x 10 ^ 100 (eine 1 mit hundert Nullen),  den sich Milton Sirotta, der Neffe des Mathematikers Edward Kasner ausgedacht hat. Zur Legende zählt, dass der Markenname Google durch einen Rechtschreibfehler aus Googol entstanden sei.

Technologie und Logistik, Googleware
Google ist  verteilt auf mehrere Rechenzentren rund um die Welt, die mit handelsüblichen PCs ausgestattet sind. In jedem Rechenzentrum befinden sich Rechnercluster mit einer verteilten, redundanten und nach oben leicht skalierbaren Architektur. Die aktuelle  Zahl der Server lag 2006 bei 450.000. Der Festplattenspeicher befindet sich im Petabytebereich, der Arbeitsspeicher im Terabytebereich. Das Prinzip der verteilten Datenhaltung ist bei Google ausgereift: die Googleware ermöglicht ein Verschmelzen von  Hardware und OS, so dass man kurzfristig Server in ein Rack schieben kann, die das OS automatisch laden und sich integrieren. Google betreibt redundante Datenhaltung so dass der Index in 3 Kontinenten unabhängig verfügbar ist.  Google erreicht in Deutschland ca. 28 Mio Nutzer, eine Suchanfrage benötigt durchschnittlich 0,2 Sekunden und beschäftigt ca. 300 - 700 Server. Google ist in 112 Sprachen verfügbar auf 158 Domains.

Der PageRank Algorithmus 
Entscheidend für die Reihenfolge der Ergebnisausgabe bei Suchanfragen ist der Ranking Algorithmus. Google arbeitet mit dem PageRank-Algorithmus: entscheidend beim PageRank ist die Anzahl der Webseiten (und deren eigener PageRank Wert  sowie die thematische Nähe zur verlinkten Seite), die auf eine Seite verlinken (= Backlinks: Rückverweise, die aus dem Betrachtungsstandpunkt einer Webseite von anderen Webseiten auf sich selber verlinken), die relevante Keyword-Dichte bezogen  auf das Thema der Seite, die Aktualität und der Umfang der Webseite. Der PageRank geht von 0 bis 10 (mit 10 als höchstem Wert) und wird z. B. von der Google Toolbar im Internet Explorer oder dem Firefox Add-On "Search Status"angezeigt. Unabhängig vom  PageRank sind die Ranking Positionen für Suchergebnisseiten einzelner Keywords zu bewerten. Um in die Top-10-SERP (Search Engine Result Page oder Search Engine Ranking Position) zu gelangen, sollte man SEO (Search Engine  Optimization, Suchmaschinenoptimierung) betreiben.

Web-Spam und TrustRank
Eventuell wird der PageRank bald durch den TrustRank ersetzt. Beim TrustRank werden Webseiten nach einem bestimmten Verfahren bewertet. Es entsteht ein semantisches  "Trusted Web", bei dem die qualitative Nachbarschaft von Webseiten, die miteinander verlinkt sind, bedeutend ist. Dadurch soll Web-Spam wie Doorway-Pages, Link-Farmen oder Google-Bombs bekämpft  werden.

Implementierung von Google, Google AdWords, Google AdSense
Google wurde in C und C++ implementiert und läuft auf Linux und Solaris. Mit Google AdWords kann man auf Google  Keyword-gesteuerte Anzeigen schalten. Der Werbetreibende hat volle Kontrolle über sein Budget und sein CPC (Cost per Click). Google AdSense erlaubt es dem Web-Admin, keyword- bzw. kontextgesteuerte Werbung auf seiner Webseite zu platzieren. 

Google-Dienste
Google bietet einige Dienste, z. T. durch Akquisitionen (wie z. B. Kaltix Corp., Keyhole Corp., Urchin Software Corp., YouTube, DoubleClick, Postini) an: Produktsuche (ehemals Froogle), GMail, Google-News, Google-Base, Google Bücher,  Google-Earth (Keyhole Corp.), Google Analytics (ehemals Urchin), Google Docs & Spreadsheets (Online Textverarbeitung (ehemals Writely) und Tabellenkalkulation), Google Blog Search, Google Calender,  Google Reader, Google Talk, Google Finance, Google Desktop Search oder Picasa oder Google Plus (G+). Google penetriert immer mehr den Online (und Offline)-Werbemarkt und ist nach der Akquisition von Double Click seinem  Ziel einer beherrschenden Stellung auf diesem Markt ein gutes Stück näher gekommen. Google Apps for Your Domain bietet eine Reihe von Hosted Communications Services: GMail Web E-Mail, G-Talk Instant Messaging und Voice Calling Services,  Collaborative Calendering durch Google Calendar sowie Web-Design, Web-Publishing und Web-Hosting mit Google Page Creator. In Vorbereitung ist das Google Betriebssystem basierend auf dem Browser Chrome: Chrome-OS. Android ist das Handy-OS.

Google IPO 
Das IPO (Initial Public Offering) von Google wurde 2004 durch Venture Capital von Sequoia Capital und Kleiner Perkins Caufield & Byers (KPCB) mitfinanziert. Konsortialführer waren Morgan Stanley und Credit Suisse First Boston.  Beim Börsengang mit dabei waren 29 weitere Banken, u. a. Goldman Sachs, die Citigroup, die Deutsche Bank, Lehman Brothers oder Merrill Lynch. Google nahm durch diesen IPO ca. 2,7 Milliarden Dollar ein.  Die Aktienstruktur wurde so gewählt, dass Page und Brin eine höchstmögliche Kontrolle darüber bekamen: sie kontrollieren jeweils ca. 16% davon (Page beim Börsengang 38,6 Mio Aktien, Brin 38,5 Mio Aktien, Eric Schmidt 14,8 Mio Aktien sowie Kleiner Perkins  und Sequoia Capital mit jeweils 23,9 Mio Aktien). Der Umsatz von Google betrug 1999 noch 220.000 Dollar. Der Quartalsumsatz von 1/2004 lag bei 389,6  Millionen Dollar, bei einen Nettogewinn von 64 Millionen Dollar, der Jahresumsatz lag 2003 (2002) bei 961,8 (347,8) Mio $. Der Umsatz stieg pro Quartal seit dem Börsengang um jeweils ca. 50%. Die Börsenkapitalisierung betrug 2007  158 Milliarden Dollar. Der Kurs der Google Aktie bewegte sich bis auf ca. 700 $ Ende 2007 und danach in einer Range zwischen 450 und 600 Dollar.  2006 wurde Google zur einflussreichsten Marke der Welt gewählt. Frühe Investoren die ab 1999 oder später einstiegen waren neben Sequoia Capital und KPCB auch private  Investoren wie Andreas von Bechtolsheim (Sun Microsystems), Arnold Schwarzenegger, Tiger Woods, Henry Kissinger oder Shaquille O'Neal.  Bechtolsheim soll auf Einladung von Stanford Professor David R. Cheriton, der Brin und Page beim Google-Projekt unterstützte, eine Vorführung einer frühen PC-Version von Google bekommen haben und war gleich so begeistert und vom Erfolg von Google  überzeugt, dass er angeblich gleich einen 1 Million $ Scheck gezückt haben soll, obwohl es noch gar keine Firmengründung für Google gab. Andy Bechtolsheim schlug vor, diese Firma direkt zu gründen, und war damit einer der Early Bird Investoren.
Siehe auch:    Volltext-Suchmaschinen   Suchmaschinen-Ranking   PageRank-Algorithmus   BackRub   Google-BigTable   Google-Server   AdServer   Search-Engine-Optimization   Semantische-Suchmachine   Social-Network-Dienste

  Suchmaschinen

Search-Engines: Im Internet können auf den Websites der Suchmaschinen-Betreiber Stichworte in ein Listenfeld eingetragen werden. Die Suchmaschinen vergleichen die Sichwörter mit denen ihrer Datenbanken. Als Ergebnis der Suchanfrage werden Websites mit  ihrer URL angezeigt, die der Suchanfrage entsprechen. Bei fast allen Suchmaschinen kann man seine eigene Website anmelden, diese werden dann von Robots besucht. Zahlt man für den Eintrag, wird die eigene Seite in der Regel im Ranking höher bewertet und  der Eintrag in die Datenbank beschleunigt.

Arten von Suchmaschinen 
Grundsätzlich kann man unterscheiden zwischen: Volltext-Suchmaschinen, Webkatalogen, Meta-Suchmaschinen und semantischen Suchmaschinen. Die Suchmaschinen haben  unterschiedliche Qualitäten in Bezug auf ihre Fähigkeit, Webseiten in ihrer Tiefe zu indizieren.

Google, MSN, Altavista und weitere Suchmaschinen, Meta-Suchmaschinen 
Marktführer ist unangefochten Google, gefolgt von der MSN Suchmaschine Bing, Yahoo und Altavista.  Weitere wichtige Suchmaschinen sind: Lycos, Fireball, Web.de, Metacrawler (Meta-Suchmaschine), Vivisimo, (Clustered Results) oder Ask Jeeves.  Google dominiert unangefochten den Markt und diversifiziert sich immer mehr mit Diensten (Google AdWords, Google AdSense, GMail, Desktop Search, Picasa, Google Analytics usw.) oder in Richtung Web 2.0 Anwendungen  (YouTube).

Ranking durch Algorithmen, PageRank-Algorithmus, TrustRank 
Dabei bewertet Google Webseiten nach dem PageRank-Algorithmus. Wichtig sind Webseiten anderer Web-Admins, die möglichst thematisch zueinander passen und aufeinander verlinken. Meta-Tags wie Keywords sind immer unwichtiger. Eventuell soll  der PageRank-Algorithmus durch den TrustRank (Trusted Web) abgelöst werden.  Beim TrustRank werden Webseiten nach einem bestimmten Verfahren bewertet. Es entsteht ein semantisches "Trusted Web", bei dem die qualitative Nachbarschaft von Webseiten, die miteinander verlinkt sind, bedeutend  ist. Dadurch soll Web-Spam wie Doorway-Pages, Link-Farmen oder Google-Bombs bekämpft werden. 

Verfeinerte Indexierungs-Algorithmen, Bildersuche, Personalisierung, Clustered-Results 
Moderne Suchmaschinen wie Bing von Microsoft, Vivisimo u.a. haben immer verfeinerte Indexierungs-Algorithmen, Bildersuche, Personalisierung, abgestufte Darstellung von Suchergebnissen oder Clustered Results (Vivisimo - Clustering Engine).                             
Siehe auch:    Suchmaschinen-Ranking   URL   META-Suchmaschine   Robots   Volltext-Suchmaschinen   Google   PageRank-Algorithmus   Backlink   Link-Popularität   Search-Engine-Optimization

  Backlink

Backlinks sind Rückverweise auf eine Webseite: es handelt sich aus dem Betrachtungsstandpunkt einer Webseite gesehen um Links auf anderen Webseiten, die auf diese Seite verweisen. Die Backlinks spielen eine Rolle bei Google's PageRank Algorithmus:  Der PageRank bewertet Webseiten (von 0 bis 10) nach deren externen Verlinkungsstruktur: in dem rekursiven Algorithmus wird jeder Webseite ein Gewicht, dass sich aus der Anzahl auf sie verweisender Seiten (Linkpopularität) zugeordnet. Das Gewicht einer  Webseite ist umso grösser, je grösser deren Linkpopularität ist. Weiterhin spielt das Gewicht der verweisenden Seiten eine Rolle: je höher deren Gewicht, desto grösser ist der Effekt.    Der PageRank ist somit dem Verhalten eines zufällig durch das Internet surfenden Users nachempfunden: er korreliert mit der Wahrscheinlichkeit, dass ein Surfer auf eine bestimmte Internet-Präsenz stösst.  Diese Form des PageRank ist wegen der Übergewichtung von Verlinkungen (Problem: Link-Farmen, Doorway-Pages, Google-Bombs, Forum- Blog- und Gästebuch-Spam), die keine qualitativen Aussagen machen in die Kritik geraten. Heute hat Google diese Form des  PageRank um qualitative Kriterien erweitert: bei der Linkpopularität spielt es eine Rolle, um welche Art von Seite es sich handelt, insbesondere, ob diese thematisch verwandt ist mit der Bezugsseite. Weiterhin spielen eine Rolle:  die relevante Keyword-Dichte bezogen auf das Thema der Seite, die Aktualität und der Umfang der Webseite. PageRank könnte bald durch TrustRank abgelöst werden. Eventuell sind die Kriterien heute schon so verändert, dass es dem TrustRank nahe kommt.                                           
Siehe auch:    Google   PageRank-Algorithmus   Spam   Rekursiv   algorithmus   Hyperlink   Link-Popularität   

  Search-Engine-Optimization

Search Engine Optimization (SEO) ist ein sehr aktuelles Thema und behandelt die Optimierung von Suchergebnissen für bestimmte Webseiten und Suchmaschinen.  Je besser man eine Webseite in den Suchergebnissen der wichtigsten Suchmaschinen wie Google, Bing (Live Search, MSN), Yahoo, Lycos, Altavista uvam. findet, desto eher kann man mit dieser Webseite Erfolg haben.

SERP und Keywords 
Wichtig zu wissen um in die Top 10 SERPs (Search Engine Ranking Position) zu kommen sind die eigenen Keywords (Schlüsselwörter), welche zur Auffindbarkeit der Domain und ihrer Inhalte wichtig sind bzw. die Konversions-Rate erhöhen.  Diese Schlüsselwörter gilt es richtig und angemessen zu platzieren, im Text, bei bestimmten Tags, den Überschriften (Title-Tag) oder Meta-Tags. Dabei spielen die Ranking Algorithmen der Suchmaschinen eine gewichtige Rolle. Je besser man diese kennt,  desto eher kann man sich in der Platzierung der Schlüsselwörter anpassen. Selbstverständlich sind die Suchmaschinenbetreiber  bestrebt, ihre Sortieralgorithmen nicht an die Öffentlichkeit dringen zu lassen. Denn nur, wenn eine Suchmaschine zuverlässig Seiten mit den von den Nutzern gesuchten Informationen ausgibt, bleibt sie relevant. Dementsprechend wehren sich  die Betreiber gegen Manipulationsversuche. Auf der anderen Seite versuchen aber natürlich Firmen und Privatleute ihre Internetpräsenz  bei den Suchmaschinen nach Möglichkeit in den Top-10-SERPs zu platzieren. Dabei kann eine  professionelle SEO Agentur eine sinnvolle Hilfe sein. SERP steht auch für Search Engine Result Page.

SERP und Backlinks, Trusted Web, PageRank 
Von den wichtigen Suchmaschinen, insbesondere Google, wird auch die Verlinkungsstruktur der Domain berücksichtigt. Beim PageRank Algorithmus spielen deswegen Backlinks, also Links auf anderen Domains fremder Admins auf die eigene Seite,  eine Rolle. Je mehr Backlinks und je besser die Qualität dieser Backlinks, desto eher steigt die Seite im PageRank auf. Qualität der Backlinks bedeutet in diesem Zusammenhang, dass diese steigt, je mehr die verweisende Seite in einem thematischen  Zusammenhang mit der verlinkten Domain steht. Der TrustRank geht noch einen Schritt weiter und bewertet einzelne Domains nach ihrer "Vertrauenswürdigkeit" im Web und bewertet Backlinks von diesen Seiten um so höher, so dass ein Netz aus "Trusted Webs"  entsteht.

Tipps von Google
Google empfiehlt den Webdesignern, möglichst einzigartige und akkurate Title-Tags, also Seitenüberschriften, anzulegen. Das Description-Meta-Tag sollte korrekt ausgefüllt sein.  Viel erreichen kann man auch, indem man die Domain-URL suchmaschinen-freundlich wählt: je eher das wichtigste Schlüsselwort in der URL vorkommt, desto besser wird die Domain darunter gefunden. Verkauft jemand beispielsweise Bürosoftware und hat für sich  als bedeutenstes Schlüsselwort "Office-Software" identifiziert, so sollte dieser Ausdruck möglichst in der Domain vorkommen, oder auch wichtige Keywords in den HTML-Dokumenten erwähnen.  Die Navigation und Platzierung der Linkstruktur spielt auch eine Rolle. Eine übersichtliche Navigation und eine zentrale Index-Datei mit allen (bis zu möglichst nicht mehr als 3) Linkblöcken sind von Vorteil. Den Wert der Seite aus Sicht der  Suchmaschinen steigert auch, wenn entsprechender Content, also textbasierte oder bilder- und/oder medienbasierte Inhalte, in der Seite zu finden ist.  Die Benennung der Links und die Unterlegung von Textstellen mit Fettschrift (Bold- oder Strong-Tag) spielen auch eine Rolle. Ebenso sollten Überschriften bewusst gewählt werden, ebenso Bilder und deren Beschriftungen, denn den Text auf Bildern selber  kann die Suchmaschine nicht auslesen. Nützlich ist es auch eine Datei Robots.txt auf der Domain-Root anzulegen. Die Online und Offline-Promotion der Webseite spielt auch eine Rolle. Google selber bietet hierfür vor allem Google AdWords an.  Bei Google AdWords kann man die CPC-Rate und sein Budget selber festlegen. Je höher die CPC-Rate, desto höher liegt das Ranking der eigenen Anzeige verglichen mit konkurrierenden  Anzeigen bezogen auf bestimmte Keywords. Die Vernetzung mit der entsprechenden Community fördert die eigene Position. Hilfe bei der Auswahl der eigenen Keywords kann man von einer Keyword-Datenbank bekommen  oder beispielsweise dem MetaGear 2 Web-Assoziator. Vermeiden sollten man Suchmaschinen-Spamming, also die manipulative Verbesserung seiner SERPs. Wenn eine Suchmaschine Suchmaschinen-Spamming  entdeckt kann es zum Ausschluss der Seite aus dem Index führen. Google bewertet auch die Ladezeiten und die Länge der Domain. Empfehlenswert ist die Benutzung der Google Webmaster-Tools und Google PageSpeed. 

Professionelles SEO
Es gibt Eintragsdienste und Firmen welche sich mit SEO beschäftigen. Ein besseres Ergebnis in den SERPs oder eine Top-10-SERP ist meistens dann nur noch eine Frage des Budget's und der Anpassungsfähigkeit der Kundenwebseite an  die Optimierungsschritte des Ranking-Anbieters. In der Regel ist den Firmen heutzutage die Bedeutung der SERP bewusst, so dass es weniger auf Überzeugungsarbeit als auf das Budget ankommt, denn das Wissen der Ranking Firmen um  das Know-How wird auch immer perfekter. Die Suchmaschinen ihrerseits rüsten auch in ihren Algorithmen immer mehr auf um z. B. relevanten Content von (kopiertem) Füll-Content zu unterscheiden. Sie setzen dazu z.B. Latent Semantic Indexing (LSI) ein. Um  Webseiten semantisch zu optimieren, kann man Latent Semantic Optimization (LSO) einsetzen. Verwandt mit SEO sind SEM (Search Engine Marketing) und SMO (Social Media Optimization).  Über SEO informieren kann man sich auch im Internet bei z. B. der Online-Zeitschrift Suchradar, Linkvendor.com oder bei Online Agenturen, SEO-Firmen oder Angaben der Suchmaschinen-Betreiber selber. 

Informationen über die Besucher
Nützlich zur Optimierung der eigenen Webseite sind auch Informationen über die eigenen Besucher, die man durch Einsicht in die Logfiles beim Provider oder selbsterstellte bzw. im Internet angebotene  Logfileanalyse-Tools bekommt. Auch mit Hilfe von Google-Analytics (ehemals Urchin) lassen sich Einblicke in das Surfverhalten der User bekommen und die Konversions-Rate steigern.
Siehe auch:    Suchmaschinen-Ranking   robots-dot-text   Meta-Description-Tag   PageRank-Algorithmus   suchmaschinen   Volltext-Suchmaschinen   META-Suchmaschine   Backlink   Logdatei   Google
Link: http://www.suchradar.de