Indizierung der pdf-Dateien

diplomsiedler · Post by **diplomsiedler** » Mon Jun 12, 2006 3:12 pm

Hallo zusammen,

mir ist aufgefallen, dass Google kein einziges meiner Ã¼ber 1000 vorhandenen und pdf-Artikel von Google indiziert worden sind.

Da die Dateien alle verlinkt sind, mag Google entweder 1. die Art der Verlinkung oder 2. die Dateien nicht. Ich tippe auf 1..

Hat jemand Ã¤hnliche Erfahrungen gemacht und hat einen Workaround parat?

GruÃŸ
Marc

Post by **Thorsten** » Mon Jun 12, 2006 6:31 pm

Hi,

hm, gute Frage.... ich geb das mal an meinen SEO-Spezialisten weiter...

bye
Thorsten

jr-ewing · Post by **jr-ewing** » Mon Jun 12, 2006 7:05 pm

Welche Version hast du ?

Ist im Quellcode folgendes vorhanden ?

Code: Select all

    <meta name="robots" content="INDEX, FOLLOW" />

Kannst du die Seite nennen dann kann man genaueres sagen....
bzw schick mir einfach ne PN

GruÃŸ Tom

diplomsiedler · Post by **diplomsiedler** » Mon Aug 21, 2006 12:40 pm

Ich verwende V 1.6.1 und der Follow-Tag ist vorhanden. Daran scheint es nicht zu liegen. Gruss Marc

jr-ewing · Post by **jr-ewing** » Mon Aug 21, 2006 5:46 pm

Wenn es um die Seite in deinem Profil handelt ist alles in Ordnung:

PDF Files sind auf jeden Fall indexiert....

http://www.google.de/search?q=site:http ... rt=10&sa=N

gruÃŸ Tom

jr-ewing · Post by **jr-ewing** » Mon Aug 21, 2006 5:53 pm

http://www.google.de/search?q=allinurl: ... l&filter=0
allerdings nur 17 - ich glaube du brauchst da noch einen starken Link den du auf das Verzeichnis www.###.de/faq/ legen lassen solltest.

237.000 Seiten im Index ist ja auch nicht so schlecht....

diplomsiedler · Post by **diplomsiedler** » Mon Aug 21, 2006 6:28 pm

Danke fÃ¼r Deine Antwort.
Eben es sind nur 17 PDFs indiziert. Die FAQs sind eigentlich stark genug. Immerhin hat die Index-Seite der FAQs einen PR von 4.

Idee: Was haltet Ihr von einer Seite die automatisch aller PDFs auflistet, eine Sitemap fÃ¼r PDFs quasi. Das sollte helfen.

Gruss
Marc

jr-ewing · Post by **jr-ewing** » Mon Aug 21, 2006 8:40 pm

also ich finde das mit den PDFs nicht so gut - suchmaschinen technisch gesehen weil es einfach den gleichen Inhalt des normalen Inhalts anzeigt.

-Normaler Artikel
-Druckansicht
-PDF
ist also 3x das gleiche unter 3 verschiedenen Urls -
Und sowas mag Google nicht so besonders gerne - Duplicated Content heiÃŸt das

deswegen wÃ¼rde ich in der Robots.txt die Druckansicht und PDF vom Spidern ausschlieÃŸen....

diplomsiedler · Post by **diplomsiedler** » Mon Aug 21, 2006 9:04 pm

Da ist natÃ¼rlich etwas dran. DC ist mir auch ein Begriff, aber Google sollte doch unterscheiden kÃ¶nnen.

jr-ewing · Post by **jr-ewing** » Mon Aug 21, 2006 10:23 pm

Tja - Google hat da ein Problem ! Warum die Seiten doppelt und dreifach speichern.... ?
Woher soll Google wissen welches das Original ist