Indizierung der pdf-Dateien

In this board you can talk about general questions about phpMyFAQ

Moderator: Thorsten

Post Reply
diplomsiedler
Posts: 38
Joined: Thu Feb 19, 2004 11:55 am
Contact:

Indizierung der pdf-Dateien

Post by diplomsiedler »

Hallo zusammen,

mir ist aufgefallen, dass Google kein einziges meiner über 1000 vorhandenen und pdf-Artikel von Google indiziert worden sind.

Da die Dateien alle verlinkt sind, mag Google entweder 1. die Art der Verlinkung oder 2. die Dateien nicht. Ich tippe auf 1..

Hat jemand ähnliche Erfahrungen gemacht und hat einen Workaround parat?

Gruß
Marc
ENCYCLOPÆDIA CATANICA - http://www.siedeln.de/faq
Thorsten
Posts: 15568
Joined: Tue Sep 25, 2001 11:14 am
Location: #phpmyfaq
Contact:

Post by Thorsten »

Hi,

hm, gute Frage.... ich geb das mal an meinen SEO-Spezialisten weiter...

bye
Thorsten
phpMyFAQ Maintainer and Lead Developer
amazon.de Wishlist
jr-ewing
Posts: 37
Joined: Sun Jul 10, 2005 6:52 pm
Location: Germany
Contact:

Post by jr-ewing »

Welche Version hast du ?

Ist im Quellcode folgendes vorhanden ?

Code: Select all

    <meta name="robots" content="INDEX, FOLLOW" />
Kannst du die Seite nennen dann kann man genaueres sagen....
bzw schick mir einfach ne PN ;-)

Gruß Tom
Mein Baby Lexikon | Gegen Contentdiebstahl -> Spider Trap
diplomsiedler
Posts: 38
Joined: Thu Feb 19, 2004 11:55 am
Contact:

Post by diplomsiedler »

Ich verwende V 1.6.1 und der Follow-Tag ist vorhanden. Daran scheint es nicht zu liegen. Gruss Marc
ENCYCLOPÆDIA CATANICA - http://www.siedeln.de/faq
jr-ewing
Posts: 37
Joined: Sun Jul 10, 2005 6:52 pm
Location: Germany
Contact:

Post by jr-ewing »

Wenn es um die Seite in deinem Profil handelt ist alles in Ordnung:

PDF Files sind auf jeden Fall indexiert....

http://www.google.de/search?q=site:http ... rt=10&sa=N

gruß Tom
Mein Baby Lexikon | Gegen Contentdiebstahl -> Spider Trap
jr-ewing
Posts: 37
Joined: Sun Jul 10, 2005 6:52 pm
Location: Germany
Contact:

Post by jr-ewing »

http://www.google.de/search?q=allinurl: ... l&filter=0
allerdings nur 17 - ich glaube du brauchst da noch einen starken Link den du auf das Verzeichnis www.###.de/faq/ legen lassen solltest.

237.000 Seiten im Index ist ja auch nicht so schlecht....
Mein Baby Lexikon | Gegen Contentdiebstahl -> Spider Trap
diplomsiedler
Posts: 38
Joined: Thu Feb 19, 2004 11:55 am
Contact:

Post by diplomsiedler »

Danke für Deine Antwort.
Eben es sind nur 17 PDFs indiziert. Die FAQs sind eigentlich stark genug. Immerhin hat die Index-Seite der FAQs einen PR von 4.

Idee: Was haltet Ihr von einer Seite die automatisch aller PDFs auflistet, eine Sitemap für PDFs quasi. Das sollte helfen.

Gruss
Marc
jr-ewing
Posts: 37
Joined: Sun Jul 10, 2005 6:52 pm
Location: Germany
Contact:

Post by jr-ewing »

also ich finde das mit den PDFs nicht so gut - suchmaschinen technisch gesehen weil es einfach den gleichen Inhalt des normalen Inhalts anzeigt.

-Normaler Artikel
-Druckansicht
-PDF
ist also 3x das gleiche unter 3 verschiedenen Urls -
Und sowas mag Google nicht so besonders gerne - Duplicated Content heißt das ;-)


deswegen würde ich in der Robots.txt die Druckansicht und PDF vom Spidern ausschließen....
Mein Baby Lexikon | Gegen Contentdiebstahl -> Spider Trap
diplomsiedler
Posts: 38
Joined: Thu Feb 19, 2004 11:55 am
Contact:

Post by diplomsiedler »

Da ist natürlich etwas dran. DC ist mir auch ein Begriff, aber Google sollte doch unterscheiden können.
jr-ewing
Posts: 37
Joined: Sun Jul 10, 2005 6:52 pm
Location: Germany
Contact:

Post by jr-ewing »

Tja - Google hat da ein Problem ! Warum die Seiten doppelt und dreifach speichern.... ?
Woher soll Google wissen welches das Original ist :-)
Mein Baby Lexikon | Gegen Contentdiebstahl -> Spider Trap
Post Reply