Meta Tags indizieren

Verbesserungsvorschläge, Fragen oder Probleme zu regain

Moderatoren: itebob, thtesche

Meta Tags indizieren

Beitragvon platten_kratzer » 27.01.2010, 11:07

Hi Leute,

ich habe einen Content Extractor definiert, der nur den Contentbereich meiner Seite indiziert (umklammert von HTML Kommentaren). Somit wird also lediglich der mittlere Teil der Seite indiziert, die <meta> Tags (im <head>) jedoch nicht. Dort sind aber keywords und description eingetragen, die ich auf jeden Fall auch mitindizieren möchte.
Ich habe nun einen zweiten ContentExtractor definiert (die Domain wurde entfernt, ist aber selbstverständlich Teil davon und korrekt):

Code: Alles auswählen
      <section name="contentExtractor">
        <param name="prefix">http://...(.*)</param>
        <param name="startRegex">&lt;head&gt;</param>
        <param name="endRegex">&lt;/head&gt;</param>
        <param name="headlineRegex">&lt;meta content="(.*)" name="keywords"/&gt;</param>
        <param name="headlineRegex.group">1</param>
      </section>


Aber die Keywords werden nicht gefunden. Wie kann ich hier vorgehen?

Besten Dank im Voraus
platten_kratzer
Newbie
 
Beiträge: 18
Registriert: 28.07.2009, 09:25

Re: Meta Tags indizieren

Beitragvon platten_kratzer » 05.02.2010, 09:16

*push*

any ideas?
platten_kratzer
Newbie
 
Beiträge: 18
Registriert: 28.07.2009, 09:25

Re: Meta Tags indizieren

Beitragvon itebob » 05.02.2010, 15:06

Hallo,
platten_kratzer hat geschrieben:Aber die Keywords werden nicht gefunden. Wie kann ich hier vorgehen?

Die Class HtmlPreparator enthält eine Methode extractHtmlTitle. Also gehe ich davon aus, dass die restliche Zeilen, die vor body-Tag stehen, ignoriert werden. Bleibt wahrscheinlich nichts anderes übrig, als den HtmlPreparator um eigene Methode extractKeywords zu erweitern ;-)
itebob
Senior Member
 
Beiträge: 383
Registriert: 04.11.2005, 12:19


Zurück zu regain

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron