ich habe einen Content Extractor definiert, der nur den Contentbereich meiner Seite indiziert (umklammert von HTML Kommentaren). Somit wird also lediglich der mittlere Teil der Seite indiziert, die <meta> Tags (im <head>) jedoch nicht. Dort sind aber keywords und description eingetragen, die ich auf jeden Fall auch mitindizieren möchte.
Ich habe nun einen zweiten ContentExtractor definiert (die Domain wurde entfernt, ist aber selbstverständlich Teil davon und korrekt):
- Code: Alles auswählen
<section name="contentExtractor">
<param name="prefix">http://...(.*)</param>
<param name="startRegex"><head></param>
<param name="endRegex"></head></param>
<param name="headlineRegex"><meta content="(.*)" name="keywords"/></param>
<param name="headlineRegex.group">1</param>
</section>
Aber die Keywords werden nicht gefunden. Wie kann ich hier vorgehen?
Besten Dank im Voraus
