Die Crawler-Konfiguration des 1.6.1 unterscheidet sich nicht groß von der älteren:
- Code: Alles auswählen
<preparator>
<class>.HtmlPreparator</class>
<urlPattern>...</urlPattern>
<config>
<section name="contentExtractor">
<param name="prefix">...</param>
<param name="startRegex"><div id="main"</param>
<param name="endRegex"></body></param>
<param name="headlineRegex">...</param>
<param name="headlineRegex.group">1</param>
</section>
</config>
</preparator>
Hab ich irgendwas übersehen? An dem JSP der Ausgabe hat sich nichts geändert (Ergebnisse des alten Crawlers sind auch noch korrekt), die Einbindung der Zusammenfassung erfolgt mittels
<search:hit_field field="summary"/>
