Regain 1.6.1, Suchindex zu umfangreich

Verbesserungsvorschläge, Fragen oder Probleme zu regain

Moderatoren: itebob, thtesche

Regain 1.6.1, Suchindex zu umfangreich

Beitragvon marco » 02.12.2009, 16:20

Nach dem Update von Version 1.2.3 auf 1.6.1 sind die in der Ergebnisliste ausgegebenen Zusammenfassung deutlich umfangreicher und praktisch zu groß. Wenn ich in der SearchConfiguration den alten Crawler angebe, passen die Ergebnisse wieder.

Die Crawler-Konfiguration des 1.6.1 unterscheidet sich nicht groß von der älteren:
Code: Alles auswählen
<preparator>
   <class>.HtmlPreparator</class>
   <urlPattern>...</urlPattern>
   <config>
      <section name="contentExtractor">
         <param name="prefix">...</param>
         <param name="startRegex">&lt;div id="main"</param>
         <param name="endRegex">&lt;/body&gt;</param>
         <param name="headlineRegex">...</param>
         <param name="headlineRegex.group">1</param>
      </section>
   </config>
</preparator>

Hab ich irgendwas übersehen? An dem JSP der Ausgabe hat sich nichts geändert (Ergebnisse des alten Crawlers sind auch noch korrekt), die Einbindung der Zusammenfassung erfolgt mittels
<search:hit_field field="summary"/>
marco
Newbie
 
Beiträge: 2
Registriert: 02.12.2009, 16:11

Re: Regain 1.6.1, Suchindex zu umfangreich

Beitragvon thtesche » 13.12.2009, 15:22

Code: Alles auswählen
<!--
| Maximum length of summary in an prepared and indexed document (default 250000).
| The highlighting of search terms will be created from this summary. The longer
| the summary, the better the highlighting but also the size of the index. After
| highlighting the summary will be cut to 200 characters for downward compatibility
| of the hit documents.
-->
<MaxSummaryLength>1000000</MaxSummaryLength>
Du kannst die Länge der Summary in der CrawlerConfig steuern. Und in der SearchConfig stellst du dann Highlighting aus.
Die Felder ändern sich schon mal, insofern kann es sein, dass zu alte Crawler-Versionen dann nicht mehr mit dem neueren Searchfrontend funktionieren. Aber probieren macht klug ;)
Tom
thtesche
Senior Member
 
Beiträge: 253
Registriert: 18.11.2007, 15:12
Wohnort: Panketal

Re: Regain 1.6.1, Suchindex zu umfangreich

Beitragvon marco » 14.12.2009, 18:41

Das Problem besteht trotz diesen beiden Einstellungen leider weiterhin :-(

gibt es sonst noch was, dass dies beeinflussen kann?
marco
Newbie
 
Beiträge: 2
Registriert: 02.12.2009, 16:11

Re: Regain 1.6.1, Suchindex zu umfangreich

Beitragvon thtesche » 19.12.2009, 22:23

marco hat geschrieben:Das Problem besteht trotz diesen beiden Einstellungen leider weiterhin :-(

gibt es sonst noch was, dass dies beeinflussen kann?
Auf welchen Wert hast du es denn gestellt? In meinem Beispiel waren es max.1 Mio Zeichen, wenn du es auf 250 Zeichen stellst, sollte der Index kleiner sein ;)
Tom
thtesche
Senior Member
 
Beiträge: 253
Registriert: 18.11.2007, 15:12
Wohnort: Panketal


Zurück zu regain

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron