You are viewing a single comment's thread from:
RE: Spracherkennung für SteemSearch
Sich auf einzelne prägnante Wörter zu beschränken, finde ich ja mal einen coolen Ansatz. Das erscheint mir auf den ersten Blick auch sehr effektiv. So muss man nicht den Text in irgendeiner Weise aufwendig analysieren.
Schwierig dürfte es nur werden, wenn es sich um gemischte Texte handelt. Wenn zum Beispiel ein Zitat in einer anderen Sprache im Post/Kommentar erscheint. Hier könnte die Suche im Zweifel für beide Sprachen einen Erfolg zurückgeben. Ja nachdem wie du vorhast, es in deine Suche zu integrieren.
Ja, gemischte Texte ist so ein Ding, im Log finden sich manchmal sogar gleiche Scores auf den ersten beiden Plätzen. Aber ich bin da ganz entspannt, die erste erkannte Sprache wird genommen, fertig :-)
Außerdem nehme ich nur den Text der in der Vorschau bei den Suchergebnissen angezeigt wird, das sind meist sagenhafte 30 Wörter um den Dreh. Eh erstaunlich, dass es trotzdem relativ gut funktioniert. Und Ressourcen sind kein Ding, zum Test hatte ich immer so 700 Testdatensätze und die sind ratz fatz in kaum spürbarer Zeit durch.
0.00 SBD,
4.24 STEEM,
4.24 SP
Ja, wie gesagt, scheint insgesamt ein sehr effektiver Ansatz zu sein... und das mit rund 30 Wörtern Text. Sehr gut!
Habe deine aktuelle Version neulich mit recht alten Beiträgen getestet. Zuerst war ich in die "Falle" des fehlenden Tags gestolpert. Aber zu meiner Suche passte einer sehr gut, insofern war das kein Problem. Wir müssen dem Chiller mal vorschlagen, den Tag lediglich optional vorzusehen... oder hat er das schon auf dem Zettel?
0.00 SBD,
1.99 STEEM,
1.99 SP