You are viewing a single comment's thread from:

RE: Spracherkennung für SteemSearch

in #steemdev8 days ago

Ja, gemischte Texte ist so ein Ding, im Log finden sich manchmal sogar gleiche Scores auf den ersten beiden Plätzen. Aber ich bin da ganz entspannt, die erste erkannte Sprache wird genommen, fertig :-)

Außerdem nehme ich nur den Text der in der Vorschau bei den Suchergebnissen angezeigt wird, das sind meist sagenhafte 30 Wörter um den Dreh. Eh erstaunlich, dass es trotzdem relativ gut funktioniert. Und Ressourcen sind kein Ding, zum Test hatte ich immer so 700 Testdatensätze und die sind ratz fatz in kaum spürbarer Zeit durch.

Sort:  

Ja, wie gesagt, scheint insgesamt ein sehr effektiver Ansatz zu sein... und das mit rund 30 Wörtern Text. Sehr gut!

Habe deine aktuelle Version neulich mit recht alten Beiträgen getestet. Zuerst war ich in die "Falle" des fehlenden Tags gestolpert. Aber zu meiner Suche passte einer sehr gut, insofern war das kein Problem. Wir müssen dem Chiller mal vorschlagen, den Tag lediglich optional vorzusehen... oder hat er das schon auf dem Zettel?