Αποτροπή που προέρχονται από κύρια ονόματα στην PostgreSQL;

ψήφοι
2

Σε ενθουσιασμό του να stemm μάρκες σε λέξημα , PostgreSQL Πλήρες Κείμενο μηχανή αναζήτησης μειώσει επίσης κύρια ονόματα. Για παράδειγμα:

essais=> select to_tsquery('english', 'bortzmeyer');
to_tsquery 
------------
'bortzmey'

essais=> select to_tsquery('english', 'balling');
to_tsquery 
------------
'ball'
(1 row)

Τουλάχιστον για το πρώτο, είμαι σίγουρος ότι δεν είναι στο αγγλικό λεξικό! Ποιος είναι ο καλύτερος τρόπος για να αποφευχθεί αυτή η ψευδεπίγραφη που προκύπτουν;

Δημοσιεύθηκε 09/12/2008 στις 21:43
πηγή χρήστη
Σε άλλες γλώσσες...                            


2 απαντήσεις

ψήφοι
4

Το σημείο που απορρέουν αλγορίθμων είναι όχι να μειωθεί κάθε λέξη με τη σωστή στέλεχος του? ο στόχος είναι να μειωθούν οι λέξεις που είναι όμοια με μια κοινή προήλθε μορφή. Ο στόχος είναι γενικά να μην πάρετε μια λέξη που μπορεί να παρουσιάζεται στο χρήστη: ακόμη και αν «στρογγυλοποίησης» και «μπάλα» θα παράγει τόσο «kjebnkkekaa» ο αλγόριθμος είναι σωστή, διότι εξακολουθεί να βλέπει «στρογγυλοποίησης» και «μπάλα», όπως γενικά σχετικά το ίδιο πράγμα.

Επίσης προσέξτε ότι δεν προκύπτουν αλγόριθμος είναι απολύτως τέλεια, για περισσότερες πληροφορίες δείτε τη Συγκράτηση αλγόριθμο Porter

Απαντήθηκε 09/12/2008 στις 22:12
πηγή χρήστη

ψήφοι
2

Αυτό είναι λόγω της Stemmer χιονοστιβάδας, όπως εξηγείται εδώ . Βασικά θα θέλετε να απενεργοποιήσετε το Stemmer χιονοστιβάδας και να χρησιμοποιούν μόνο ispell ή ένα από τα άλλα λεξικά, αλλά θα μειώσει επίσης την απορρέουν απόδοσης για τις λέξεις όχι στα λεξικά.

Απαντήθηκε 09/12/2008 στις 22:21
πηγή χρήστη

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more