Η εξόρυξη κειμένου (αγγλικά: text mining) είναι η διαδικασία με την οποία υψηλής ποιότητας πληροφορίες εξάγονται από κείμενα με τη χρήση πληροφοριακών συστημάτων. Πιο συγκεκριμένα, αφορά στον εντοπισμό και την αυτόματη εξαγωγή νέων, άγνωστων μέχρι πρότινος πληροφοριών από διάφορους γραπτούς πόρους[1], όπως ιστότοπους, βιβλία, μηνύματα ηλεκτρονικού ταχυδρομείου, κριτικές και άρθρα.


Η τεχνολογία εξόρυξης κειμένου χρησιμοποιείται ευρέως σε κυβερνητικές, ερευνητικές και επιχειρηματικές εφαρμογές, όπως, σε εφαρμογές εθνικής ασφάλειας, στην οργάνωση μη δομημένων δεδομένων, στην ανάλυση συναισθήματος. Η εμφάνιση εξατομικευμένων διαφημίσεων στο διαδίκτυο, βασίζεται επίσης στην τεχνολογία εξόρυξης κειμένου.

Μέθοδοι και λογισμικό εξόρυξης κειμένου ερευνάται και αναπτύσσεται από μεγάλες εταιρείες, συμπεριλαμβανομένων των IBM και της Microsoft, για την περαιτέρω αυτοματοποίηση των διαδικασιών εξόρυξης και ανάλυσης.

Παραπομπές

Επεξεργασία