Οι βασικές αποκλίσεις (outliers) είναι τιμές στα δεδομένα που διαφέρουν σημαντικά από τις υπόλοιπες. Πρόκειται για παρατηρήσεις που “ξεφεύγουν” από το συνηθισμένο μοτίβο και μπορεί να οφείλονται είτε σε λάθη, είτε σε σπάνιες περιστάσεις, είτε σε πραγματικά ενδιαφέροντα γεγονότα. Οι αποκλίσεις μπορούν να επηρεάσουν τους μέσους όρους, τις αναλύσεις και τα μοντέλα, γι’ αυτό και ο εντοπισμός τους είναι σημαντικό μέρος του data analytics.
Μεμονωμένες αποκλίσεις (Point Outliers)
Μία τιμή που ξεχωρίζει σαφώς από όλες τις υπόλοιπες.
Πλασματικές/Συμφραζόμενες αποκλίσεις (Contextual Outliers)
Τιμές ακραίες μόνο υπό συγκεκριμένο πλαίσιο ή συνθήκες.
Συλλογικές αποκλίσεις (Collective Outliers)
Ομάδα τιμών που μαζί δείχνουν μη φυσιολογική συμπεριφορά.
Τυχαίες αποκλίσεις (Noise Outliers)
Τιμές που προκύπτουν από τυχαίο “θόρυβο” ή μικρά λάθη.
Λάθη/Εσφαλμένες τιμές (Error Outliers)
Τιμές που προέρχονται από λάθη καταγραφής ή εισαγωγής δεδομένων.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου