Στατιστική με το Excel - μάθηση και εξάσκηση στην πράξη

Ανάλυση χρονοσειρών στο Excel για την εκτίμηση της ποιότητας και την ανάλυση σφαλμάτων

Όλα τα βίντεο του μαθήματος Στατιστική με το Excel - μάθηση και εξάσκηση στην πράξη

Η ανάλυση χρονοσειρών αποτελεί κεντρικό στοιχείο της στατιστικής , ιδίως σε οικονομικά πλαίσια. Προκειμένου να αναπτύξετε μια καλή κατανόηση των αναλύσεων σφαλμάτων και των ποιοτικών εκτιμήσεων στο Excel, θα οδηγηθείτε μέσω μιας πρακτικής περίπτωσης χρήσης σε αυτό το σεμινάριο. Αυτό γίνεται με το παράδειγμα μιας μελέτης περίπτωσης ενός προμηθευτή αυτοκινήτων. Θα μάθετε πώς να συγκρίνετε τις προβλέψεις με τις πραγματικές τιμές και να ποσοτικοποιείτε την ποιότητα των προβλέψεών σας μέσω αναλύσεων σφαλμάτων.

Βασικά συμπεράσματα

  • Θα μάθετε πώς μπορούν να συγκριθούν οι προβλέψεις και οι πραγματικές τιμές στο Excel.
  • Θα μάθετε ποιοι δείκτες σφάλματος χρησιμοποιούνται για την αξιολόγηση της ποιότητας της πρόβλεψης.
  • Στο τέλος, θα είστε σε θέση να υπολογίσετε τον συντελεστή διακύμανσης και τη ρίζα του μέσου τετραγωνικού σφάλματος (RMSE).

Οδηγίες βήμα προς βήμα

Ξεκινήστε εισάγοντας τις τιμές του 2019 ως προβλέψεις και τις τιμές του 2020 ως πραγματικές τιμές στο Excel. Βεβαιωθείτε ότι μεταφέρετε σωστά τα στοιχεία για να δημιουργήσετε μια σταθερή βάση για τους υπολογισμούς σας.

Ανάλυση χρονοσειρών στο Excel για την εκτίμηση της ποιότητας και την ανάλυση σφαλμάτων

Για να πραγματοποιήσετε την ανάλυση, χρειάζεστε τα ακατέργαστα δεδομένα και για τα δύο έτη. Θα πρέπει να εξασφαλίσετε τα στοιχεία του 2020 και στη συνέχεια να ενσωματώσετε τις προβλέψεις για το 2019. Οι τιμές αυτές θα χρησιμεύσουν ως βάση για τους υπολογισμούς σας.

Τώρα αντιγράψτε τα ακατέργαστα δεδομένα των στοιχείων του 2020 σε ένα χώρο εργασίας και επικολλήστε τα στο σύνολό τους. Για να διατηρήσετε τη σαφή διάρθρωση των υπολογισμών, είναι σκόπιμο να δημιουργήσετε ξεχωριστές στήλες για τις προβλέψεις και τις πραγματικές τιμές.

Στο επόμενο βήμα, πρέπει να αφαιρέσετε τις προβλέψεις από τις πραγματικές τιμές για να υπολογίσετε τα σφάλματα. Για να το κάνετε αυτό, χρησιμοποιήστε τον τύπο "σφάλμα = πραγματική τιμή - πρόβλεψη". Σύρετε αυτόν τον υπολογισμό σε όλα τα σημεία δεδομένων σας για να ποσοτικοποιήσετε όλα τα σφάλματα.

Μόλις υπολογίσετε τα σφάλματα, το επόμενο βήμα είναι να τετραγωνίσετε αυτά τα σφάλματα. Αυτό σημαίνει ότι πολλαπλασιάζετε κάθε σφάλμα με τον εαυτό του, γεγονός που σας δίνει τα τετραγωνισμένα σφάλματα.

Τώρα υπολογίστε τη μέση τιμή των τετραγωνικών σφαλμάτων. Για να το κάνετε αυτό, χρησιμοποιήστε τη λειτουργία "Μέσος όρος" στο Excel και διαιρέστε το άθροισμα των τετραγωνικών σφαλμάτων με τον αριθμό των παρατηρήσεων. Αυτό σας δίνει το μέσο τετραγωνικό σφάλμα.

Ανάλυση χρονοσειρών στο Excel για την εκτίμηση της ποιότητας και την ανάλυση σφαλμάτων

Αφού προσδιοριστεί η μέση τιμή των τετραγωνικών σφαλμάτων, πάρτε την τετραγωνική ρίζα αυτής της μέσης τιμής. Έτσι προκύπτει η ρίζα του μέσου τετραγωνικού σφάλματος (RMSE). Αυτή η τιμή είναι ζωτικής σημασίας για την αξιολόγηση της ποιότητας της πρόβλεψής σας.

Τώρα θέλετε επίσης να υπολογίσετε τη μέση τιμή των πραγματικών τιμών. Για να το κάνετε αυτό, χρησιμοποιήστε ξανά τη λειτουργία "Μέσος όρος" και επιλέξτε τις αντίστοιχες πραγματικές τιμές. Αυτός ο μέσος όρος είναι σημαντικός για τη μετέπειτα ερμηνεία του συντελεστή διακύμανσης.

Στο επόμενο βήμα, υπολογίζετε τον συντελεστή διακύμανσης (CV). Ο CV υπολογίζεται διαιρώντας το RMSE με τη μέση τιμή των πραγματικών τιμών. Αυτό σας δίνει μια ποσοστιαία αναπαράσταση των σφαλμάτων σε σύγκριση με τις πραγματικές τιμές, η οποία αξιολογεί την ποιότητα των προβλέψεών σας.

Η ερμηνεία του συντελεστή διακύμανσης είναι ουσιαστική. Συντελεστής CV 0,08 σημαίνει χαμηλή σχετική διακύμανση και επομένως υψηλή ποιότητα πρόβλεψης. Μπορείτε επίσης να καταχωρίσετε αυτό το ποσοστό και τα ευρήματά σας σε έναν πίνακα αναφοράς για να κάνετε τα αποτελέσματα πιο κατανοητά.

Συνοψίζοντας, αναλύσατε τις προβλέψεις και τις πραγματικές τιμές στο Excel σε διάφορα βήματα. Ο υπολογισμός των σφαλμάτων, ο τετραγωνισμός, ο μέσος όρος και τέλος ο προσδιορισμός του συντελεστή διακύμανσης είναι βασικές διαδικασίες για την αξιολόγηση της ποιότητας των αναλύσεων χρονοσειρών.

Σύνοψη

Σε αυτόν τον οδηγό, διερευνήσατε τον τρόπο ανάλυσης χρονοσειρών στο Excel συγκρίνοντας τις προβλέψεις με τις πραγματικές τιμές. Μάθατε πώς να υπολογίζετε τα σφάλματα, να τα τετραγωνίζετε και να ποσοτικοποιείτε την ποιότητα των προβλέψεών σας. Με τον προσδιορισμό του συντελεστή μεταβλητότητας, έχετε πλέον τη δυνατότητα να αξιολογείτε καλύτερα τις μελλοντικές προβλέψεις.

Συχνές ερωτήσεις

Πώς μπορώ να απεικονίσω τις πραγματικές τιμές και τις προβλέψεις στο Excel;Δημιουργώντας ξεχωριστές στήλες για τις πραγματικές τιμές και τις προβλέψεις και εισάγοντας τις αντίστοιχες τιμές σε αυτές τις στήλες.

Πώς μπορώ να υπολογίσω το RMSE; Το RMSE υπολογίζεται λαμβάνοντας την τετραγωνική ρίζα του μέσου όρου των τετραγωνικών σφαλμάτων.

Τι σημαίνει υψηλός συντελεστής διακύμανσης;Ένας υψηλός συντελεστής διακύμανσης υποδηλώνει υψηλή σχετική διακύμανση, η οποία υποδηλώνει χαμηλότερη ποιότητα πρόβλεψης.

Γιατί είναι σημαντικό να τετραγωνίζονται τα σφάλματα;Ο τετραγωνισμός των σφαλμάτων διασφαλίζει ότι οι θετικές και οι αρνητικές αποκλίσεις δεν εξουδετερώνουν η μία την άλλη κατά τον υπολογισμό της μέσης τιμής.