Εγγύηση Online Υπηρεσιών

Αρχιτεκτονική Fleet365: πώς διατηρούμε το χρόνο λειτουργίας 99,99%

Αρχιτεκτονική Fleet365: πώς διατηρούμε το χρόνο λειτουργίας 99,99%

Εδώ, στην Fleet365, μας ρωτούν συχνά οι πελάτες μας πώς διευθετείται η διαδικασία παροχής υπηρεσιών από την πλευρά του διακομιστή. Για παράδειγμα, τι να περιμένουμε σε περίπτωση που κάποιο από τα στοιχεία του συστήματος αποτύχει, υπάρχει κάποια προστασία έναντι διακοπής λειτουργίας ή απώλειας δεδομένων, πώς αντιμετωπίζουμε ζητήματα που σχετίζονται με ενδιάμεσους κόμβους δικτύου κ.ο.κ. Σε αυτήν την ανάρτηση, θα σας πάμε κάτω από την κουκούλα της αρχιτεκτονικής Fleet365. Δεν θα εμβαθύνουμε στις τεχνικές λεπτομέρειες, αλλά θα αποκαλύψουμε μερικά από τα λειτουργικά χαρακτηριστικά του συστήματος για να δείξουμε πώς λειτουργεί στην πραγματικότητα.

Ανοχή σε σφάλματα και αξιοπιστία

Δεδομένου ότι η πλατφόρμα Fleet365 παρέχει υπηρεσίες σε πελάτες σε όλο τον κόσμο με τρόπο 24/7, η απρόσκοπτη λειτουργία και η αξιοπιστία της πρέπει να είναι στην πρώτη γραμμή. Ως εκ τούτου, είναι φυσικό οι δυνητικοί πελάτες μας να υποβάλλουν τις ακόλουθες ερωτήσεις στο στάδιο της απόφασης για τη σύνδεση ή όχι στο σύστημα: “Πόσο ανεκτικό και αξιόπιστο είναι το σύστημα;” “Ποιες μέθοδοι χρησιμοποιούνται για δημιουργία αντιγράφων ασφαλείας;”.

Για να μειωθούν οι κίνδυνοι διακοπής λειτουργίας, το σύστημα χωρίζεται σε διάφορους περιφερειακούς κόμβους, οι οποίοι, παρά το γεγονός ότι είναι διασυνδεδεμένοι, δεν εξαρτώνται μεταξύ τους. Κάθε περιφερειακός κόμβος είναι χτισμένος σύμφωνα με ένα κοινό πρότυπο ανεκτικό σε σφάλματα, ενώ ο αριθμός των διακομιστών που εκτελούν ξεχωριστές λειτουργίες επιλέγεται με βάση τις απαιτήσεις επεξεργασίας φόρτου εργασίας για κάθε έναν από τους κόμβους. Όσον αφορά το SLA (Service Level Agreement), δεσμευόμαστε να διατηρούμε τον στόχο -δείκτη uptime στο επίπεδο όχι λιγότερο από 99,99%, δηλαδή 52,56 λεπτά διακοπής λειτουργίας ετησίως. Από το 2020, ο χρόνος λειτουργίας μας δεν έχει μειωθεί κάτω από το 99,999%.

Ήταν τότε στο στάδιο του σχεδιασμού της αρχιτεκτονικής του συστήματος όταν επιλέξαμε να το χωρίσουμε σε περιφερειακούς κόμβους. Αυτός φάνηκε να είναι ο ευκολότερος τρόπος για τη μείωση των καθυστερήσεων δικτύου για τους πελάτες που έχουν πρόσβαση στο σύστημα από διάφορες γεωγραφικές τοποθεσίες, καθώς επίσης συνέβαλε στη μείωση του αντίκτυπου των περιφερειακών τεχνικών προβλημάτων στη συνολική σταθερότητα. Κατά τη διάρκεια αυτής της περιόδου είδαμε δυσκολίες που είχαν συναντήσει άλλοι παγκόσμιοι πάροχοι, με αποτέλεσμα τη διακοπή της συνδεσιμότητας δικτύου χωρών και ολόκληρων ηπείρων. Με αυτό κατά νου, σήμερα κάνουμε     ότι μπορούμε για να μετριάσουμε αυτούς τους κινδύνους. Τώρα ας προχωρήσουμε σε ένα διάγραμμα που απεικονίζει τον τρόπο με τον οποίο οι τοπικοί κόμβοι είναι διατεταγμένοι στη Fleet365.

Υποδομή cloud Fleet365

Εκτός από την ανοχή σε σφάλματα, εκτελούμε τακτικά αντίγραφα ασφαλείας και αναπαράγουμε όλα τα βασικά στοιχεία που απαιτούνται για τη συνεχή παροχή των υπηρεσιών. Δεδομένου ότι χρησιμοποιούμε την υποδομή Amazon AWS, το πρόγραμμα δημιουργίας αντιγράφων ασφαλείας περιλαμβάνει τόσο την εκκίνηση ενός αριθμού εικονικών διακομιστών για την εκτέλεση συγκεκριμένων λειτουργιών όσο και τη διανομή τους σε διάφορα κέντρα δεδομένων εντός ενός γεωγραφικού σημείου παρουσίας (PoP). Για παράδειγμα, ένας περιφερειακός κόμβος στη Φρανκφούρτη εκτείνεται σε τρία ανεξάρτητα κέντρα δεδομένων, ενώ όλες οι βάσεις δεδομένων αναπαράγονται με συνεχή τρόπο.

Επίσης δημιουργούμε αντίγραφα ασφαλείας όλων των βασικών διακομιστών σε καθημερινή βάση. Αυτό περιλαμβάνει αντίγραφα ασφαλείας βάσεων δεδομένων, εικονικούς δίσκους ή ολόκληρους διακομιστές.

Θα πρέπει να τονιστεί ότι κάθε διακομιστής εκτελεί ξεχωριστή λειτουργία. Αυτό σημαίνει ότι, εάν κάποιος πέσει κάτω, το υπόλοιπο δίκτυο θα συνεχίσει να λειτουργεί ανεπηρέαστο. Σε μια τέτοια περίπτωση, αναπτύσσουμε αμέσως έναν παρόμοιο διακομιστή από ένα προετοιμασμένο πρότυπο και ανεβάζουμε αυτόματα την τρέχουσα έκδοση οποιουδήποτε στοιχείου λογισμικού μας σε αυτό. Η υποδομή CD/CI μας επιτρέπει να λάβετε την πιο πρόσφατη έτοιμη έκδοση οποιουδήποτε από τα εξαρτήματα και να την αναπτύξετε σε οποιονδήποτε από τους διακομιστές. Η διαδικασία ανάπτυξης ενεργοποιείται αυτόματα μέσω του ansible.

Αύξηση της παγκόσμιας διαθεσιμότητας

Εκτός από τα υψηλά επίπεδα αξιοπιστίας, δεσμευόμαστε να παρέχουμε στους πελάτες μας πρόσβαση υψηλής ταχύτητας στις υπηρεσίες μας. Το σύστημα με κατανεμημένους περιφερειακούς κόμβους μας επιτρέπει να εντοπίζουμε τις υπηρεσίες μας πιο κοντά στον τελικό καταναλωτή. Ωστόσο, ακόμη και κατά την εφαρμογή αυτού του σχεδίου, υπάρχουν περιοχές, οι οποίες ενδέχεται να έχουν περιορισμένη πρόσβαση λόγω συμφόρησης των γραμμών επικοινωνίας ή σημαντικών αποστάσεων. Για να μετριάσουμε αυτούς τους παράγοντες, εκμεταλλευόμαστε το δίκτυο διανομής περιεχομένου CloudFlare CDN, το οποίο έχει αποδειχθεί ότι αποδίδει καλύτερα από την απλή μεταφορά δεδομένων απευθείας στον πελάτη μέσω Διαδικτύου. Οι δοκιμές μας έδειξαν ότι αυτή η προσέγγιση μπορεί να μειώσει την καθυστέρηση κατά 50% κατά τη φόρτωση πύλων πελάτη. Στα μέσα Σεπτεμβρίου 2020, ολοκληρώσαμε τη μετάβαση στο CloudFlare CDN για όλους τους πελάτες Fleet365. Καθώς η εργασία με το CloudFlare ενδέχεται να περιλαμβάνει ορισμένες προκλήσεις, είμαστε ελεύθεροι να ενεργοποιήσουμε ή να απενεργοποιήσουμε το CloudFlare CDN «εν κινήσει» για όλους τους χρήστες ή συγκεκριμένες ομάδες πελατών. Κατά τη διάρκεια οποιασδήποτε εναλλαγής είτε μεταβαίνει σε εφεδρικό διακομιστή, βάση δεδομένων ή οποιαδήποτε υπηρεσία – η μετάβαση είναι απρόσκοπτη και δεν γίνεται αντιληπτή από τους χρήστες μας.

Σταθερότητα και ασφάλεια

Παρακολουθούμε συνεχώς μια κατανεμημένη υποδομή για να διασφαλίσουμε τη σταθερότητά της. Για να αποκτήσουμε μια ολιστική εικόνα της τρέχουσας κατάστασης όλων των στοιχείων υποδομής και να εγγυηθούμε την απρόσκοπτη λειτουργία τους, χρησιμοποιούμε τα ακόλουθα κανάλια:

  • Σύστημα εσωτερικής παρακολούθησης.
  • Μια εξωτερική υπηρεσία που ελέγχει τη διαθεσιμότητα δημόσιων στοιχείων.
  • Ενσωματωμένες υπηρεσίες Amazon που αναφέρουν προβλήματα με την υποδομή του Amazon και τρέχουν εικονικούς διακομιστές.

Όσον αφορά την ασφάλεια του συστήματος, εφαρμόζουμε αυστηρές πολιτικές και διαδικασίες που περιλαμβάνουν την ασφάλεια και το απόρρητο των δεδομένων των πελατών. Η πρόσβαση στους περιφερειακούς κόμβους διατηρείται υπό συνεχή παρακολούθηση και περιορίζεται στο εξουσιοδοτημένο προσωπικό. Οι λίστες ελέγχου πρόσβασης περιορίζουν την πρόσβαση στην υποδομή cloud μας μόνο από εξουσιοδοτημένες διευθύνσεις IP.

Συμπέρασμα

Επεξεργασία επισκεψιμότητας από εκατοντάδες χιλιάδες συσκευές GPS και λήψη καθημερινών εκατομμυρίων αιτημάτων πελατών, η αρχιτεκτονική των υπηρεσιών Fleet365 παραμένει απλή στην εφαρμογή και προσφέρει μεγάλες ευκαιρίες για κλιμάκωση. Η τοπολογία του δικτύου μας επιτρέπει να αυξήσουμε γραμμικά την απόδοση οποιουδήποτε από τους κόμβους μας, καθώς και να προσθέσουμε εύκολα έναν επιπλέον αν χρειαστεί. Η κορυφαία προτεραιότητά μας είναι να παρέχουμε στους πελάτες μας ανεκτές, αξιόπιστες, προσιτές, σταθερές και ασφαλείς υπηρεσίες. Θα συνεχίσουμε να εργαζόμαστε σκληρά για να σας παρέχουμε τεχνικές λύσεις που αντιστοιχούν στα καθιερωμένα πρότυπα. Ελπίζουμε ότι βρήκατε χρήσιμη αυτήν την ανάρτηση και μάθατε κάτι νέο. Για τυχόν περαιτέρω απορίες σχετικά με αυτό το θέμα, μη διστάσετε να επικοινωνήσετε μαζί μας στη διεύθυνση support@fleet365.gr. Και ως συνήθως, είστε πάντα ευπρόσδεκτοι να μοιραστείτε τις σκέψεις σας για την αρχιτεκτονική της υπηρεσίας στην παρακάτω ενότητα σχολίων.

Back to top
Καλέστε Τώρα
Αρέσει σε %d bloggers: