Project

General

Profile

Actions

Bug #5

open

[Urgent] Application "GestionCommandes" - Pods en CrashLoopBackOff - Impact Production

Added by UserName LastName 10 months ago. Updated 10 months ago.

Status:
New
Priority:
Urgent
Assignee:
-
Start date:
05/12/2025
Due date:
% Done:

0%

Estimated time:

Description

Description du Problème :

Depuis environ 09:45 CEST ce matin, l'application "GestionCommandes" est inaccessible. Les utilisateurs signalent des erreurs "Service Indisponible" lorsqu'ils tentent d'accéder à la fonctionnalité de création de commandes.

Une première investigation via la console Kubernetes montre que plusieurs pods du déploiement "gestion-commandes-depl" sont dans un état CrashLoopBackOff.

Étapes pour Reproduire (si applicable) :

Tenter d'accéder à l'URL : https://commandes.entreprise.com/nouvelle
Constater l'erreur affichée par le navigateur ou l'application cliente.
Messages d'Erreur Observés (Logs, Captures d'écran) :

Extrait des logs d'un pod en erreur (via kubectl logs -n namespace-production) :
Error: Unable to connect to database: Timeout expired. The timeout period elapsed prior to completion of the operation or the server is not responding.
at new ConnectionError (/app/node_modules/mssql/lib/tedious/connection-error.js:13:18)
at Connection.emit (events.js:315:20)
... (stack trace complète si nécessaire)
Sortie de kubectl get pods -n namespace-production | grep gestion-commandes :
gestion-commandes-depl-7f5d7b9c8c-abc12 0/1 CrashLoopBackOff 5 2m
gestion-commandes-depl-7f5d7b9c8c-def34 0/1 CrashLoopBackOff 5 2m
gestion-commandes-depl-7f5d7b9c8c-ghi56 1/1 Running 0 1h
Joindre une capture d'écran de l'erreur utilisateur si disponible.
Informations Techniques Complémentaires (Kubernetes) :

Namespace : namespace-production
Nom du Déploiement : gestion-commandes-depl
Nom du Service : gestion-commandes-svc
Version de l'Image Docker : registre.entreprise.com/gestion-commandes:v1.2.5
Changements Récents : Un nouveau déploiement de la version v1.2.5 a eu lieu hier soir à 23:00 CEST (Release CRQ00789). Auparavant, la version v1.2.4 était stable.
Ressources (CPU/Mémoire) des Pods : Semblent conformes aux demandes et limites configurées.
Dépendances : Base de données SQLProd01, Service d'Authentification AuthSVC.
Actions Déjà Tentées :

Redémarrage manuel d'un des pods en erreur via kubectl delete pod -n namespace-production : Le nouveau pod redémarre et retombe en CrashLoopBackOff.
Vérification de l'état des services dépendants (Base de données, Service d'Authentification) : Le monitoring indique qu'ils sont opérationnels.
Personne à Contacter pour plus d'Informations :

Jean Dupont (Demandeur)
Alice Martin (Responsable Technique Application - )
Catégorisation (Proposée) :

Catégorie : Incident Applicatif
Sous-catégorie : Indisponibilité de Service
Élément de Configuration (CI) : APP-GestionCommandes-PROD

Actions

Also available in: Atom PDF