header3PT.jpg

9 Abril 2019

RESOLVIDO: Ambientes de SaaS inacessíveis: timeout

Esse problema foi marcado como resolvido em 12 de abril de 2019 às 1:18:50 PM CEST


Postagem original:
09 de abril de 2019 at 8:29:55 AM CEST
Estamos atualmente com problemas em um dos nossos locais de hospedagem. Como resultado, o seu ambiente TOPdesk pode não estar disponível.
Estamos cientes do problema e trabalhando em uma solução.

Nossas desculpas pelo inconveniente. Nosso objetivo é atualizar este blog de status pelo menos a cada 30 minutos até que o problema seja resolvido.


Atualização/Atualizações:
12 de abril de 2019 à 1:08:57 PM CEST
Análise de Causa Raiz
Linha do Tempo - 9 de abril às 08:00 CEST o cluster de arquivos usado para hospedar arquivos temporários para ambientes TOPdesk no datacenter NL3 tornou-se indisponível . Esta indisponibilidade fez com que os ambientes TOPdesk falhassem quando ações específicas eram executadas. Os ambientes indisponíveis foram detectados em minutos e o TOPdesk iniciou uma investigação.
Às 08:30 CEST, o cluster de arquivos estava novamente online. Ambientes TOPdesk iniciados antes desse tempo ainda poderiam falhar, pois havia referências a arquivos indisponíveis na memória do TOPdesk. Os operadores do TOPdesk reiniciaram todos os ambientes indisponíveis. Ambientes que encontram problemas depois das 08:30 reiniciam automaticamente.
Às 09:00 AM CEST todos os ambientes anteriores estavam novamente online.
Por volta das 11:00 da manhã, a causa raiz do problema foi confirmada. Os reinícios foram agendados para a próxima janela de manutenção disponível para resolver permanentemente quaisquer problemas remanescentes para os ambientes TOPdesk.

Follow-up
Uma alteração para compartimentalizar o armazenamento de arquivos temporários foi iniciada. Também estamos investigando por que um cluster de armazenamento de arquivos projetado para alta disponibilidade ficou indisponível.
Várias ações foram programadas para reduzir o tempo até que as informações sobre uma interrupção estejam disponíveis para os clientes, incluindo a melhoria dos procedimentos de comunicação interna e a automatização do processo para atualizar a página de status.

Confiabilidade do TOPsk SaaS
Estamos cientes de que houve muitas interrupções em nossos serviços de SaaS recentemente. Mesmo que a causa raiz de cada interrupção tenha sido investigada e mitigada, a melhoria da confiabilidade de nossos serviços de SaaS tem nossa maior prioridade.

10 de abril de 2019 at 9:01:49 AM CEST
Todos os ambientes TOPdesk que usam o armazenamento de arquivos com defeito ontem foram reiniciados nesta noite. Nós não notamos mais nenhum problema residual.

Entre em contato com o Suporte TOPdesk se o seu ambiente TOPdesk ainda estiver apresentando algum erro. O TOPdesk publicará uma análise de causa raiz na página de status dentro de uma semana.

April 9, 2019 at 2:21:24 PM CEST
Esta manhã houve uma breve interrupção no sistema de armazenamento de arquivos usado para arquivos temporários para ambientes TOPdesk. A indisponibilidade temporária do sistema de armazenamento de arquivos em combinação com configurações e ações específicas no TOPdesk pode causar a falha dos ambientes TOPdesk, mesmo em um momento posterior.

Quando o ambiente TOPdesk falha, o TOPdesk é reiniciado e recuperado automaticamente após aproximadamente 10 minutos. Após este reinício, o problema não se repete.

Os ambientes TOPdesk que foram afetados durante a interrupção do armazenamento de arquivos não se recuperaram automaticamente e foram reiniciados manualmente nesse momento.

Para evitar falhas futuras do TOPdesk, todos os ambientes TOPdesk que usam o armazenamento de arquivos que não funcionou esta manhã serão reiniciados durante a próxima janela de manutenção.

O TOPdesk ainda está investigando a causa raiz da interrupção do sistema de armazenamento. Uma análise de causa raiz será postada em nosso blog de status dentro de 5 dias úteis.

9 de abril de 2019 at 9:35:39 AM CEST
Os Ambientes TOPdesk estão de volta online, ainda estamos ocupados investigando A causa raiz

9 de abril de 2019 at 9:08:27 AM CEST
Quase todos os ambientes TOPdesk afetados pela interrupção estão novamente online. Estamos iniciando os últimos poucos ambientes.

9 de abril de 2019 at 8:52:16 AM CEST - Os engenheiros estão investigando uma interrupção em nossa infraestrutura de armazenamento que está afetando a disponibilidade do TOPdesk. Forneceremos uma atualização em 15 minutos.



Original message - Mensagem original