SABER O QUE OCORRE COM O SEU DATA CENTER NUNCA FOI TÃO FÁCIL

 

 

 

 

 

 

 

 

Uma forma simples, rápida e prática para implementar uma solução robusta de monitoramento de Data Centers!

Uma das piores coisas que ocorre em um departamento de TI é quando um usuário reclama de um problema que a TI ainda não sabe que existe. Imagine um diretor ligando para o gestor de TI falando que o sistema está parado e o gestor não tem ideia do que está acontecendo.

Uma das formas que o gestor tem de resolver isso e melhorar sua imagem é implementando uma solução de monitoria proativa do ambiente. Essa solução monitora vários itens de seus servidores, como espaço em disco e uso de CPU, carga de bateria de nobreaks, identifica lentidão em aplicações, velocidade de switches, falha em discos dos storages, entre outros.

O grande problema é que as soluções de monitoria existentes no mercado são complexas, caras, difíceis de implementar e exigem que um profissional se dedique em tempo integral para mantê-la funcional, revisando e atuando nos alertas gerados, evitando os famosos “falsos positivos”. Sem foco e dedicação constantes, a solução se torna em pouco tempo um conjunto de vários alertas que ninguém mais sabe ao certo se são reais. Rapidamente, a solução cai em descrédito e a ferramenta de monitoramento é abandonada. 

A Blue Solutions estruturou para seus clientes uma oferta de NOC como serviço.

SAIBA MAIS SOBRE OS VALORES

O QUE É NOC?

Por definição, NOC (Network Operations Center) é o local onde se realiza o monitoramento de equipamentos e serviços de TI, de forma padronizada e centralizada. A implementação de um departamento de NOC já uma prática comum em grandes e médias empresas e está se tornando cada vez mais popular e acessível para pequenas empresas.

Com o NOC, é possível monitorar diversos ativos de rede:

  • Servidores

  • Storages

  • Switches

  • Roteadores

  • Ar-Condicionados

  • AP´s Wireless

  • Centrais telefônicas

  • NoBreaks

Quais informações são capturadas?

  • Paradas de equipamentos

  • Oscilação de serviços

  • Status de serviços de ERP, CRM, E-mail, etc…

  • Links congestionados

  • Links parados

  • Erros de aplicação

  • Temperatura de data center

  • Entre outros

 

Em resumo, pode-se monitorar qualquer equipamento que possua IP.

As informações que são monitoradas podem ser personalizadas de acordo com a necessidade de cada ambiente, tornando o monitoramento mais assertivo e eficiente.

NOC BLUE SOLUTIONS

A Blue Solutions possui mais de 13 anos de experiência em suporte e monitoramento de ambientes de data centers, contando com equipe técnica qualificada e certificada nas principais tecnologias do mercado.

 

  • NOC localizado em Araras, interior de São Paulo

  • Opera 24 horas por dia e 7 dias por semana

  • Mais de 2.000 servidores monitorados

QUAIS AS VANTAGENS?

AÇÕES PREVENTIVAS

A implementação de um departamento de NOC melhora consideravelmente a disponibilidade dos ativos de TI, uma vez que ações preventivas são tomadas antes que um problema maior ocorra, visando sempre a estabilidade do ambiente de TI. 

Exemplos Práticos:

Espaço em Disco Limitado

Um servidor de arquivos está com seu espaço em disco com 90% de utilização. O técnico de NOC entrará em contato com o cliente para informar o problema e, em conjunto, elaborar um plano de ação para liberar espaço e prevenir uma parada no serviço.

Falha em rotina de backup

Uma rotina de backup que roda de madrugada apresentou falha. Na mesma madrugada o técnico de NOC acessa o servidor, corrige a falha e reinicia a rotina.

MELHORIA NA DISPONIBILIDADE

Uma grande vantagem na implementação de um NOC é a melhoria no SLA de disponibilidade. Com ações preventivas os problemas que causariam indisponibilidade são evitados, tornando o ambiente de TI muito mais estável. Muitas empresas possuem metas específicas de SLA para “medir” o departamento de TI, em geral 99,9%. A disponibilidade pode ser observada na tabela abaixo:

 

Disponibilidade (%) Total de Horas/Ano Total de Horas Indisponíveis/Ano
90% 8760 horas 876 horas (36,5 dias)
95% 8760 horas 438 horas (18,3 dias)
99% 8760 horas 87 horas (3,6 dias)
99,9% 8760 horas 8,76 horas
99,99% 8760 horas 52,56 minutos
99,999% 8760 horas 5,3 minutos

QUAIS AS VANTAGENS?

AÇÕES PREVENTIVAS

A implementação de um departamento de NOC melhora consideravelmente a disponibilidade dos ativos de TI, uma vez que ações preventivas são tomadas antes que um problema maior ocorra, visando sempre a estabilidade do ambiente de TI. 

Exemplos Práticos:

Espaço em Disco Limitado

Um servidor de arquivos está com seu espaço em disco com 90% de utilização. O técnico de NOC entrará em contato com o cliente para informar o problema e, em conjunto, elaborar um plano de ação para liberar espaço e prevenir uma parada no serviço.

Falha em rotina de backup

Uma rotina de backup que roda de madrugada apresentou falha. Na mesma madrugada o técnico de NOC acessa o servidor, corrige a falha e reinicia a rotina.

MELHORIA NA DISPONIBILIDADE

Uma grande vantagem na implementação de um NOC é a melhoria no SLA de disponibilidade. Com ações preventivas os problemas que causariam indisponibilidade são evitados, tornando o ambiente de TI muito mais estável. Muitas empresas possuem metas específicas de SLA para “medir” o departamento de TI, em geral 99,9%. A disponibilidade pode ser observada na tabela abaixo:

 

Disponibilidade (%) Total de Horas/Ano Total de Horas Indisponíveis/ Ano
90% 8760 horas 876 horas         (36,5 dias)
95% 8760 horas 438 horas         (18,3 dias)
99% 8760 horas 87 horas               (3,6 dias)
99,9% 8760 horas 8,76 horas
99,99% 8760 horas 52,56 minutos
99,999% 8760 horas 5,3 minutos

 Você sabe qual a disponibilidade do seu ambiente?

EU PRECISO DO NOC NA MINHA EMPRESA?

No cenário atual, onde os serviços das empresas precisam estar 100% disponíveis 24 horas por dia e 7 dias por semana, o investimento na implementação de um departamento de NOC se torna indispensável para empresas de qualquer porte ou ramo, seja um escritório de advocacia que trabalha com um sistema ERP e servidores de e-mails na nuvem ou uma fábrica que opera com sua linha de produção em escala 24×7 ou ainda um site de e-commerce.

Atualmente em todas as empresas, a alta disponibilidade de seus serviços de TI tornou-se indispensável! A falha de um item simples, como a falta de espaço em um disco de um servidor, pode comprometer a imagem perante seus clientes ou usuários, perder o tempo de uma venda, atrasar a linha de produção e empurrar o seu cliente direto para o seu concorrente.

Imaginem o aplicativo UBER ou o site da NetFlix alguns minutos fora do ar.

 

QUANTO CUSTA?

Todos pensam que contar com um serviço de monitoramento 24×7 é extremamente custoso. De fato, se comparado com os custos necessários em manter uma estrutura envolvendo software, equipamentos e equipe técnica qualificada em escala 24×7, o valor fica impraticável para grande parte das empresas. Mas no modelo de terceirização, esse custo é compartilhado entre várias empresas, tornando o serviço acessível a empresas de todo porte.

A precificação mensal se baseia nas quantidades de itens que serão monitorados, conforme tabela abaixo:

QUANTIDADE

VALOR POR ITEM | ESCALA 24 X 7

VALOR POR ITEM | ESCALA 8 X 5

até 10 itens R$ 67,00 R$ 57,00
entre 11 e 30 itens R$ 57,00 R$ 47,00
entre 31 e 50 itens R$ 47,00 R$ 37,00
entre 51 e 80 itens R$ 37,00 R$ 27,00
acima de 80 itens consulte-nos consulte-nos

Para exemplificar, vamos simular um ambiente comum encontrado em uma empresa de médio porte:
• 2 servidores físicos
• 1 switch
• 1 storage
• 20 máquinas virtuais

Para o ambiente acima, a precificação se daria da seguinte forma: Temos 24 itens que compõem o ambiente de Data center. O valor mensal para o serviço de NOC em escala 24×7 ficaria em R$ 1.368,00.

CLIENTES E DEPOIMENTOS

“Depois que começamos a utilizar o monitoramento “à vista“ disponibilizado através de dashboard e alarmes eficazes com acionamentos e atuações rápidas, o sentimento é de segurança e maior tranquilidade para nossa operação. No geral, é possível medir a saúde de nosso ambiente!!” Leia mais »

Kleber R. Giungi, Supervisor de Suporte do Hosp. e Matern. Dr. Cristóvão da Gama

“A contratação do serviço de monitoramento da Blue nos trouxe uma tranquilidade em relação a continuidade dos negócios, segurança da informação, proatividade na resolução dos problemas, além de outras melhorias. Podemos dizer que houve um aumento de nossa equipe interna sem possuir os profissionais fisicamente, onde contamos com vários especialistas em diversas áreas 24 horas por dia”. Leia mais »

Marcos Chinaglia, Coordenador de TI da Galzerano

“Com a entrada do NOC da Blue em nosso ambiente, conseguimos alcançar um excelência no atendimento prestado, aproveitando a sinergia que já existia, direcionando nossos analistas, que antes tratavam incidentes e agora podem desempenhar outras atividades. Sem dúvidas, a Blue é um “braço” muito importante em nossa operação”.

Alex Tavares, Coordenador de TI da Rede D’Or São Luiz S/A

FAQ - PERGUNTAS FREQUENTES

Vale a pena terceirizar o serviço de NOC ou implementar um sistema de monitoramento interno?

► Financeiro
A questão financeira é o primeiro ponto a se levar em conta, vejam o exemplo abaixo:


Consideremos uma média salarial de R$ 1.500,00* para um técnico de TI, acrescidos os impostos, o valor mensal para a empresa seria cerca de R$ 2.625,00/mês.


Para mantermos a estrutura funcionando 24 horas serão necessárias 4 pessoas revezando em turnos de 8 ou 12 horas.


Apenas com salários, podemos considerar um custo fixo de R$ 10.500/mês.


Além deste custo, que por si só já justifica a escolha pelo modelo de terceirização, teríamos também valores de adicionais noturnos, despesas com treinamentos, energia, equipamentos, telefonia, espaço físico e toda infraestrutura necessária para que este departamento funcione.


Não estou incluindo nessa conta valores com softwares de monitoramento, considerando que temos ótimas opções Open Source disponíveis, como Nagios ou Zabbix.


Ok, irão me dizer que a equipe interna de TI, que já atende a empresa, irá realizar o monitoramento, portanto os custos destes profissionais não podem entrar nessa conta… nesse momento entra nosso próximo e importante ponto a ser considerado: FOCO.

► FOCO!
Devemos ter em mente que a equipe interna já possui diversas atividades no dia a dia. Atividades relacionadas a suporte a usuários, atendimento a fornecedores, um relatório urgente que precisa ser desenvolvido, configurar novos desktops que chegaram, entre outras atividades.


Dificilmente, um profissional que não estiver 100% dedicado à atividade de monitoramento irá desprender a atenção necessária que este serviço demanda, atuando preventivamente em todos os alertas gerados, acionando os times de suporte antes que um problema maior ocorra e mantendo o ambiente estável.


A quantidade de informações que um sistema de monitoramento gera, quando bem configurado, é imensa! Em nosso ambiente de exemplo detalhado acima com os 24 equipamentos, a quantidade de serviços monitorados** chegaria facilmente próximo de 1.100, cada serviço é checado a cada 5 minutos, gerando 316.800 checagens diárias. Se não tiver dedicação e foco para tratar todas essas checagens e alertas, em pouco tempo a solução cai em desuso.


Fonte: *Pesquisa Salarial Catho

** em média 40 a 60 serviços são monitoráveis para sistemas operacionais Linux ou Windows.

O que é necessário para implementar o NOC Blue Solutions?

A implementação do NOC Blue Solutions é relativamente simples. É necessário o download de um appliance virtual (VMware ou Hyper-V), criação de regras de firewall, para que o nosso sistema de monitoramento na nuvem acesse esse appliance, e liberação de usuários com perfis administrativos.


O appliance pode ser implementado dentro de um DMZ e os acessos podem ser realizados através de VPN, garantindo assim, maior compliance com regras de segurança.


O grande desafio na implementação de um NOC são os serviços que deverão ser monitorados. Tenha em mente que cada servidor possui uma ou mais funções específicas, e todas estas funções devem ser detalhadas para que nossa equipe possa configurar o monitoramento da melhor forma possível.

 

 

Durante a implementação, é realizado em conjunto com o cliente todo o alinhamento da atuação para os possíveis problemas, por exemplo:


• Em caso de queda do link da operadora, a equipe do NOC deverá alterar para o link secundário e registrar um chamado de suporte na operadora de internet.


• Em caso de problemas com o banco de dados, a equipe do NOC deverá abrir um ticket de suporte para a empresa X verificar o problema.


Essas atuações são personalizadas de acordo com as regras de cada cliente.

 

Como funciona no dia a dia?

No dia a dia, a prática da operação ocorre da seguinte forma:


Quando o nosso sistema detectar algum alerta CRÍTICO no ambiente monitorado (servidor DOWN, Listener do Oracle DOWN, etc.), o cliente e/ou time de suporte é comunicado via telefone pelo nosso time de NOC, que informa o problema detectado.


Para alertas que não comprometem o serviço (ex: utilização de 90% de espaço em disco) o cliente será comunicado inicialmente via e-mail, através de nossa ferramenta de service desk; em caso de persistência do alerta, o cliente será comunicado via telefone.


Todos os alertas são registrados em nosso sistema de service desk, com as informações do problema detectado, data/hora da detecção, interações com cliente e data/hora da normalização.


O serviço de NOC não atua na correção dos problemas detectados.


O cliente poderá acompanhar o status de seus servidores monitorados através de nosso Dashboard, em tempo real.

Como é o Dashboard NOC?

O dashboard de monitoramento permite o acompanhamento online dos status dos servidores monitorados pelo nosso NOC e dos tickets em atendimento.

 

 

A aba “Principal” exibe informações referentes a:


• Disponibilidade do último mês
• Disponibilidade do mês atual
• Status dos itens monitorados (UP/DOWN)
• Status dos serviços monitorados (UP/WARNING/CRITICAL/UNKNOWN/ACK *)
• Tickets em atendimento na central de serviços
• Tickets aguardando retorno
• Histórico de tickets por tipo (últimos 12 meses)

* A coluna ACK informa se já foi tomada alguma ação por parte de nossos técnicos de NOC

 

 

Os gráficos sumarizados possuem drill-down, exibindo maiores detalhes.


A aba “Top Services” possui gráficos sobre o ambiente monitorado pelo NOC:

• Utilização de disco
• Load (carga do sistema) em servidores Linux
• Utilização de memória em servidores Linux
• Utilização de memória em servidores Windows

 

 

A aba “Escopo NOC” informa quais servidores e serviços estão sendo monitorados pelo nosso NOC e a saúde de cada host.

 

 

Como calcular o SLA de seu Data Center?

O SLA, Service Level Agreement, é um acordo para um determinado nível de serviço, utilizado geralmente entre a área de TI e seus usuários ou clientes. Pode ser utilizado por qualquer área da empresa, mas está comumente associado com a TI.

Esse acordo descreve as metas que o departamento de TI deve buscar. O SLA pode ser um tempo mínimo de resposta para um ticket de suporte, uma média de satisfação dos usuários, um tempo mínimo de indisponibilidade de um serviço, ou seja, podemos aplicar o SLA de várias formas.

Neste texto, vamos explorar o SLA de disponibilidade de um data center, ou seja, a meta que a área de TI precisa buscar para manter os serviços disponíveis para seus usuários ou clientes.

O SLA de disponibilidade é calculado pelo tempo que determinado servidor, serviço ou aplicação ficou disponível para seus usuários dividido pelo tempo total esperado, veja fórmula abaixo:

 

 

Por exemplo: uma determinada aplicação utiliza o serviço SMB do servidor X para funcionar; quando o serviço SMB apresentou um problema, a aplicação ficou indisponível para seus usuários durante 6 horas. Essa aplicação deve estar disponível para seus usuários apenas em horário comercial. Temos 2086 horas comerciais em um ano, aplicando a fórmula acima chegamos no seguinte índice de SLA:

SLA de disponibilidade: 2080/2086 = 99,71%


Uma meta comum entre as empresas é a disponibilidade de 99,9% em escala 24×7. Isso corresponde ao tempo máximo 8,76 horas de indisponibilidade em um ano; se a meta for mais agressiva, por exemplo, 99,99%, o limite máximo de indisponibilidade passa para 52,56 minutos. Não são metas fáceis de se manter!

 

 

Você sabe qual o SLA de seu data center?

Através da implementação correta de um NOC é possível calcular a disponibilidade dos servidores e serviços, Uma das principais vantagens que o NOC traz, é a melhoria do SLA de disponibilidade conseguida através de serviços preventivos.

 

Fale conosco para melhorar o SLA de disponibilidade Veja aqui como medir e melhorar o SLA de disponibilidade, clique aqui » 

O que monitorar em um ambiente WebLogic?

Para ter um ambiente Weblogic ou qualquer outro Middleware monitorado de forma eficiente é necessário se atentar a alguns detalhes que vão além do monitoramento básico.

Além dos itens de sistema operacional normalmente monitorados, por exemplo, espaço em disco, Load, memória, serviços, processos, entre outros, é extremamente importante incluir em sua rotina de monitoramento os itens específicos do servidor Weblogic.

Um servidor é uma instância do WebLogic Server executada em sua própria Java Virtual Machine (JVM) e que tem sua própria configuração:

•Server State: Estado geral do servidor, pode assumir os status: RUNNING, SHUTDOWN, SHUTTING_DOWN, FAILED, STARTING, STANDBY.
•Server Health: Informações gerais sobre as condições de saúde do servidor Weblogic, sendo OK, CRITICAL, FAILED, OVER LOADED, WARNING, LOW MEMORY.
•Application Health: Condições gerais das aplicações que estão sendo executadas.
•Application Run State: Estado das aplicações que estão sendo executadas nos servidores.
•JVM Heap Size Statistics: Estatísticas de Utilização da Memória da Máquina Virtual. Tamanho de Heap Atual, Heap Livre Atual, Percentual de Heap Livre, Tamanho Máximo de Heap.
•JDBC Datasouce State: Informações gerais da origem de dados: health, status, conexões ativas, delay time. Permite validar que você possui a quantidade correta de recursos disponíveis para atender suas necessidades. Também é útil determinar se você precisa aumentar ou diminuir o tamanho do pool. Enquanto isso os tempos de atraso de conexão podem ser usados para determinar a capacidade de resposta do banco de dados.
•Thread State: Informações gerais sobre o status do pool de threads (total, stuck thread, threadpool health). A quantidade de Thread Stuck, impacta diretamente na performance do servidor. Threads consomem recursos de CPU e memória. As Threads Stuck impactam na performance do servidor, porém a quantidade de threads vai variar de acordo com a aplicação.


O monitoramento correto e a análise preventiva destas informações contribuí consideravelmente para a melhoria na disponibilidade das aplicações para seus usuários.

Ainda tem dúvidas? Deseja ter o NOC-Monitoramento de Ativos de TI da Blue Solutions na sua empresa? Entre em contato, clique aqui» 

AINDA TEM DÚVIDAS? ENTRE EM CONTATO:

Nome

E-mail

Telefone

Empresa

Quantos itens serão monitorados?

Sua mensagem

APRENDA MAIS SOBRE NOC

O que é NOC? Que vantagens eu tenho ao implantar em minha empresa?

Um termo que tem ganhado destaque como uma boa prática para TI é NOC, que significa Network Operation Center, Centro de Operações de Rede, em inglês.

Por definição é um local onde se realiza o monitoramento e gestão dos eventos de TI. Através de softwares específicos, uma equipe especializada monitora os…

[…continuar lendo]

A Importância do Monitoramento no Ambiente de TI

A cada dia o ambiente de tecnologia da informação vem sendo mais importante, pois cada vez mais a TI está relacionada diretamente com os negócios das empresas.

Profissionais de TI são cada vez mais cobrados para garantirem a alta disponibilidade de ambientes sem qualquer “downtime” nos serviços críticos e de negócios da empresa. O problema é que esse processo de garantir que não ocorra qualquer problema no ambiente não é uma tarefa fácil quando não se utiliza uma ferramenta de monitoramento para o mesmo…

[…continuar lendo]

Blue Solutions reestrutura e amplia setor técnico e NOC

Após 10 anos monitorando e atendendo mais de 70 clientes, a Blue Solutions finalizou, neste mês de julho, a ampliação e modernização do seu NOC e setor de serviços gerenciados…

[…continuar lendo]

Casos e a importância do uso do NOC Blue Solutions

Uma grande vantagem na implementação de um NOC é a melhoria no SLA de disponibilidade. Com ações preventivas, os problemas que causariam indisponibilidade são evitados, tornando o ambiente de TI muito mais estável. Contamos agora a experiência de dois clientes que já utilizam o NOC da Blue Solutions…

[…continuar lendo]