Alta Disponibilidade - Introdução

Definição de Alta Disponibilidade


Alta Disponibilidade (AD) é a capacidade de um sistema para executar a sua função de forma contínua (sem interrupção) por um período de tempo significativo e superior ao que a fiabilidade dos seus componentes individuais poderia sugerir. Então, a AD é um equilíbrio entre o custo da inactividade e o custo das medidas de protecção que estão disponíveis para evitar ou reduzir o tempo dessa mesma inactividade.

O termo Alta Disponibilidade, quando aplicado a sistemas informáticos, significa que a aplicação ou serviço em questão está permanentemente disponível, independentemente da hora do dia, local ou outros factores que possam influenciar a disponibilidade de tal recurso.

Em geral, a AD é a capacidade de continuar o serviço por períodos muito longos sem interrupções. Assim, AD é uma abordagem ao planeamento e implementação de sistemas e dos serviços a eles associados, que assegura um nível de desempenho operacional previamente combinado será cumprido durante um período de medição contratual.

Os sistemas de AD devem proteger as empresas de dois tipos de possíveis falhas: falhas no sistema e falhas do site. Embora as verdadeiras soluções AD devam proteger contra estes dois tipos de falhas, os sistemas AD são normalmente considerados como os que tratam da protecção contra as falhas no sistema, enquanto as falhas no site são normalmente tratadas por um sistema de Disaster Recovery (DR).

A Alta Disponibilidade pode também ser vista como a característica de um sistema para se proteger ou recuperar de interrupções menores num curto espaço de tempo com meios amplamente automatizados. Não importa se as falhas que causam as interrupções menores estão nos próprios sistemas, no ambiente ou se são o resultado de erros humanos. No caso de uma interrupção deste tipo, os sistemas altamente disponíveis têm a opção de abortar as sessões em curso, ou seja, o utilizador irá sentir a falha, mas é suposto que voltem a disponibilizar o serviço novamente, num curto espaço de tempo.

Diferentes empresas e diferentes negócios terão diferentes níveis de risco associados à perda de dados e potencial tempo de inactividade. Existe uma grande panóplia de soluções técnicas que podem ser usadas para fornecer vários níveis de protecção relativamente às necessidades específicas de cada um desses negócios. A solução ideal não teria tempo de inactividade e não permitiria a perda de dados. Essas soluções existem, mas são caras, e os seus custos devem ser ponderados em face do potencial impacto para os negócios causado por um desastre e os seus efeitos.

Algumas tecnologias típicas para se conseguir a AD incluem fontes de alimentação redundantes, poderosos sistemas de refrigeração para servidores, sistemas de disco RAID (Redundant Array of Inexpensive/Independent Disks), clusters de servidores, várias placas de rede e routers redundantes para as redes.

Mas além de toda esta complexidade temos ainda que adicionar a globalização dos negócios, o que implica que não há "tempo de pausa" ou "fora das horas de expediente" tão essenciais para a manutenção destes sistemas informáticos. Portanto, os - o sangue vital da organização - devem estar disponíveis em todos os momentos: dia ou da noite durante a semana, ou feriado, local ou dia de trabalho. A expressão “24×7×sempre” descreve eficazmente a disponibilidade dos sistemas informáticos empresariais e é tão popular que até está a ser utilizada na linguagem comum para descrever entidades não-computacionais, tais como o 112 e outros serviços de emergência.

Há uma ideia generalizada de que Alta Disponibilidade significa 24x7 e é apenas necessária para as empresas que operam 24x7, mas isso nem sempre é verdade. Existem algumas empresas que, apesar de não funcionarem 24x7, requerem que os seus sistemas estejam sempre disponíveis.

 

Importância da Alta Disponibilidade


O aumento da procura na Internet de aplicações críticas para o negócio


A importância da AD varia conforme as aplicações; as bases de dados e a Internet têm possibilitado uma colaboração a nível mundial e a partilha de informação, estendendo o alcance das aplicações de base de dados a todas as organizações e comunidades. Este alcance enfatiza a importância da alta disponibilidade de soluções de gestão de dados.

Tanto as pequenas empresas como as empresas globais têm utilizadores em todo o mundo que necessitam de acesso aos dados 24 horas por dia. Sem esse acesso aos dados, as operações podem parar e, consequentemente, perderem-se receitas.

No entanto, a necessidade de proporcionar níveis crescentes de disponibilidade continua a acelerar à medida que as empresas reestruturam as suas soluções para ganhar vantagem competitiva. Na maioria das vezes, estas novas soluções dependem do acesso imediato aos dados críticos de negócio.

Quando não houver dados disponíveis, as operações podem deixar de funcionar e o tempo de inactividade pode levar à perda de produtividade, perda de receita, relacionamento com clientes afectado, má publicidade e mesmo a acções judiciais.

No entanto, paralelemente a todos estes benefícios surge também uma crescente dependência desta infra-estrutura. Se uma aplicação crítica se torna indisponível, todo o negócio pode estar em perigo. As receitas e os clientes podem ser perdidos, podem ser exigidas penalizações e a publicidade negativa pode ter um efeito duradouro sobre os clientes e sobre as acções da empresa.

É importante analisar os factores que determinam como os dados estão protegidos e maximizar a sua disponibilidade para os utilizadores. Os computadores são cada vez mais rápidos e mesmo assim as empresas que dependem deles não param de exigir mais e mais de todos os sistemas informáticos.

As interligações e as diversas dependências no mundo da computação, constituído por diversos componentes e tecnologias, estão a tornar-se mais complexas a cada dia que passa. A disponibilidade de acesso em todo o mundo através da Internet está a colocar exigências extremamente altas para as empresas, departamentos de TI e administradores que têm que gerir e manter os computadores que suportam tudo isso.

Minimizar a perda de receitas devido à inactividade


Quando as coisas estão a correr bem, mal notamos a presença destes sistemas complexos nas nossas actividades diárias. No entanto, quando esses sistemas não conseguem desempenhar as suas funções, prendem imediatamente a nossa atenção. Uma falha num sistema pode causar apenas um pequeno desconforto, mas algumas falhas no sistema podem gerar perda de receitas e, na pior das hipóteses, perda de vidas.

Horas de trabalho perdidas são um indicador indirecto para a receita perdida. Quando 1000 trabalhadores de um escritório não podem trabalhar durante 2 horas, porque um servidor está em baixo, ou quando os bens vendidos não podem ser entregues, as vendas que poderiam ter sido feitas nesse período de tempo podem ter sido perdidas para sempre.

As perdas de receita podem ser directamente atribuídas a uma falha de TI. Esta é a consequência comercial mais importante, mas é também a mais difícil de medir directamente embora seja possível estimá-la. Se os sistemas de ponto de venda estiverem em baixo, ou se a empresa vender produtos ou serviços na Internet, qualquer interrupção nesses sistemas fará com que os clientes vão para os concorrentes, cujos sistemas estão ainda em funcionamento.
No longo prazo, muitas interrupções do sistema com visibilidade para os clientes irão prejudicar a reputação da empresa o que resultará inevitavelmente em perda de clientes.
Disponibilidade significa dinheiro no actual ambiente empresarial global e competitivo. Muitas organizações precisam de disponibilidade quase contínua dos recursos dos seus servidores críticos. Perda de serviço (ou interrupção) de um servidor importante traduz-se directamente muitas vezes em perda de receita ou, pior ainda, em clientes perdidos.

Cada vez mais, a disponibilidade é medida em dólares, euros e ienes, e não apenas em tempo e conveniência.