Servidores quentes… bem mais quentes que o desejável…

Certa vez um amigo me falou que um funcionário de um grande cliente do datacenter em que ele trabalhava pediu para visitar uma das salas de servidores. Na hora de sair, a anta do funcionário em vez de clicar no botão para abrir a porta, que era elétrica, apertou no botão de incêndio, com isso o todas as medidas anti-incêndio, inclusive com a descarga de um caríssimo gás de combate à incêndios.

Ano passado, em outro episódio, um bebim chato tirou centenas, possivelmente mais de mil servidores do ar no 365 Main, um dos melhores datacenters dos EUA ao fazer a mesma proeza, ativar o alarme de incêndio.

Acho que as fotos abaixo justificam todas as medidas de segurança adotadas nestes locais. Mas fica o aviso aos nerds/geeks e simpatizantes, isso é de gelar a espinha de qualquer um que goste de computadores…


Clique aqui para ver o post completo.

4 Piores situações que vivi com meus servidores.

Desde o ano 2000 que eu só contrato hospedagem no exterior, e desde 2002 que venho trabalhando com meus próprios servidores dedicados. Comecei muito verde, com muita curiosidade e vontade de aprender, apanhei muito, contei com a ajuda de amigos, principalmente do Marcelo “][MoSCa][”, hoje já não sou mais tão neófito, e gerencio uma pequena rede de servidores.

Ontem pela manhã, eu recebi um email do suporte da LiquidWeb (jabá gratuito: o melhor datacenter com que já trabalhei) dizendo um dos servidores que tenho com eles estava com problemas, e que eles não estavam conseguindo logar na máquina para corrigir (o suporte é proativo, não espera que você solicite ajuda). Fui ver qual era o problema, e como não era nenhum bicho de sete cabeças, eu mesmo ajeitei, e depois fui ter com o suporte só mesmo para corrigir o problema de login. Tudo certo.

É a vantagem de operar em um datacenter de primeira linha. A tranqüilidade é sem igual. Ato contínuo à breve satisfação, eu comecei a lembrar das aventuras e desventuras que passei nestes cinco anos em que venho operando servidores dedicados, e separei as quatro piores desventuras, ou quatro maiores cagadas se preferirem.

4ª – Detonando o diretório /var/
Das dores de cabeça grandes, só esta foi minha culpa. Entre outras coisas, o diretório /var/ guarda todos os logs do sistema, todas as bases de dados, em alguns casos todos os websites instalados no servidor, guarda ainda arquivos de configuração e de update, só para citar uma parte. Eu tinha acabado de receber o servidor com uma configuração errada, e dei um “rm -f” (em Linux isso quer dizer: “apague tudo e não me encha o saco, faça o que eu mandei!”) achando que estava em outro local. Foi de longe a pior besteira que já fiz, felizmente a instalação que o datacenter fez havia sido errada e eu ganhei a re-instalação.

Moral da história: pense 10 vezes antes de dar um “rm -f”.

.

3ª – The Planet e o HD perdido…
Toda máquina que eu pego, é contratada com uma unidade extra de disco, para backup on site. Bem, em uma máquina hospedada no The Planet, foi detectado durante um upgrade do gerenciador do sistema que o disco principal estava muito corrompido. Depois de trocado o disco e re-instalado o sistema, os caras perderam o disco secundário, onde estavam os backups on site de pelo menos 60 clientes (os backup off site já tinham mais de uma semana). E nada de ninguém encontrar o disco. Até que no dia seguinte, um técnico já com um novo disco na mão, indo instalar o encontrou: dentro da máquina. Ele estava lá, e estava ligado, só não aparecia no gerenciador de discos do Windows. Foi só mandar procurar por novo hardware, e tudo ficou são. Ufa…

Moral da história: manda o suporte olhar no lugar mais óbvio, por mais absurdo que seja.

.

2ª – Managed.com e um revendedor autorizado-picareta
Quando eu fui contratar um servidor na Managed.com eles disseram que o equipamento que eu precisava não estava disponível, um revendedor tinha contratado em lote e eu deveria falar com o dito revendedor… oito meses depois o revendedor deu um calote e eu, junto com outros 150 clientes tivemos que pagar duas vezes pelo mesmo período para poder recuperar os dados. Só não foi maior o prejuízo porque eu consegui receber meu pagamento de volta com o Paypal.

Moral da história: só contrate de revendedor se você realmente o conhecer bem.

.

1ª – Burst.net e o servidor perdido, literalmente…
Se vocês acharam surreal o The Planet perder o meu HD, imaginem quando descobrirem que a Burst.net perdeu o servidor INTEIRO!

Este servidor tinha um problema crônico de resfriamento, o que fez necessário a reposição por 4 vezes do disco principal, um aquecedor SCSI de 10.000RPMs. Na quarta substituição, o departamento técnico do datacenter TROCOU a tampa do servidor com um outro servidor qualquer… E era justamente na tampa que estava a etiqueta informando o rack/slot da máquina. Com isso meu servidor foi parar em um rack bem longe do correto, em outra sub-rede, que o tornou inacessível. Foram necessários 3 dias para encontrá-lo, aparentemente a cagada envolveu outros servidores.

Moral da história: fuja da Burst.net!

.

Agora, estas histórias são lembranças, o rídiculo dos erros chega a ser tragi-comicamente engraçado, mas o stress que cada situação dessas causa, só sabe quem passou…

Bebim chato tira do ar centenas de servidores nos EUA!

O que acontece quando o empregado de um datacenter considerado de primeiríssima linha chega bêbado para trabalhar, endoida e mete a mão no botão de “desligamento de emergência” em uma sala de servidores?

Tira mais de 40 racks de servidores do ar!

Depois eu farei uma postagem sobre as disposições que servidores podem ter em um datacenter, mas por enquanto, considerem, que um rack padrão, de 42U pode comportar desde 10 servidores fisicamente grandes, com 4Us até 60 servidores blade (10 servidores verticais ocupando 7U de espaço).

Logo estamos falando de centenas de servidores, possivelmente mais de mil, tirados do ar por um bebim chato em um apertar de botão…


Rack de 42U com servidores de 2U

Isso aconteceu durante a madrugada de ontem para hoje na 365 Main, um datacenter considerado, como dito no início da postagem, de primeiríssima linha nos EUA, localizado no centro da cidade californiana de San Francisco. Entre os clientes afetados estão: AdBrite, Technorati, Craiglist, TypePad e Live Journal, apenas para citar os mais high profile.

A notícia de que foi um empregado bêbado não é, logicamente, confirmada pela empresa. Segundo ela, o datacenter foi vítima de um “apagão” que está afetando o centro daquela cidade. Mas a própria ValleyMag, que é a fonte originária da notícia, reporta que um homem foi visto sendo levado pela polícia, algemado e gritando: “You have been trolled by nut rollers!“.

O que “pega”, é que o datacenter sempre se vendeu como tendo fontes redundantes de energia, inclusive geradores próprios, o que os tornariam imunes a apagões. O lema deles é: “365 Main – The World’s Finest Data Centers”.


Fila na porta da 365 Main,
supostamente entregadores com notificações extra-judiciais…

Segundo Dave Sifry, do Technorati, em email para a ValleyMag:

Caros,

Eu gostaria de informar-lhes, que San Francisco está tendo um GRANDE problema energético, com apagões desde o distrito financeiro até o Daly City. Um de nossos “colos” no 365 Main Street está sofrendo com um apagão (nem liguem para o fato de que eles sempre juraram para cima e para baixo que este tipo de coisa nunca poderia ocorrer, ah não, eles tem múltiplos sistemas redundantes e cobram os olhos da cara para que tenhamos certeza de que nosso negócio terá continuidade, isto não está acontecendo, ah sim), entretanto, nossos outros datacenters continuam funcionais, e nós esperamos retornar ao funcionamento completo tão logo quanto possível.

Nós informaremos os desdobramentos, e agradecemos seu apoio durante este problema…

Dave.

Ooops…

Via: Digg
Detalhes: ValleyMag

Hospedagem de sites e a falácia do oversell

No ramo de hospedagem não existe milagre, existe oversell PONTO.

Para quem não tem familiaridade com o termo, oversell é o ato em que uma empresa de hospedagem vende mais recursos do que realmente dispõe em um servidor de internet, confiando-se no fato de que os clientes quase que invariavelmente solicitam mais recursos do que de fato necessitam.

O oversell é uma realidade desta indústria, e ocorre tanto em empresas de hosting dedicado quanto em empresas de hosting compartilhado. É um artifício que se aproveita da natureza humana, que sempre procura extrair o máximo em cima do valor pago.

Até alguns anos atrás, o nível de oversell considerado* mais ou menos saudável era entre a venda de 30% à 100% a mais do que havia de recursos disponíveis no servidor ou no data center.

Com o tempo e a queda no preço de armazenagem, o oversell migrou do conjunto espaço/tráfego, para puramente tráfego. Afinal, com discos de 400 ou 500 Gb à custo relativamente acessível, fica fácil ter uma máquina com 1 ou 2 TB de espaço de armazenagem.

Aí o bicho pegou. De alguns anos para cá, uns cinco eu acho, começaram á aparecer os planos milagrosos, como os da PowWeb, DreamHost e Blue Host. Essa moçada começou a vender banda de servidor dedicado à preço de plano compartilhado barato. Não são as únicas, mas provavelmente são as mais emblemáticas.

Eles começaram á vender o que não custa menos de US$ 100,00 por mês, pelo preço de US$ 7,49 ou até menos. Eles não estão fazendo nada que possa ser considerado ilegal, mas sem dúvidas, do ponto de vista ético é sofrível.

Por quê? Porque à partir do momento em que você se aproximar do uso de 30% ou 40% da banda, uma destas duas coisas acontecerão com você:

  1. O serviço vai degradar ao ponto de você se ver obrigado á retirar
  2. Você será convidado à se retirar.


Clique aqui para ver o post completo.