08 de març 2008

A Tiempo

Que importante es actuar a tiempo. Y si no, que nos lo digan a nosotros.

Ayer mismo, íbamos a actualizar el router de Metro Ethernet a un nuevo tipo, en el que el ISP nos iba a cambiar el Cisco router por otro con puertos Gigabit para conseguir las máximas velocidades posibles. Viva la Fibra Óptica!

El plan era sencillo: a las 11:00am EST, iba a venir un chispas del ISP con una caja de Cisco bajo el brazo. Una vez en la sala de conexiones, iba a llamar a la central, donde iban a desconectar el circuito viejo. Con el circuito desactivado, el chispas iba a cambiarnos el router y conectaría la fibra al puerto gigabit. Luego, una simple llamada y volveríamos a estar conectados a la fibra.

En teoría era una sencilla cuestión de mantenimiento que iba a durar un máximo de 15 minutos.

A la practica...

10.50am EST. Suena el teléfono. "Bati-cueva, dígame?" Suena otro teléfono. Y otro. Y otro. Todo el departamento al teléfono. Y suenan mas llamadas en las "lineas dos" de los 3 teléfonos. Y empiezan a llegar emails urgentes sobre servidores remotos que han caido de la red. Fijo que algo pasa (que poderes deductivos que tengo, pardiez!).

Ese "algo" resulta una avería en la conexión Metro Ethernet. Y Metro Ethernet es como nos comunicamos con todas las oficinas remotas y con todos los clientes que necesitan acceder a los TeraServers con un volumen de dato bien alto. Y el acceso a los TeraServers es el negocio de esta empresa.

En Román Paladino: estamos oficialmente con el culo al aire.

CiscoMan saca el Telefono Rojo y llama al ISP. Me ahorro los improperios, descalificaciones y salidas de tono en idioma anglo que he aprendido tras oir esa conversación. A la cama no te irás sin escuchar un insulto más.

Tras media hora al teléfono, se descubre que el Departamento de Grifos del ISP resulta que había cerrado el grifo a nuestro circuito antes que el chispas los llamara. Teóricamente, para ahorrar tiempo. Total, si nos cortan el Metro Ethernet, no nos íbamos a enterar. Pero resulta que, ahora, para ponerlo otra vez en marcha hace falta una labor sobrehumana debido a no-se-que protocolos ISO9000 utilizados en el ISP antes de mover un pelo. Eso si, en el Departamento de Grifos se pasan los protocolos por el orto.


03:07pm EST Empiezan a llegar emails diciendo que los servidores remotos vuelven a estar en linea. La conexión aguanta toda la información que estaba acumulada. Los TeraServers sacan humo, pero aguantan.

03:10pm EST Nos llama el ISP. Nos indica que han abierto los grifos tras haber rellenado los formularios apropiados y haberlos enviado por mensajero y por triplicado al Vaticano. O algo asi.

03:14pm EST Acaba nuestra ronda de llamada a las oficinas remotas y a los clientes, indicándoles que volvemos a estar en linea y ya nos hemos tapado el culo con un bonito pareo.

03:15pm EST. Suena el teléfono. "Bati-cueva, dígame?"

"Holasss, que resulta que igual hay un problema. Que hemos intentado enviar datos a los TeraServers y resulta que no funcionan."


No! Otra vez no! Me caguen el ISP y el Departamento de Grifos!

Compruebo el Nagios y..... todo esta correcto! Todo funciona! ?Pero que...?

"Esto... cuando sus habéis dado cuenta del problema de acceso?"

"Pueeeeeees, podria ser algo antes del medio dia?"

"Pos va a ser que si; el log dice que hemos estado desconectados desde las 10:50am"

"Otias, que precision!"

"Ya te digo neng. A ver que mire.... pues esto funciona. ?Podrías darle al botón ahora mismo?"

"A ve, a ve.... jurl! ahora furula! Menos mal que os he llamado, porque si no, no os enterabais que teníais el TeraServer parado."

"Pues si, menos mal que nos has llamado"

Que fiera de tio. Desde antes de las 11 que no puede conectar y, como únicamente se trata de una aplicación critica, pues va y llama pasadas las 3. Y, para mas inri, va y llama justo después de que todos los TeraServers volvían a estar en linea.

Eso es lo que yo llamo "reportar una incidencia a tiempo".


Salut,
Sinner

3 comentaris:

Anònim ha dit...

Bravo, bravo.

Parece un ISP ehpañó, oiga. Manolo con el router, Benito en el departamento de grifos y el Profesor Bacterio y el Superintendente Vicente supervisando las operaciones.

'Gensanta...

Peppermint ha dit...

jajaja... lo del profesor bacterio me llegó al alma. Que por cierto ¡hoola vfmmeo!.

La verdad es que siempre he tenido una venita ingenua y hasta hace poco pensaba que las cosas funcionaban bien y la primera en el primer mundo... luego leo a sinnerbofh y se me caen los mitos a pedazos.

sigh...

Sergio Aguilar Molina ha dit...

¡Menos mal que el usuario os llamó! xD