La tolerancia a fallas se refiere a un sistema de computación o un componente diseñado de tal manera, que en el caso de algún elemento falle, un equipo o procedimiento de respaldo puede inmediatamente tomar su lugar sin pérdida de servicio. Esta, puede ser provista a través de software; incrustada en el hardware o en una combinación de ambas.
La tolerancia a fallas es lograda duplicando cada componente. Por ejemplo, los discos son duplicados. Múltiples procesadores son bloqueados conjuntamente y sus salidas son comparadas para correción. Cuando ocurre alguna anormalidad, el componente defectuoso es identificado y colocado fuera de servicio, pero las máquinas continúan funcionando normalmente
|