11 de January de 2023
Fuente+1
Errores silenciosos de datos (SDEs o silent data errors) es un fenómeno poco conocido ya que se investiga a nivel de ingeniería informática/electrónica y principalmente en datacenters.
Esto solo es relevante a nivel de cpus muy complejos y en las densidades computacionales de data centers, no es en absoluto algo nuevo de lo que debamos preocuparnos.
Resulta que la reducción de el tamaño de fabricación de los silicios también dificulta la precisión y exactitud de su producción, y el mercado requiere producción masiva.
Estamos hablando de la última frontera en investigación de alto nivel sobre fidelidad en sistemas informáticos, que nadie se alarme.
Expertos opinan sobre como los micros actuales van al limite de todo, pero si no tienes un Meta o un Google no te preocupes.
Salu2.
@defaultuser Pues efectivamente, es 'silenciosos'. No sé yo por qué lo había traducido como 'ocultos'.
Nunca había leído sobre este tema. Sobre tasas de fallo en memorias RAM hay bastante escrito y de hecho hay implementaciones vía hardware. No se yo si ese tipo de errores es achacable a la fabricación y es comparable a esto (supongo que no por lo "simple" de una memoria RAM y lo complejo de un procesador).
El hecho de que intenten atacar el problema de las CPUs vía software ya da una idea de resbaladizo que debe ser el tema.
@cobito En la ram no es por fabricación, lo que ocurre es que las "unidades" donde se almacena los bits son básicamente capacitores, y por lo visto tienden a perder un poco su nivel energético cuando están activados, de ahí que la ram se autorrefresca.
Ya el disponer de ECC, se ve que fuera de servidores o workstation no merece la pena, pasara como con el SDEs supongo.
@cobito dijo en Errores de datos ocultos:
El hecho de que intenten atacar el problema de las CPUs vía software ya da una idea de resbaladizo que debe ser el tema.
Pasa inadvertido a todo absolutamente a excepción de las tools especificas de análisis imagínate, será tal vez que este fenómeno lo descubrió la teoría y posterior comprobación? vete a saber.
El caso es que se ve que empieza a tener una incidencia como para tomarlo mas en serio, entre que la integración mas pequeña da menos precisión del acabado, y que la planta informática no para de crecer, tiene sentido que llegado cierto punto el control de este fenómeno sea crucial.
mencionan una herramienta, el Fire Tool, no lo he visto pero seguro que es un galimatias.