Temperatura Discos

Imagen de NEO

Forums: 

Que tal amigos.
Tengo un servidor que tiene 7 discos conectados :S
A veces me da kernel panic, pero no encuentro el error ya, revisé los logs y lo único que encuentro son estos mensajes

Apr 25 19:02:08 mitch smartd[3192]: Device: /dev/hdb, opened
Apr 25 19:02:08 mitch smartd[3192]: Device: /dev/hdb, found in smartd database.
Apr 25 19:02:09 mitch smartd[3192]: Device: /dev/hdb, is SMART capable. Adding to "monitor" list.
Apr 25 19:02:09 mitch smartd[3192]: Device: /dev/sda, opened
Apr 25 19:02:09 mitch smartd[3192]: Device /dev/sda: using '-d sat' for ATA disk behind SAT layer.
Apr 25 19:02:09 mitch smartd[3192]: Device: /dev/sda, opened
Apr 25 19:02:09 mitch smartd[3192]: Device: /dev/sda, found in smartd database.
Apr 25 19:02:09 mitch smartd[3192]: Device: /dev/sda, is SMART capable. Adding to "monitor" list.

Así para los 7 discos.
Con los comandos de smartctl no encuentro ningún error.
Cuando chequeo la temperatura encuentro que, a mi criterio, están un poco elevadas. Me dan 78 grados luego de 10 minutos de encedida la PC, miren..

[root@mitch /]# smartctl -l selftest -i -A /dev/sdd | grep Celsius
194 Temperature_Celsius 0x0022 078 064 000 Old_age Always - 22 (Lifetime Min/Max 15/22)

En cuántos grados tienen sus discos duros?
Qué sugerencia me pueden dar?

Saludos
NEO

me parece que esos son los

Imagen de Ascii

me parece que esos son los mensajes por default del smartd
recomendaciones, has un memtest a ese server.
Es un servidor genérico??? si es así asegúrate que tenga una fuente con poder suficiente.
Olvídate de las fuentes de poder chinas de $20.
Prueba cambiar la fuente de poder por otra mayor.

salu2

Discos con temp. por encima

Imagen de chopeta

Discos con temp. por encima de los 45C tiene mayor tendencia a presentar problemas.

Mis discos corren en un promedio de 40C, tengo un servidor generico en casa corriendo UnRAID (www.lime-technology.com) con 9 discos (capacidad total de aprox. 10TB con redundancia), pero estoy usando un RSV-S8 (http://www.newegg.com/Product/Product.aspx?Item=N82E16816132016) justamente por temas de ventilacion (solo 1 disco duro esta adentro del CPU junto al mainboard).

root@Tower:~# smartctl -i -A /dev/sdb | grep Temp
190 Airflow_Temperature_Cel 0x0022 062 056 045 Old_age Always - 38 (Lifetime Min/Max 36/44)
194 Temperature_Celsius 0x0022 038 044 000 Old_age Always - 38 (0 23 0 0)
root@Tower:~#

Yo haria un run de Smart Tests (short & long) en cada uno de los discos para ver como estan... los params. mas relevantes son: Reallocated_Sector_Ct, Spin_Retry_Count, Current_Pending_Sector y Offline_Uncorrectable
http://en.wikipedia.org/wiki/S.M.A.R.T.

Puedes tambien buscar algo en el forum de UnRAID es muy bueno para temas de discos duros...
http://www.lime-technology.com/forum/index.php

Yo ya tuve esos problemas de kernel panic cuando estaba usando OpenFiler, se arreglo cuando encontre el disco que fallaba y lo formatee completamente a bajo nivel usando un script del UnRAID.

Pero tambien estoy de acuerdo con el amigo que dice que corras un Memtest, tambien ya tuve ese problema y tuve que cambiar memorias...

De la fuente de poder no creo que hace falta acrescentar nada, cuando estas en un nivel de tener 7 discos, la fuente es prioridad #1

Suerte.

"Toda la unanimidad es tonta." -Nelson Rodrigues