Synology Étendre le volume SHR 2 disques avec un 3ème ? Ou bien ajouter un volume ? Risques et praticité VS sécurité et moins pratique…

MilesTEG

Administreur
Membre du personnel
6 Septembre 2020
3 166
750
288
Bonsoir,
Il me faut vos conseils 😊

Je suis en train de réorganiser mes données entre mes différents nas, voilà où j’en suis ce soir :
- ds920+ : nas principal qui contient les données vitales et services syno (Drive, Photos) et fait la vidéosurveillance. Docker , reverse proxy (swag), Adguard Home, NextCloud , gitea, portainer et divers autres conteneurs. Il est aussi la destination des sauvegardes des ordinateurs mac et pc. Hyperbackup me fait des sauvegardes sur le colis et fera (quand je l’aurai paramétré) des sauvegardes sur au moins un des deux autres nas.
Ce 920+ est équipé de 2 hdd 4To en shr faisant un volume et un disque de 2To (basique) faisant le volume dédié à surveillance station. Il a aussi deux ssd nvme de 500Go formant un volume en raid1 (oui j’ai bricolé en CLI :pt1cable: ) ce volume étant dédié à Docker.


- Asustor As6704T : il est lui doté de deux ssd sata de 500Go en raid formant un volume dédié à docker là aussi.
J’ai récemment placé le Seagate Exos 14 To (qui était dans le 920+) pour y stocker les médias de Plex, car le serveur Plex (et tautulli) est sur l’asustor.
Sur ce nas est aussi présent une instance de AdGuard Home (la principale) avec une synchronisation des paramètres avec celle du 920+.
(J’ai vu aussi que le slot3 de ce nas a un défaut : dès qu’il y a un disque dessus , le nas ne démarre pas jusqu’à au bout , les disques tournent le nas se lance mais ne fini pas le boot).


- Qnap TS-470 Pro : pour le moment pas encore initialisé . Il stockera les backups des deux autres nas, et sera allumé une fois par semaine pour recevoir ces backups.
Je prévois de lui mettre ces disques qui étaient dans le ds214play que je vais filer à mes beaux parents :
- WD Red 8To
- et un Seagate Ironwolf 4To que le 920+ m’a fait sortir car un ou quelques secteurs défectueux : un test badblock complet n’a révélé aucun soucis ni erreurs, donc il est bon pour reprendre du service en tant que disque de backup.
- J’ai un vieux Seagate barracuda 2To qui subi en ce moment un badblock car il ne passe pas le test smart étendu qui se bloque à 10%. Si le badblock se fini il pourra servir.
- J’ai aussi un vieux WD Green 1To aussi que je pourrais utiliser si j’utilise un dernière disque 4To dans mon 920+.


Il reste donc un dernier disque de 4To qu’il faudrait que j’analyse avec smartctl pour voir s’il a eu des erreurs car il était utilisé dans le 214play avant que j’ai le 920+.

Ma question, si ce disque peut servir en production dans le 920+ : je l’intègre au volume en shr faisant alors un raid 5 à trois disques avec les risques que ça entraîne à la reconstruction…
Ou bien j’en fait un volume séparé de 4To ?

L’objectif serait d’augmenter la taille du volume de données ou den avoir un autre pour stocker TimeMachine, Active Backup.

J’aurais préférence sur l’ajout à la grappe shr ce serait plus simple à gérer :ange:
Qu’en pensez vous ?

Merci d’avance pour vos conseils 😊
 
Moi j'aurais rajouté au groupe de stockage existant afin d'en faire un shr équivalent au raid 5.
Niveau place ça revient à un raid 1 ( que tu as actuellement) + 1 volume séparé.
C'est plus pratique et ça évitera de devoir déplacer des dossiers.
 
Bon et bien pas de 2To 😅

1677697528683.png


Moi j'aurais rajouté au groupe de stockage existant afin d'en faire un shr équivalent au raid 5.
Niveau place ça revient à un raid 1 ( que tu as actuellement) + 1 volume séparé.
C'est plus pratique et ça évitera de devoir déplacer des dossiers.
Ok, ça conforte mon idée ^^
Mais niveau risque si jamais un disque tombe en panne, c'est pas pire qu'en SHR 2 disques à la reconstruction ?
 
le 4To que je voudrais mettre a ces données smart :
1677698643391.png
Il a presque 7 ans ;)
L'autre est plus récent, mais a un secteur défectueux et DSM a gueulé, je l'ai sorti de la grappe SHR, puis j'ai lancé un badblocks qui s'est avéré ensuite nickel.
L'un comme l'autre n'est pas optimal...
Une préférence ?
 
Nouvelles du matin 👋
Le test smart étendu s'est terminé sans erreurs sur le vieux WD Red 4To.
Voilà ce que me donne un smartctl -a --device=ata /dev/sata1 en ligne de commande :

Code:
smartctl 6.5 (build date Oct  7 2021) [x86_64-linux-4.4.180+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-XXXXXXXXXXXXXXXXXX
LU WWN Device Id: 5 0014ee 2b46adcba
Firmware Version: 80.00A80
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Mar  2 06:55:24 2023 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (52980) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 530) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x703d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   178   174   021    Pre-fail  Always       -       8075
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       716
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   017   017   000    Old_age   Always       -       61236
 10 Spin_Retry_Count                                                 0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       516
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       229
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       763
194 Temperature_Celsius                                              0x0022   122   101   000    Old_age   Always       -       30
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     61235         -
# 2  Short offline       Completed without error       00%     61225         -
# 3  Short offline       Completed without error       00%     58394         -
# 4  Extended offline    Completed without error       00%     55857         -
# 5  Short offline       Completed without error       00%     55847         -
# 6  Conveyance offline  Completed without error       00%     55700         -
# 7  Conveyance offline  Completed without error       00%     55700         -
# 8  Extended offline    Interrupted (host reset)      90%     55698         -
# 9  Extended offline    Interrupted (host reset)      90%     55697         -
#10  Extended offline    Interrupted (host reset)      90%     55697         -
#11  Short offline       Completed without error       00%     55697         -
#12  Short offline       Completed without error       00%     55139         -
#13  Short offline       Completed without error       00%     54514         -
#14  Short offline       Completed without error       00%     54397         -
#15  Extended offline    Completed without error       00%     54049         -
#16  Short offline       Completed without error       00%     53678         -
#17  Short offline       Completed without error       00%     52937         -
#18  Short offline       Completed without error       00%     52219         -
#19  Short offline       Completed without error       00%     51476         -
#20  Short offline       Completed without error       00%     50781         -
#21  Short offline       Completed without error       00%     50039         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

@EVOTk Toi qui sait bien interpréter les données smart, qu'en penses-tu ?
Il est vieux, mais peut tenir le coup dans une grappe RAID ? (SHR, donc = raid5) Ou mieux vaut éviter ?
Je vais le sortir et faire un test étendu sur le plus récent mais qui a eu des secteurs défectueux pour voir...
 
Ok, ce sera peut-être ce vieux disque que j'utiliserais ^^

Car l'autre, moins vieux, mais pas de beaucoup est affiché comme ça dans DSM :
1677749950881.png 1677750002636.png

Les test Ironwolf est OK ce matin, le test SMART étendu est encore en cours.
Mais du coup, s'il est qualité de "En panne" à l'issu de ce test étendu, le choix sera vite fait ^^
Remarque, pour la différence de durée de fonctionnement... 14044 h ≈ 1,6 année...

J'aviserai à la fin du test avec les données SMART actualisées.
 
@EVOTk
Le test étendu est fini :
1677771472146.png 1677771529129.png
Code:
smartctl 6.5 (build date Oct  7 2021) [x86_64-linux-4.4.180+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate IronWolf
Device Model:     ST4000VN008-2DR166
Serial Number:    xxxxxxxxxxxx
LU WWN Device Id: 5 000c50 0a3e5be3f
Firmware Version: SC60
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Mar  2 16:41:29 2023 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (  591) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   1) minutes.
Extended self-test routine
recommended polling time:      ( 642) minutes.
Conveyance self-test routine
recommended polling time:      (   2) minutes.
SCT capabilities:            (0x50bd)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000f   076   064   044    Pre-fail  Always       -       36435418
  3 Spin_Up_Time                                                     0x0003   094   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count                                                 0x0032   100   100   020    Old_age   Always       -       424
  5 Reallocated_Sector_Ct                                            0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000f   094   060   045    Pre-fail  Always       -       6993211729
  9 Power_On_Hours                                                   0x0032   047   047   000    Old_age   Always       -       47197 (47 118 0)
 10 Spin_Retry_Count                                                 0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   020    Old_age   Always       -       217
184 End-to-End_Error                                                 0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect                                               0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout                                                  0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes                                                  0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel                                          0x0022   072   054   040    Old_age   Always       -       28 (Min/Max 21/30)
191 G-Sense_Error_Rate                                               0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count                                          0x0032   100   100   000    Old_age   Always       -       175
193 Load_Cycle_Count                                                 0x0032   100   100   000    Old_age   Always       -       542
194 Temperature_Celsius                                              0x0022   028   046   000    Old_age   Always       -       28 (0 16 0 0 0)
197 Current_Pending_Sector                                           0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours                                                0x0000   100   253   000    Old_age   Offline      -       47101h+59m+07.398s
241 Total_LBAs_Written                                               0x0000   100   253   000    Old_age   Offline      -       265800699543
242 Total_LBAs_Read                                                  0x0000   100   253   000    Old_age   Offline      -       274010963523

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     47197         -
# 2  Extended offline    Completed without error       00%     47196         -
# 3  Extended offline    Completed: read failure       90%     47017         56279544
# 4  Short offline       Completed without error       00%     47017         -
# 5  Extended offline    Completed without error       00%     46533         -
# 6  Short offline       Completed without error       00%     46491         -
# 7  Short offline       Completed without error       00%     45771         -
# 8  Short offline       Completed without error       00%     45026         -
# 9  Extended offline    Completed without error       00%     44368         -
#10  Short offline       Completed without error       00%     44306         -
#11  Short offline       Completed without error       00%     43562         -
#12  Short offline       Completed without error       00%     42818         -
#13  Extended offline    Interrupted (host reset)      00%     42140         -
#14  Short offline       Completed without error       00%     42098         -
#15  Short offline       Completed without error       00%     41354         -
#16  Short offline       Completed without error       00%     40634         -
#17  Extended offline    Completed without error       00%     39938         -
#18  Short offline       Completed without error       00%     39891         -
#19  Short offline       Completed without error       00%     39219         -
#20  Short offline       Completed without error       00%     38475         -
#21  Extended offline    Completed without error       00%     37784         -
1 of 1 failed self-tests are outdated by newer successful extended offline self-test # 2

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Verdict ? Mieux vaut privilégier le vieux disque WD Red ?
 
Finalement, je vais opter pour en faire un volume dédié à TimeMachine et à Active Backup for Business.
J'ai encore un peu plus d'1To de libre sur le volume actuellement en SHR.