OMV7 Problème de SSD avec OMV et proxmox

  • Vague de SPAM

    Suite à une vague de spam sur le forum, les inscriptions sont temporairement limitées.

    Après votre inscription, un membre de l'équipe devra valider votre compte avant qu'il ne soit activé. Nous sommes désolés pour la gêne occasionnée et vous remercions de votre patience.

Spttr

Nouveau membre
29 Décembre 2025
4
0
1
Bonjour à tous,
Totalement débutant dans le domaine des NAS, j’ai voulu mettre les mains dans le camboui pour me faire un simili NAS maison.

A savoir que je n’ai jamais touché à des outils de virtualisations, à des outils de NAS ni a l’environnement Linux. Un vrai débutant.

Pour se faire, j’ai acheté un mini-PC et ait deux disques SSD :
  • SSD 1To pour y installer proxmox et y mettre le stockage des machines virtuelles
  • SSD 2To pour le stockage de mes données
Les deux disques sont neufs.

*****​

Voici un résumé de mon problème

Grace à l’aide d’un collègue et de chatGPT, l’installation de proxmox est nickel. J’ai ensuite créé une VM avec OpenMediaVault et, après 3 tentatives, j’ai réussi à avoir le NAS fonctionnel et ai pu y ajouter 600Go de données.

Tout semblait fonctionner plutôt bien jusqu’à ce que je veuille calculer la consommation électrique de l’installation. J’ai donc branché une prise connectée directement en amont de l’alimentation du mini-PC.

A partir de là, en voulant démarrer la VM OpenMediaVault, j’ai commencé à avoir des messages d’erreurs de ce type (photo de la console de la VM):

207c8bf5-623f-418d-9da5-b7747b4eb42d.png

Après quelques manips avec l’aide de chatGPT, dont le fait d’enlever définitivement la prise connectée, j’ai eu aussi cela :

329b43cc-65d2-40f0-9e0e-b511b8f2b1cb.png

Après avoir lancé, entre autre, la commande « fsck.ext4 -f -y /dev/sda1 » (donnée par chatGPT), il s’est avéré que quelques fichiers photos étaient incriminés.

Je les ai supprimées puis ai redémarré plusieurs fois la VM ensuite. Il n’y avait plus de messages d’erreurs et tout fonctionnait correctement (lecture/écriture sur le NAS)

*****​

Aujourd’hui, en redémarrant la VM (j’éteins complètement le mini-PC lorsque je n’ai pas besoin de sauvegarder), j’ai vu dans le boot d’OMV qu’il y avait deux erreurs « I/O error » mais c’est allé trop vite et je n’ai pas pu les analyser. J’ai éteint puis redémarré la VM et plus d’erreurs.

En investiguant j’ai eu ceci :

Avec la commande « smartctl -a /dev/sda1 » j'obtiens ceci :

Code:
smartctl 7.4 2024-10-15 r5620 [x86_64-linux-6.17.4-1-pve] (local build)
Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     PNY 2TB SATA SSD
Serial Number:    PNB44252029710600320
Firmware Version: Y0210A0
User Capacity:    2,048,408,248,320 bytes [2.04 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
TRIM Command:     Available
Device is:        Not in smartctl database 7.3/5528
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Dec 29 11:36:56 2025 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (  120) seconds.
Offline data collection
capabilities:                    (0x11) SMART execute Offline immediate.
                                        No Auto Offline data collection support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        No Selective Self-test supported.
SMART capabilities:            (0x0002) Does not save SMART data before
                                        entering power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  10) minutes.
SCT capabilities:              (0x0001) SCT Status supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   100   100   050    Old_age   Always       -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   050    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   050    Old_age   Always       -       21
 12 Power_Cycle_Count       0x0032   100   100   050    Old_age   Always       -       25
160 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       0
161 Unknown_Attribute       0x0033   100   100   050    Pre-fail  Always       -       53
163 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       40
164 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1180
165 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       2
166 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1
167 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1
168 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       5050
169 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       100
175 Program_Fail_Count_Chip 0x0032   100   100   050    Old_age   Always       -       0
176 Erase_Fail_Count_Chip   0x0032   100   100   050    Old_age   Always       -       0
177 Wear_Leveling_Count     0x0032   100   100   050    Old_age   Always       -       0
178 Used_Rsvd_Blk_Cnt_Chip  0x0032   100   100   050    Old_age   Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   050    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   050    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   050    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   100   100   050    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x0032   100   100   050    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   050    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0032   100   100   050    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   050    Old_age   Always       -       0
232 Available_Reservd_Space 0x0032   100   100   050    Old_age   Always       -       53
241 Total_LBAs_Written      0x0030   100   100   050    Old_age   Offline      -       24623
242 Total_LBAs_Read         0x0030   100   100   050    Old_age   Offline      -       419
245 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       22933

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

Selective Self-tests/Logging not supported

The above only provides legacy SMART information - try 'smartctl -x' for more

Ici ChatGPT indique que tout semble normal.

Ensuite avec la commande “dd if=/dev/sda1 of=/dev/null bs=4M status=progress” j'obtiens ceci :

Code:
root@proxmox:~# dd if=/dev/sda1 of=/dev/null bs=4M status=progress
12725518336 bytes (13 GB, 12 GiB) copied, 32 s, 398 MB/s
dd: error reading '/dev/sda1': Input/output error
3072+1 records in
3072+1 records out
12886999040 bytes (13 GB, 12 GiB) copied, 33.2893 s, 387 MB/s

Ici par contre, chatGPT me dis que c’est pas normal d’avoir ça et en gros que le disque est en mauvaise santé.

Dans le même temps, en retournant sur la console de la VM d'OMV, j'ai vu ceci :

bf5cc8df-aafa-44f6-ba46-67381c4e0b90.png

Un nouveau message d'erreur donc.

Avec la commande "fsck.ext4 -n /dev/sda1", j’obtiens ceci :

Code:
root@proxmox:~# fsck.ext4 -n /dev/sda1
e2fsck 1.47.2 (1-Jan-2025)
/dev/sda1 contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
[QUOTA WARNING] Usage inconsistent for ID 1000:actual (699615088640, 41995) != expected (699615088640, 41998)
Update quota info for quota type 0? no

[QUOTA WARNING] Usage inconsistent for ID 100:actual (699644563456, 41997) != expected (699644563456, 41999)
[QUOTA WARNING] Usage inconsistent for ID 1124:actual (0, 0) != expected (0, 1)
Update quota info for quota type 1? no


/dev/sda1: ********** WARNING: Filesystem still has errors **********

/dev/sda1: 42009/125026304 files (26.8% non-contiguous), 178943013/500099409 blocks

Et là, chatGPT me recommande de changer le disque...

****
Actuellement le NAS reste fonctionnel, je peux y accéder et lire les fichiers. Cependant, je n’aime pas avoir ce genre d’erreurs.
Comme je n’y connais rien, je voudrais savoir comment ne plus avoir ces erreurs.
Est-ce que le SSD est mort ? Est-ce que je devrais tout recommencer de 0 pour refaire une installation propre ? Est-ce que je peux régler le problème sans recommencer de 0 ?

S’il vous faut des infos supplémentaires ou bien qu’on reprenne du début les investigations, n’hésitez pas
 
Est-ce que le SSD est mort ? Est-ce que je devrais tout recommencer de 0 pour refaire une installation propre ? Est-ce que je peux régler le problème sans recommencer de 0 ?
Le SMART semble bon, peut etre dans un 1er temps essayé de changer le cable SATA ?
 
D'accord je vais voir ce que je peux faire, c'est une sorte de fine nappe électrique qui relie le SSD à la carte mère