NAS performant sous Windows 11 permettant d'héberger une IA performante pour des recherches privées ?

sypqys

Maître Jedi
Membre Confirmé
9 Mai 2017
871
32
78
Aude (11)
pattos1166.blogspot.com
Professionnel
Non
Bonjour


Je penche pour le "UGREEN NASync DXP2800" mais pas assez puissant pour ça...

Des idées de NAS ?

Quelle IA choisir (Mistral, Llama) ?

Surtout pour ça et pour Immich (remplacer Amazon Photos)... ?
Vaulwarden à la rigueur... Mais bon...


Merci !
 
Bonjour,

Des idées de NAS ?

Apparemment pour avoir des résultats avec une performance correcte avec l'IA, il faut un matériel doté d'un CPU et d'une CG adaptés (pas vraiment connaisseur, juste fais qques tests).
Concernant les NAS commerciaux le iDX6011Pro Ugreen semble taillé pour ... (commercialisation en cours pour la France - résa sur

Immich (remplacer Amazon Photos)... ?
Vaulwarden à la rigueur...
En Docker, je suppose tes apps ? Pourquoi sur Windows 11 ???
 
  • J'aime
Réactions: sypqys
Bonjour,



Apparemment pour avoir des résultats avec une performance correcte avec l'IA, il faut un matériel doté d'un CPU et d'une CG adaptés (pas vraiment connaisseur, juste fais qques tests).
Concernant les NAS commerciaux le iDX6011Pro Ugreen semble taillé pour ... (commercialisation en cours pour la France - résa sur


En Docker, je suppose tes apps ? Pourquoi sur Windows 11 ???
Merci beaucoup !


Je pense en Docker, oui.

Car mon PC est sur Windows 11. Après peu importe l'OS du NAS tant que c'est compatible avec Win 11 Pro.
 
Hello,

un NAS qui fera tourner sans probleme un agent IA c'est pas donné.
Tu as par exemple celui la a 36TOPS (Sachant que un PC doit pouvoir faire 40TOPS pour etre certifié "Copilot PC")

Sinon a voir si tu as un pc sous linux et tu ajoute ca : https://www.coral.ai/products/accelerator/
@MilesTEG en a un je crois, ca fonctionne avec un NAS ?
 
  • J'aime
Réactions: sypqys
Je ne suis pas sûr que le nas sera à 2400€ mais on verra bien.
 
C'est hors de mon budget.
Donc je pense ne pas faire tourner d'IA mais uniquement immich etc. Sur un ugreen NASync DXP2800... Projet pas sûr qu'il voit le jour ...
C'est loin d'être prioritaire.
 
La solution se trouve sur coté de Minisforum. Mais elle n'est pas bon marché. Ceci dit vu le prix de RAM actuellement, il n' y a rien de bon marché.

Tu as le N5 pro qui commence 659 € et en fonction de la RAM et du processeur finit à 1845 €. Le plus gros processeur est équipé d'un NPU 80 Tops.

La machine Ultime pour l'IA, conçue spécifiquement pour faire de l'IA locale avec openClaw installé en natif: le N5 max 64 Go 2700 € (version 128 Go : 4200 €) équipée de mémoire à haute bande passante LPDDR5X avec AMD Ryzen™ AI Max+ 395,16C/32T Radeon™ 8060S 126 Tops. Testé déjà pour faire fonctionner sur la version 64 Go du QWEN 35B, GEMMA 31B, GPTOSS 20B.
 
La solution se trouve sur coté de Minisforum.
ahhhh direct y'a que ça 🤣

je sais pas mais quand on parle de NAS à plus de 4000€ c'est au moins que tu l'a testé, voir acheté, et pas que lu les "information commerciales" ??

et accessoirement tu pourrais être plus clair car c'est quoi "version 64 Go du QWEN 35B, GEMMA 31B, GPTOSS 20B." :unsure:

désolé mais je ne parle pas IA :censored:
 
re,

des modèles de quoi, d'IA ??

si c'est ça a quoi servent ces modèles, différents types qui ont chacun leurs spécificités, et lesquels ...

ça serait bien que Freegate explique de lui même car il a l'air de connaitre !

Dominique
 
  • J'aime
Réactions: cadkey
Aucun problème pour expliquer dans ce thread à quoi correspondent QWEN 35B, GEMMA 31B, GPTOSS 20B, même si la demande initiale incite à plus parler hardware que de software.

@sypqys a demandé un hardware pour faire tourner de l'IA locale afin d'analyser je suppose des documents confidentiels et privés. Car en effet le premier intérêt de faire tourner de l'IA (c'est un abus de langage, il faut plutôt parler de modèle de langage LLM), c'est éviter d'avoir à utiliser les LLM cloud comme ChatGPT, Gemini, Claude, etc. Tu ne sais ce qu'ils font de tes données et plus ça peut revenir très cher en matière de crédit token, de ressources API, abonnement mensuel, etc.

Le saint-Gral est donc de faire tourner à l'instar des LLM cloud, ton propre modèle sur ta propre infrastructure. En substance, La demande initiale de @sypqys est qu'on l'aiguille sur un hardware, qui fait également NAS, susceptible de faire tourner ses modèles de langage LLM que l'on peut retrouver en OpenSource facilement sur le net. Accessibles ici : https://ollama.com/library

En consultant le lien tu y trouves les noms que j'ai cités : Qwen, Gemma, Gpt-oss, etc.

Le hic est que pour faire tourner un LLM en local dans des conditions de performance et de temps de traitement et de réponse équivalent à LLM Cloud (Gemini, ChatGPT,Claude) il faut énormément de ressources, des types de RAM spécifique (VRAM), un processeur spécifique, beaucoup d'espace de stockage, un GPU spécifique (si on fait du machine learning). Les machines pour faire tourner ça, coutent généralement entre 15k€ à 50k€. Donc 4000 € c'est du pipi de chat.

Comme peu de personnes sur terre ont le budget suffisant pour cela, les modèles LLM Opensource sont téléchargeables avec des niveaux de paramètres réduits afin qu'ils puissent être exécutés sur du matériel plus modeste. Quand je parle de QWEN 35B, GEMMA 31B, GPTOSS 20B, cela correspond à des LLM avec des niveau de paramètre certifiés comme pouvant être exécuté par le N5 max dans sa version 64 Go. Plus le chiffre avant le "B" est important, plus le LLM demande la RAM à bande passante rapide (VRAM ou LPDDR5X) pour tourner correctement avec des délais de réponse acceptable.

Il faut aussi que la machine aient un NPU le plus performant possible. Suivant les gammes, le N5 propose un NPU allant de 50 TOPS à 126TOPS.

Je parle en connaissance de cause, j'ai acquis récemment le N5 pro avec 96 G0 de ram ECC (ce n'est pas du LPDDR5X) et un NPU de 80 TOPS. Ca me permet de faire tourner avec plus ou moins de réussite des petits modèles à 20B de paramètre. Donc je n'ai pas lu que "les informations commerciales". ;)

Le N5 MAX a été spécialement conçu pour faire tourner des LLM en local, et Minisforum installe nativement un agent IA openclaw. Sa ram est LPDDR5x et son processeur est un AMD 365+Max STRIX HALO 126 TOPS conçu pour accélérer la génération de token. Accessoirement il fait NAS aussi ;).

La version à 4200 boules peut théoriquement faire tourner des LLM 64B avec des délais acceptables. Plus besoin de mettre entre 10 k€ et 20 k€ pour avoir le même niveau de performance. 4000 € c'est cher mais ça démocratise l'IA en local.

@augerd, pour ta culture générale, je t'invite à lire le lien suivant : https://blent.ai/blog/a/ollama-llm

Maintenant j'ai compris que @sypqys n'a pas le budget pour investir dans un NAS IA à 4000 €. C'est pour ça que j'ai étendu mon propos au NAS N5 pro dans sa version de base au pris de 659 €. Il y en a pour tous les budgets, mais qu'il ne s'attende pas à ce prix là, à exécuter des LLM 8B dans des conditions satisfaisantes.

Parler de LLM en local sans parler de nombre de paramètre (...B) n'a finalement aucune sens.
 
ahhh ouais quand même :eek: ... merci @freegate pour ces explications claires et compréhensibles 👏👏

je n'ai aucune utilité de ce genre de machine hyper spécialisée, mais grâce à toi je commence à comprendre l’intérêt de la puissance demandée VS des applis l'utilisant (y)

les 4000€ sont tout à fait justifié dans ses conditions, ça en est "abordable" et comme tu le dit avec humour "Accessoirement il fait NAS aussi" 😁

alors encore merci ;)

Dominique