Formation - Infini Software
Infini Software - Organisme de formation en informatique
Maintenez vos compétences à jour grâce à nos formations
Rechercher
☎ 06 63 33 14 06 Espace client



Cursus « Deep Learning & IA » :
Déployer un LLM en local dans l'entreprise

Détails :

Durée :
1 Jour
Prérequis :
Bonne connaissance du langage Python, des concepts de Machine Learning et des bases en gestion de serveurs Linux.
Public :
Développeurs IA, ingénieurs Machine Learning, responsables IT, administrateurs système.
Objectifs :
Cette formation vous permettra de maîtriser le déploiement d'un modèle de langage de grande taille (LLM) en environnement local. Vous apprendrez à configurer, intégrer et optimiser les LLMs pour un usage sécurisé et performant au sein de votre entreprise.

Au terme de cette formation, vous saurez :
  • Comprendre les principes de fonctionnement des LLMs et leurs cas d'usage.
  • Installer et configurer un modèle en local.
  • Optimiser les performances du modèle pour un déploiement efficace.
  • Assurer la sécurité et la confidentialité des données utilisées.

Demande de devis :

Devis :
Si vous souhaitez être contacté et obtenir plus d'informations sur cette formation veuillez remplir notre formulaire de mise en relation.

Cursus de formation :

Cursus :




Programme détaillé de la formation :

    Introduction aux LLMs et à leur déploiement
    • Qu'est-ce qu'un LLM ? Concepts et architecture
    • Les avantages du déploiement local
    • Exemples de modèles : GPT, LLaMA, Falcon
    • Choisir le bon modèle selon les besoins
    • Contraintes matérielles et exigences techniques
    Installation et configuration de l'environnement
    • Préparer le matériel (GPU, RAM, stockage)
    • Installer Python, CUDA, et les bibliothèques nécessaires
    • Utilisation de frameworks : TensorFlow, PyTorch, Hugging Face
    • Utilisation de logiciels Jan.ai ou Ollama
    • Téléchargement et initialisation d'un modèle pré-entraîné
    • Vérification du bon fonctionnement
    Optimisation des performances et gestion des ressources
    • Quantization et pruning pour réduire la taille des modèles
    • Utilisation de modèles quantifiés (int8, float16)
    • Scalabilité et parallélisation sur plusieurs GPUs
    • Gestion de la mémoire et optimisation du temps d'inférence
    • Surveillance des ressources système (CPU, GPU, RAM)
    Intégration dans l'écosystème d'entreprise
    • Ajout d'une interface graphique de type ChatBot
    • Création d'une API REST avec FastAPI ou Flask
    • Authentification et gestion des accès utilisateurs
    • Interaction avec des bases de données et des applications métiers
    • Chiffrement des échanges
Déclaration d'activité enregistrée sous le n° 93 06 11543 06 du préfet de région de Provence-Alpes-Côte d'Azur.