⬅️ Retour à la page d'accueil

Dans ce chapitre nous allons parler du “choix du modèle”.

Capture_d_écran_2025-01-26_173740-removebg-preview.png

Lorsqu’on doit choisir un modèle IA, on essaye au début de benchmarker et trouver le meilleur modèle qui va correspondre à la fois pour votre entreprise et les clients. Voici les différents critères ci-dessous.

Les critères importants du choix du modèle…

…utiles pour votre entreprise🏢

image__2_-removebg-preview.png

…utiles pour vos utilisateurs👪

<aside>

Un tableau pour tester et comparer différents modèles IA 🧑‍🔬


Afin de faciliter votre benchmark de différents modèles, vous pouvez vous servir de ce modèle de tableau ci-dessous afin de noter pour chaque critère un score et vous rendre compte au global celui qui en ressort comme la meilleure option :

Modèle IA 🤖 Efficacité de la solution 💯 Temps de génération output Fonctionnalités 🦾 Facilité de prise en main ⚙️ ****(doc technique, etc) Cout 💸 Réputation fournisseur 👨‍🎤 Normes légales ⚖️ Protection des données 💽
Modèle IA 1 Vos résultat de tests Vos résultat de tests Fonctionnalités utiles pour le projet actuel + celles pouvant être utiles à l’avenir (Score)/3 €/volume (Score)/3 Détails Détails
Modèle IA 2 Vos résultat de tests Vos résultat de tests Fonctionnalités utiles pour le projet actuel + celles pouvant être utiles à l’avenir (Score)/3 €/volume (Score)/3 Détails Détails
Modèle IA 3 Vos résultat de tests Vos résultat de tests Fonctionnalités utiles pour le projet actuel + celles pouvant être utiles à l’avenir (Score)/3 €/volume (Score)/3 Détails Détails

Conclusion du benchmark :

Selon notre analyse comparative, nous pensons que le modèle X serait un bon choix, car il performe le mieux sur ces critères qui nous intéressent […]

</aside>

image__2_-removebg-preview.png

<aside>

Connaitre quels sont les meilleurs Large Language Models (LLM) du moment 🎯


Avant de commencer votre benchmark, pour identifier les meilleurs modèles LLM actuels ou ceux qui répondent le mieux à vos besoins spécifiques, une excellente ressource est le Chatbot Arena Leaderboard → Cette plateforme classe les modèles selon leurs performances dans divers scénarios d’évaluation. Vous y trouverez des comparaisons basées sur des métriques variées, telles que la précision des réponses, la vitesse, le coût, ou encore leur capacité à gérer des cas complexes.

De plus, elle permet de visualiser les forces et faiblesses de chaque modèle, ce qui peut vous aider à orienter votre choix en fonction de vos cas d’usage spécifiques (génération de texte, calculs mathématiques, synthèse, etc.). Cette approche vous garantit de choisir un modèle adapté à vos besoins, tout en tenant compte des aspects pratiques comme le budget ou la qualité des réponses.

Voici le lien de Chatbot Arena Leaderboard ➡️ **https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard**

image.png

</aside>

image__2_-removebg-preview.png

<aside>

Tester et comparer différents LLMs dans une seule interface 🔍


Pour tester et comparer efficacement plusieurs modèles de langage (LLMs) comme GPT-3.5, GPT-4 ou Claude d’Anthropic, utilisez l’outil AI Playground de Vercel :

➡️ https://sdk.vercel.ai/playground

Il permet de soumettre un même prompt à différents modèles et de visualiser leurs réponses en parallèle. Cela facilite l’évaluation des performances (précision, style, etc.) et de se rendre compte de la facilité de prompt engineering, permettant ainsi de choisir rapidement le modèle le mieux adapté à vos besoins lors de votre benchmark.

image.png

</aside>


Maintenant, voici des exemples ce cas concrets d’entreprises ou un critère en particulier a été important pour leur choix de modèle (toutefois ce n’est pas le seul critère sur lequel ils se sont basés bien entendu)

Voici 3 exemples de cas concrets💡

  1. Efficacité et pertinence (Pennylane) 💯
  2. Avoir un coût optimal (Mirakl) 💸