Quelle architecture d’IA ?

Après la première étape publiée la semaine dernière pour déterminer votre cas d’utilisation, la suivante consiste à déterminer la stratégie que vous utiliserez pour atteindre vos objectifs.

1. Détermination du cas d’usage

En fonction de votre cas d’utilisation, vous devez déterminer la stratégie appropriée. Voici quelques questions pour vous guider (ce n’est qu’un petit échantillon des nombreuses questions possibles) :

Partons-nous from scratch ou dans un environnement existant (c’est-à-dire qu’il y a déjà une pile en place) ?
Le modèle doit-il posséder des connaissances approfondies dans le domaine d’expertise ?
Quel type de données est utilisé (entrée/sortie) ?
Le modèle utilise-t-il des données en streaming ?
Le LLM nécessitera-t-il une intervention logicielle ?
Les informations en sortie sont-elles dynamiques ?
Quelles sont les exigences de performance (latence, débit) ?
Y a-t-il des considérations réglementaires ou de conformité spécifiques ? Le modèle traite-t-il des données confidentielles ?
Quel est le niveau d’intelligibilité et d’explicabilité requis ?
Quelles sont les exigences en matière d’évolutivité ?
Y a-t-il des contraintes sur les ressources de calcul (par exemple, CPU, GPU) ?

2. Stratégies de Deep Learning

Vous pouvez déterminer votre stratégie de deep learning. Voici un tableau avec certains modèles que nous avons créés et d’autres qui sont actuellement en cours de développement.

Prompt engineering permet d’optimiser l’environnement actuel (pile existante avec frontend et backend) ou d’augmenter la précision et la vitesse de votre modèle en créant des invites dynamiques. RAG ou GraphRAG est utilisé si vous avez des données en streaming et/ou des données constamment mises à jour à prendre en compte.
Le Fine-tuning consiste à adapter le modèle pour comprendre les spécificités de votre environnement. Cela permettra au modèle de mieux traiter vos données. DPO (Direct Preference Optimization) est destiné à améliorer les capacités de raisonnement.
La Computer vision traite tout ce qui implique des images. Une vidéo est essentiellement une séquence de plusieurs images.
RNN (Recurrent Neural Network) est utilisé pour les données de séries chronologiques.

Avis de non-responsabilité : Les descriptions ci-dessus sont simplifiées et la mise en œuvre réelle et les nuances de chaque technique peuvent être plus complexes.