Plongement (Embedding)
Un plongement (embedding) est la représentation numérique sous forme de vecteur d'un fragment de texte, d'image ou d'audio, qui permet de mesurer la similarité sémantique comme proximité géométrique.
Les plongements sont le socle des systèmes RAG, de la recherche sémantique, de la classification et des systèmes de recommandation. Dimensions typiques : 384, 768, 1536, 3072. Modèles : Sentence-Transformers (open source) ou API d'embedding commerciales. Le stockage s'effectue dans des bases vectorielles (pgvector, FAISS, Milvus, Qdrant, Weaviate).
Confidentialité : les plongements bruts peuvent souvent reconstruire le texte d'origine (Embedding Inversion). Nous traitons donc les plongements comme données personnelles et les stockons en résidence UE conforme. Le chiffrement au repos et en transit est obligatoire.