Vector Database
Une vector database (base vectorielle) est une base de données spécialisée dans le stockage et la recherche efficace de vecteurs de grande dimension (embeddings), via des algorithmes de recherche approchée du plus proch…
Une vector database (base vectorielle) est une base de données spécialisée dans le stockage et la recherche efficace de vecteurs de grande dimension ([embeddings](/ressources/glossaire-de-la-tech/embeddings)), via des algorithmes de recherche approchée du plus proche voisin (ANN) comme HNSW, IVF ou DiskANN.
Elles sont la brique de stockage des architectures RAG : on y indexe les embeddings de tous les chunks d'un corpus, puis on récupère en quelques millisecondes les chunks les plus proches sémantiquement d'une question donnée, même sur des bases de plusieurs millions de vecteurs.
Les solutions de référence sont Pinecone, Qdrant, Weaviate, Milvus, Chroma (open source), Turbopuffer, ainsi que les extensions des bases existantes : pgvector pour PostgreSQL, Atlas Vector Search pour MongoDB, Elasticsearch et OpenSearch.
