Preparing vectors

In OpenSearch, you can either bring your own vectors or let OpenSearch generate them automatically from your data. Letting OpenSearch automatically generate your embeddings reduces data preprocessing effort at ingestion and search time.

Option 1: Bring your own raw vectors or generated embeddings

You already have pre-computed embeddings or raw vectors from external tools or services.

Ingestion: Ingest pregenerated embeddings directly into OpenSearch.
Search: Perform vector search to find the vectors that are closest to a query vector.

Steps

Working with embeddings generated outside of OpenSearch involves the following steps:

Generate embeddings

Generate embeddings outside of OpenSearch using your favorite embedding utility.

Create an OpenSearch index

Create an OpenSearch index to store your embeddings.

Ingest embeddings

Ingest your embeddings into the index.

Search embeddings

Search your embeddings using vector search.

Getting started with vector search

Use raw vectors or embeddings generated outside of OpenSearch

Option 2: Generate embeddings within OpenSearch

Use this option to let OpenSearch automatically generate vector embeddings from your data using a machine learning (ML) model.

Ingestion: You ingest plain data, and OpenSearch uses an ML model to generate embeddings dynamically.
Search: At query time, OpenSearch uses the same ML model to convert your input data to embeddings, and these embeddings are used for vector search.