Embeddings — векторизация текста
Преобразуйте текст в числовые векторы для семантического поиска, кластеризации, рекомендаций и RAG. Эндпоинт полностью совместим с OpenAI Embeddings — те же поля и формат ответа.
| Эндпоинт | POST https://megaapi.ru/v1/embeddings |
|---|---|
| Вход | Строка или массив строк (батч до 2048 элементов) |
| Выход | Массив векторов data[].embedding + usage |
Модели и цены
| Модель | Размерность | Назначение | Цена (с наценкой) |
|---|---|---|---|
text-embedding-3-small | 1536 | Лучшее соотношение цена/качество | $0.030 / 1M токенов |
text-embedding-3-large | 3072 | Высокая точность поиска | $0.195 / 1M токенов |
text-embedding-ada-002 | 1536 | Классическая, совместимость | $0.150 / 1M токенов |
text-embedding-v4 | многоязычная | Сильная на русском и азиатских языках | $0.105 / 1M токенов |
Цены финальные (уже с наценкой). Полный список и тарифы доступны в разделе Модели и цены.
Запрос
POST https://megaapi.ru/v1/embeddings
Authorization: Bearer sk-nexus-...
Content-Type: application/json
{
"model": "text-embedding-3-small",
"input": "Искусственный интеллект меняет мир"
}
Батч (несколько текстов за раз)
{
"model": "text-embedding-3-small",
"input": ["первый текст", "второй текст", "третий текст"]
}
Ответ
{
"object": "list",
"data": [{ "object": "embedding", "index": 0,
"embedding": [-0.0069, 0.0240, -0.0140, ...] }],
"model": "text-embedding-3-small",
"usage": { "prompt_tokens": 5, "total_tokens": 5 }
}
Сценарии
- Семантический поиск: векторизуйте запрос и документы, ранжируйте по косинусной близости.
- RAG: найдите релевантные фрагменты и передайте их в чат-модель как контекст.
- Кластеризация и дедупликация: группируйте близкие по смыслу тексты.
- Рекомендации: подбирайте похожие товары/статьи по описаниям.
Совет: для большинства задач начните с text-embedding-3-small — лучший баланс
цены и качества; переходите на -large при высоких требованиях к точности.