Aller au contenu
OpenTrain AI
Intégrations de stack de données

Apportez votre stack de données. Nous apportons la main-d'œuvre d'étiquetage.

OpenTrain est neutre vis-à-vis des outils. Continuez à utiliser la plateforme d'annotation, les outils d'évaluation, le warehouse, le vector store et les applications internes de révision que vous exploitez déjà, et recrutez des entraîneurs d'IA et des étiqueteurs de données évalués parmi un réseau de 191,000+ pour travailler au sein de cette stack. Tarifs publiés : 15 % en self-service, 20 % en service géré.

Le modèle d'intégration

OpenTrain est une marketplace et une couche de matching, pas un autre outil dans votre stack

Le travail d'annotation, d'évaluation et d'étiquetage de votre programme d'IA s'effectue déjà dans des outils spécifiques : une plateforme d'annotation, un framework d'évaluation, une vue de warehouse, un tableau de bord vectoriel ou une application interne de révision que votre équipe a construite. Remplacer ces outils est rarement le goulot d'étranglement.

La difficulté est de trouver constamment des personnes qualifiées capables d'intégrer cette stack et de fournir un travail à fort signal. OpenTrain est la marketplace et la couche de matching pour ces personnes. Nous coordonnons le recrutement, les paiements et la logistique du programme ; le travail s'effectue dans les outils que vous exploitez déjà.

Comment les entraîneurs se connectent à votre stack

Exemples d'outils et de surfaces où travaillent les talents d'OpenTrain

Ces catégories sont illustratives : les talents d'OpenTrain peuvent travailler sur n'importe quel outil que votre équipe exploite déjà, y compris des plateformes non listées ici. Chaque carte décrit le modèle d'intégration au niveau de la catégorie ; les outils présentés sont représentatifs, et non des recommandations.

Plateformes d'annotation et d'étiquetage

Recrutez des entraîneurs directement dans l'outil d'annotation que vous utilisez déjà

Conservez vos projets, ontologies et flux de révision sur la plateforme d'annotation en laquelle vous avez déjà confiance. OpenTrain vous met en relation avec des entraîneurs évalués ayant une expérience pratique sur des outils tels que Labelbox, SuperAnnotate, V7, CVAT, Encord et Label Studio. Nous gérons le sourcing, le screening, les paiements et la communication quotidienne ; vous invitez l'équipe recrutée dans votre workspace et conservez chaque projet, dataset et étiquette produite.

Plateformes représentatives

  • Labelbox
  • SuperAnnotate
  • V7 Darwin
  • CVAT
  • Encord
  • Label Studio

Outils d'évaluation LLM

Connectez des évaluateurs au framework que vous exécutez déjà

Pour l'évaluation de LLM, la révision des réponses et les données de préférence, OpenTrain vous connecte avec des évaluateurs qui travaillent directement dans Braintrust, HumanLoop, LangSmith, OpenAI Evals ou votre propre interface utilisateur interne de révision. Nous coordonnons l'évaluation, la calibration, les paiements et la communication du programme ; vos prompts, traces, exécutions d'évaluation et sorties du modèle restent dans l'outil que vous utilisez déjà pour le lancement.

Outils représentatifs

  • Braintrust
  • HumanLoop
  • LangSmith
  • OpenAI Evals

Data warehouses et lakehouses

Étiquetez et révisez les données là où elles se trouvent déjà

Lorsque la source de vérité de vos données d'entraînement est un warehouse ou un lakehouse, les entraîneurs d'OpenTrain peuvent travailler sur les vues, tables et notebooks que vous exposez dans Snowflake, BigQuery, Databricks ou des plateformes comparables. OpenTrain fournit les personnes et la structure du flux ; vos données, politiques de gouvernance et contrôles d'accès restent les vôtres.

Plateformes représentatives

  • Snowflake
  • BigQuery
  • Databricks

Vecteurs et récupération

Construisez des datasets de qualité pour le retrieval sans déplacer votre index

Pour les systèmes avec retrieval augmenté, les entraîneurs d'OpenTrain aident à juger la pertinence requête-document, à annoter des chunks et à assembler des ensembles d'évaluation par rapport à votre index existant dans Pinecone, Weaviate ou Qdrant. Vous contrôlez les embeddings, l'index et le pipeline de retrieval en production ; nous apportons des humains expérimentés pour évaluer et curer les données qui l'alimentent.

Plateformes représentatives

  • Pinecone
  • Weaviate
  • Qdrant

Outils internes et général

Connectez des entraîneurs au flux personnalisé que vous avez déjà construit

De nombreuses équipes disposent déjà d'une bonne interface utilisateur interne de révision, d'un pipeline d'étiquetage avec leurs propres API REST, d'un transfert S3 + JSONL ou d'un workflow GitHub Actions. Les entraîneurs d'OpenTrain peuvent se connecter en tant qu'utilisateurs nominatifs, exécuter la charge que vous avez définie et renvoyer les résultats via votre pipeline existant : sans migration, sans replatforming et sans avoir à apprendre un autre tableau de bord de fournisseur.

Formes courantes d'intégration

  • Custom REST APIs
  • S3 + JSONL
  • GitHub Actions
  • Internal review apps
Répartition des responsabilités

Ce que fournit OpenTrain et ce que conserve votre stack

OpenTrain gère

  • Le sourcing, le screening et l'évaluation des entraîneurs d'IA et des étiqueteurs de données
  • Le matching selon vos exigences en matière de compétences, de domaine, de langue et d'outils
  • Les paiements, la facturation et la documentation fiscale/compliance pour les talents
  • La communication avec la main-d'œuvre, la planification et la coordination du programme
  • Les program leads, la QA et les rapports optionnels pour le service géré

Votre stack conserve

  • Vos outils d'annotation, d'évaluation, de warehouse et de retrieval
  • Vos données, embeddings, traces et sorties étiquetées
  • La propriété intellectuelle de chaque annotation, jugement et dataset produit
  • Les contrôles d'accès, les journaux d'audit et la posture de sécurité
  • Les instructions d'étiquetage, l'ontologie et le workspace que vous exploitez

Voir les solutions associées :  services d'étiquetage de donnéesmarketplace d'externalisation de l'étiquetage de donnéesévaluation de LLMRLHF et données de préférence, et  service géré.

FAQ de stack de données

Questions courantes sur le modèle d'intégration

Comment fonctionne le recrutement neutre vis-à-vis des outils avec OpenTrain, ce qui reste dans votre stack et comment commencer.

Apportez votre stack de données ; nous apportons la main-d'œuvre

Publiez un projet en self-service ou parlez à un responsable des services gérés pour exécuter l'ensemble du programme sur vos outils existants.

Libre-service

Publiez une offre, recrutez des experts sur n'importe quelle plateforme

Décrivez vos besoins et recevez une présélection d'experts du domaine adaptés à votre projet. Commission fixe de 15%, sans frais cachés.

Le plus populaire
Service géré

Service complet, de bout en bout

  • Recrutement & évaluation en direct
  • Intégration et formation
  • Gestion quotidienne & QA
  • Responsable de programme dédié