Voltar para vagas
NovaFonte oficial🌐 100% RemotaCLT
Científico de Datos
Você vai direto pra vaga — sem criar conta aqui.
Verificada em 19/05/2026 · Clique e candidate-se.
Sobre a vaga
El Científico de Datos especializado en modelos tipo Transformers de texto e imagen será responsable de diseñar, desarrollar, entrenar y optimizar modelos, orientados a resolver problemas de relación e identificación de similitudes entre distintas entidades de texto e imagen, dentro de grandes volúmenes de datos. El rol demanda una comprensión avanzada de técnicas de machine learning y deep learning aplicadas a problemas de emparejamiento y búsqueda semántica, así como la capacidad de traducirrequisitos de negocio en soluciones robustas y escalables.Responsabilidades y atribucionesDiseñar, desarrollar y entrenar modelos de búsqueda semántica para resolver problemas de emparejamiento entre texto e imágenes.Realizar diagnóstico, limpieza y enriquecimiento de datasets para el correcto entrenamiento de modelos. Uso de IA generativa para ayudar en la creación de dichos datasets.Definir las mejores métricas y validaciones para evaluar el rendimiento de los modelos según los objetivos del negocio.Colaborar con equipos de ingeniería de ML para la integración y despliegue de los modelos desarrollados en los procesos productivos.Documentar todo el proceso de desarrollo e investigación para asegurar la reproducibilidad y mantenibilidad de los modelos.Identificar e investigar nuevas técnicas, algoritmos y herramientas para mejorar la precisión y eficiencia de los modelos.Requisitos y calificacionesHabilidades Técnicas Requeridas:Dominio en desarrollo y entrenamiento de modelos de Deep Learning (modelos Transformers de texto e imágenes, en un contexto supervisado y seimi-supervisado).Conocimiento de técnicas de GenAI y prompt engineering son deseables.Amplia experiencia en el manejo de frameworks de machine learning y deep learning como Scikit-learn, PyTorch, XGBoost, Sentence Transformers, Hugging Face, FAISS.Experiencia en el manejo de bases de datos vectoriales (Milvus, Qdrant, Pinecone).Conocimientos sólidos en procesamiento y limpieza de datos, uso de regex y data wrangling con Pandas y Polars. Conocimiento en técnicas avanzadas de feature engineering son deseables.Experiencia práctica en evaluación de modelos supervisados.Competencia en programación en Python y SQL (indispensable); conocimientos adicionales en BigQuery y PySpark son deseables.Experiencia trabajando con grandes volúmenes de datos y optimización de pipelines de modelado.Deseable: experiencia implementando modelos en ambientes cloud (AWS, GCP, Azure).Habilidades Soft Requeridas:Pensamiento analítico y capacidad de abstracción para estructurar soluciones algorítmicas complejas.Comunicación clara y efectiva para presentar hallazgos técnicos a equipos multidisciplinarios.Uso y adaptabilidad de métricas técnicas como KPI's del negocio.Capacidad de trabajar de manera colaborativa con equipos de ciencia de datos, ingeniería de datos, back-end y front-end; así como con stakeholders del negocio.Proactividad, autonomía y orientación a resultados.Adaptabilidad para trabajar en entornos dinámicos y bajo objetivos desafiantes.Informaciones adicionalesBrindar soporte técnico y asesoramiento en temas relacionados con ciencia de datos a equipos internos.
Explorar mais vagas
Vagas relacionadas
Analista SOC N3 (CSIRT)
✨ Nova
Stefanini Latam
há 1 dia · Lima
🔀 Híbrido💼 CLT
Analista Funcional SAP IBP
Stefanini Latam
há 2 dias
🌐 100% Remoto💼 CLT💻 Tecnologia
QA Tester Functional JR - Temporal 3 meses
Stefanini Latam
há 2 dias
🌐 100% Remoto💼 CLT💻 Tecnologia
Desarrollador Frontend
Stefanini Latam
há 2 dias · San Salvador
🔀 Híbrido💼 CLT💻 Tecnologia
