Pular para o conteúdo principal
MeuHome
Voltar para vagas
NovaFonte oficial🔀 HíbridaCLT

ENGENHEIRO DE DADOS PL

Stefanini·Brasília, Distrito Federal·Publicada há 6 dias

Você vai direto pra vaga — sem criar conta aqui.

Verificada em 19/05/2026 · Clique e candidate-se.

Sobre a vaga

Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.Ao se juntar à Stefanini, você se torna parte de uma jornada global de trans

formação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!Junte-se a nós e seja parte da mudança!Modelo de trabalho- Híbrido - DF#LI-AA2

Responsabilidades e atribuiçõesBuscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.

Responsabilidades:Atuar no desenvolvimento de pipelines de ingestão, trans

formação e enriquecimento de dados para uso em IATrabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)Implementar processos de chunking, embeddings e indexação vetorialConstruir e manter datasets voltados à matriz de conhecimento corporativaDesenvolver pipelines utilizando Databricks (Spark / PySpark)Atuar com arquitetura medalhão (bronze, prata e ouro)Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)Garantir performance, escalabilidade e confiabilidade dos pipelinesAplicar boas práticas de qualidade de dados (completude, consistência e versionamento)Implementar políticas de atualização, retenção e expurgo de dadosGarantir rastreabilidade e auditabilidade dos dados utilizados pelos modelosAtuar em conjunto com times de AI/ML na preparação e otimização de dadosApoiar estratégias de recuperação de in

formação (RAG)Otimizar dados para melhorar a relevância e precisão das respostas dos modelos

Requisitos e qualificações

FormaçãoEnsino superior completo em Tecnologia da In

formação, Engenharia, Sistemas de In

formação ou áreas correlatasConhecimentos necessáriosExperiência sólida em engenharia de dadosConhecimento em Python e/ou PySparkExperiência com Databricks e Spark (batch e/ou streaming)Experiência com pipelines de dados (ETL/ELT)Modelagem de dados (Data Lake / Lakehouse)Experiência com dados não estruturados (documentos, textos, etc.)Integração e consumo de APIs

Habilidades técnicasCapacidade de atuar com autonomia na construção de pipelinesConhecimento em arquitetura moderna de dadosExperiência com processamento e preparação de dados para IAAtuação em ambientes complexos com múltiplas integrações

Competências comportamentaisCapacidade analítica e pensamento estruturadoAutonomia e postura investigativaFacilidade para lidar com dados não estruturadosBoa comunicação e colaboração com times multidisciplinares

Requisitos desejáveisExperiência com RAG (Retrieval-Augmented Generation)Conhecimento em embeddings e bancos vetoriaisExperiência com chunking de documentosVivência com LangChain ou frameworks similaresConhecimento em OpenAI, Azure OpenAI ou outros LLMsConhecimento em indexação semântica e busca vetorialExperiência com ingestão de documentos corporativos (PDF, Word, HTML)Vivência com pipelines de dados voltados para IAExperiência em ambientes corporativos complexos ou projetos de grande porteInformações adicionais🍛 Vale-alimentação ou vale-refeição;👨🏼‍🎓 Desconto em cursos, universidades e instituições de idiomas;📚 Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado;🗣 Mentoring;💉 Clube de vantagens para consultas e exames;🏥 Assistência médica;🦷 Assistência odontológica;💰 Clube de vantagens e descontos nos melhores estabelecimentos;🛫 Clube de viagens;🐶 Convênio para pets.

Receba vagas de Dados e BI como esta por e-mail

Grátis. Cancele quando quiser.

Candidatar-se no site oficial