Equipa: Data Science
Nível: Mid-level
Escritórios: Lisboa, Braga
Na Xpand IT, a equipa de Data Science dedica-se a transformar dados em soluções de impacto através de modelação avançada e algoritmos líderes de mercado. Trabalhamos em problemas complexos, desde a otimização e previsão até sistemas de recomendação, garantindo soluções escaláveis, robustas, e utilizadas em contexto real. O nosso trabalho vai além da criação de modelos: envolve construção de pipelines, integração com sistemas existentes e contacto com equipas de engenharia e de negócio.
Principais responsabilidades
Como Data Scientist, irás participar em projetos E2E, desde a recolha e tratamento de dados brutos até à implementação de modelos em produção. Terás também uma forte componente de investigação, sendo responsável por explorar o mercado e novas tecnologias. O teu foco será:
Desenvolver e treinar modelos preditivos, sistemas de recomendação e algoritmos de Machine Learning;
Liderar iniciativas de R&D, realizando pesquisa e desenvolvendo PoCs para testar novas tecnologias e abordagens (ex: GenAI e LLMs);
Construir e manter pipelines de dados e machine learning (batch e near real-time) e avaliar trade-offs entre performance, custo e complexidade;
Garantir todo o ciclo de vida do projeto: extração, preparação, manipulação e otimização de modelos;
Colaborar com equipas de engenharia e de negócio para traduzir problemas reais em soluções de dados.
Stacks:
Linguagem principal: Python (Pandas, NumPy, Scikit-learn);
Deep learning: TensorFlow, Keras, PyTorch;
Data & ML: PySpark, MLflow, Airflow, Azure ML;
GenAI: LLMs, Llama;
Cloud: Azure, Google Cloud ou AWS;
Exploração: SQL e ferramentas de visualização de dados.
Requisitos
Formação académica
Licenciatura ou Mestrado em Engenharia Informática, Matemática, Ciência de Dados ou áreas similares.
Experiência em Data Science
Experiência sólida (mínimo 1 ano) no desenvolvimento e treino de modelos de Machine Learning e algoritmos de Data Mining.
Domínio de Python
Proficiência no ecossistema Python voltado para dados e matemática (NumPy, SciPy, Pandas, Scikit-learn).
Projeto E2E
Experiência prática em todas as fases de um projeto de dados, incluindo a preparação de dados brutos e manipulação de bases de dados (SQL).
Pesquisa & Experimentação
Capacidade de realizar investigação técnica, criar provas de conceito (PoCs) e avaliar novas ferramentas ou frameworks.
Idiomas
Fluência obrigatória em Português e Inglês (escrito e falado).
Pontos extra:
Experiência prática com GenAI, LLMs e técnicas de Prompt Engineering;
Sólidos conhecimentos de estatística (regressões, distribuições e testes de normalidade);
Experiência com serviços de IA em ambientes de Cloud pública (Azure, Google Cloud ou AWS);
Gosto pela partilha de conhecimento técnico e acompanhamento das tendências de mercado.