Disponível para oportunidades

Marcos
Silva Data Engineer & AI Specialist

Mais de 20 anos em TI. Arquiteto de soluções em Big Data, Engenharia de Dados e Inteligência Artificial. Experiência em AWS, GCP, Azure — do pipeline ao modelo em produção.

20+
Anos em TI
3
Clouds
50+
Tecnologias
SCROLL

Habilidades & Especialidades

Domínio completo do ciclo de dados: da ingestão à IA em produção.

Cloud & Infraestrutura

Deploy e arquitetura de soluções escaláveis nas principais nuvens do mercado.

AWS GCP Azure Digital Ocean Linux Docker Kubernetes Terraform

Big Data & Engenharia de Dados

Pipelines robustos, ETL e plataformas de dados em escala.

Apache Spark Airflow Hadoop Hive Databricks Kafka Pentaho Talend

IA & Machine Learning

LLMs, NLP, RAG e MLOps — modelos que geram valor real.

LangChain LangGraph HuggingFace PyTorch MLflow RAG NLP DeepEval

Backend & Desenvolvimento

APIs robustas, microsserviços e sistemas de alta disponibilidade.

Python Java Spring Boot PHP Laravel Node.js API REST Scala Go

Infraestrutura Linux & Redes

+10 anos administrando servidores, redes e serviços críticos.

Linux (Red Hat/CentOS/Ubuntu) Samba Squid Proxy Servidor de E-mail (DKIM/SPF) Firewall CI/CD

Dados & Analytics

DBA sênior, modelagem avançada e dashboards gerenciais.

SQL Oracle PL/SQL PostgreSQL MySQL MongoDB Redshift BigQuery Power BI

Experiência Profissional

Mais de 20 anos construindo soluções de tecnologia em empresas nacionais e projetos complexos.

IT Expert
Engenheiro de Inteligência Artificial
jun/2025 – Atual
  • Engenharia de IA Generativa com desenvolvimento de LLMs, NLP e arquiteturas RAG
  • Desenvolvimento de agentes inteligentes e multiagentes com LangChain e LangGraph
  • Práticas LLMOps/MLOps: MLflow, GitHub Actions, DeepEval
  • Pipelines de IA em Azure, AWS e GCP
  • Modelos de difusão, transferência de aprendizado e IA generativa aplicada
LangChainPyTorchHuggingFaceRAGMLflow
UFPR – Universidade Federal do Paraná
Desenvolvedor Java
out/2023 – mai/2025 · 1a 8m
  • Desenvolvimento e manutenção de sistemas corporativos em Java 8 e Java EE
  • APIs REST com Spring Boot e integração com microsserviços
  • Aplicações Vue.js para frontend de sistemas acadêmicos
  • Deploy com Docker e Kubernetes para alta disponibilidade
Java EESpring BootVue.jsDockerKubernetes
Semantix
Tech Lead — Data Science
mar/2022 – fev/2023 · 1 ano
  • Liderança das equipes de Ciência de Dados e Engenharia de Dados
  • Projetos de Big Data: Hadoop, Hive, Spark, Airflow, NiFi
  • Azure: Data Factory, Databricks, Synapse, ML; AWS: S3, Glue, Athena, Redshift, SageMaker
  • Modelagem preditiva e machine learning aplicado a negócios
Apache SparkAirflowAzure MLSageMaker
IT Expert
Cientista de Dados
jun/2019 – mar/2022 · 2a 10m
  • Projetos de Combate a Fraude com GCP/BigQuery e Kubernetes
  • Projeto de Gamefication com AWS (EC2, S3, Glue, Redshift, Kinesis)
  • Projeto de Marketing Lead com Azure (Data Factory, CosmosDB, Synapse)
  • ETL com Pentaho PDI, Talend e Apache ecosystem
GCPAWSAzurePythonPentaho
Experiências Anteriores
Dev Backend, DBA Oracle, Infra Linux
2002 – 2019 · +17 anos
  • E-commerce Otto/Posthaus: desenvolvimento Java EE, GTM, Google Shopping
  • DBA Oracle: PL/SQL, Reports, Forms, Data Warehouse, Star Schema
  • Infraestrutura: servidores Linux Red Hat, Squid Proxy, Samba, Qmail, Firewall
  • Coordenação de equipes de desenvolvimento C# e PHP
  • Big Data com Hadoop e Apache Solr para motor de busca
OracleJava EEPHPLinuxC#

Projetos em Destaque

Projetos reais entregues em ambientes de produção, combinando engenharia de dados com IA aplicada.

Plataforma Anti-Fraude — GCP

Pipeline de detecção de fraudes em tempo real com Google BigQuery e Dataflow. Kubernetes para orquestração de modelos preditivos em produção.

GCPBigQueryDataflowPythonKubernetes

Plataforma de Gamefication — AWS

Arquitetura completa de dados com AWS EC2, S3, Glue, Redshift, Aurora e Amazon Kinesis para processamento de eventos em tempo real.

AWSKinesisRedshiftGlueEMR

Marketing Lead Intelligence — Azure

Ingestão e análise de dados de marketing com Azure Data Factory, CosmosDB, Databricks e Azure Synapse Analytics para geração de leads qualificados.

AzureDatabricksSynapseCosmosDB

Agente IA Generativa com RAG

Sistema de busca semântica e agentes inteligentes com LangChain, LangGraph, embeddings vetoriais e arquitetura RAG multiagente.

LangChainLangGraphRAGHuggingFaceMLflow

E-commerce Microservices — AWS

Implantação de infraestrutura de microsserviços para plataforma de e-commerce de grande escala com CI/CD GitLab e Linux AMZ/CentOS.

AWS EC2DockerCI/CDLaravelJava

Sistemas Acadêmicos — UFPR

Desenvolvimento e manutenção de sistemas corporativos para a Universidade Federal do Paraná com Java EE, Spring Boot e Vue.js.

Java EESpringVue.jsREST API
Ver mais no GitHub

Onde já operei em produção

Experiência real com deploy, arquitetura e gestão em múltiplos ambientes cloud.

Amazon Web Services AWS EC2, S3, Glue, Redshift, EMR, SageMaker
Google Cloud Platform GCP BigQuery, Dataflow, Kubernetes
Microsoft Azure Azure Data Factory, Databricks, Synapse, CosmosDB
DigitalOcean Digital Ocean Droplets, Kubernetes
Docker Docker Containerização & Compose
Kubernetes Kubernetes Orquestração de containers
Apache Airflow Airflow Orquestração de pipelines
Apache Spark Spark Processamento distribuído

Educação & Certificações

Bacharelado em Andamento
Ciência da Computação
Universidade Positivo
2024 – 2028
Pós-Graduação
Engenharia de Software
Universidade Cruzeiro do Sul
Concluído – 2022
Pós-Graduação
Matemática e Estatística
UNIMAIS – Faculdade Educamais
Concluído – 2022
Graduação Tecnológica
Modelagem de Dados & DBA
Universidade Cruzeiro do Sul
Concluído – 2021
Certificação DSA
Engenheiro de Dados & Cientista de Dados
Data Science Academy
2021/2022
Certificações
Deep Learning PyTorch · Rust · DevOps · IA Generativa · Python OO
DIO – Digital Innovation One
2022–2024

Especialista em transformar dados em valor

Com mais de 20 anos de experiência em TI, sou especialista em projetar e arquitetar soluções de dados em larga escala. Minha trajetória vai desde DBA Oracle e administração de infraestrutura Linux até projetos de Big Data, Machine Learning e Inteligência Artificial Generativa nas principais clouds do mercado.

20+ anos de experiência real

Da infraestrutura ao modelo de IA — vivência prática em todo o ciclo de dados.

Arquitetura Multi-Cloud

Projetos entregues em AWS, GCP, Azure e ambientes on-premise simultaneamente.

Do dado à decisão

Pipelines que alimentam modelos que geram insights que movem negócios.

Entre em Contato

Disponível para projetos freelance, posições CLT/PJ e consultoria. Respondo em até 24h.