Guia de Contribuição¶

Obrigado por considerar contribuir com o fabricgov! Este guia vai te ajudar a entender a estrutura do projeto e como adicionar novos coletores, exportadores ou melhorias.

📋 Tabela de Conteúdo¶

Configuração do Ambiente
Estrutura do Projeto
Convenções de Código
Como Adicionar um Novo Coletor
Como Adicionar Testes
Process de Review
Convenções de Commit

🛠️ Configuração do Ambiente¶

Pré-requisitos¶

Python 3.12+
Poetry 1.8+
Git

Setup¶

# Clone o repositório
git clone https://github.com/luhborba/fabricgov.git
cd fabricgov

# Instala dependências
poetry install

# Ativa o ambiente virtual
poetry shell

# Roda os testes
poetry run pytest tests/ -v

Configuração de Credenciais¶

Crie um arquivo .env na raiz:

FABRICGOV_TENANT_ID=seu-tenant-id
FABRICGOV_CLIENT_ID=seu-client-id
FABRICGOV_CLIENT_SECRET=seu-client-secret

🏗️ Estrutura do Projeto¶

fabricgov/
├── fabricgov/
│   ├── auth/                  # Módulo de autenticação
│   │   ├── base.py            # Protocolo AuthProvider
│   │   ├── service_principal.py
│   │   └── device_flow.py
│   ├── cli/                   # CLI via Click
│   │   ├── main.py            # Grupo principal `fabricgov`
│   │   ├── auth.py            # Comandos `fabricgov auth`
│   │   ├── collect.py         # Comandos `fabricgov collect`
│   │   ├── report.py          # Comando `fabricgov report`
│   │   ├── analyze.py         # Comando `fabricgov analyze`
│   │   └── session.py         # Gerenciamento de sessão (`collect all`)
│   ├── reporters/             # Relatório HTML e análise de dados
│   │   ├── insights.py        # InsightsEngine — lê CSVs e computa métricas
│   │   ├── html_reporter.py   # HtmlReporter — gráficos Plotly + Jinja2
│   │   └── templates/         # Templates Jinja2
│   ├── collectors/            # Coletores de dados (11 total)
│   │   ├── base.py            # BaseCollector (retry, paginação, rate limiting)
│   │   ├── workspace_inventory.py
│   │   ├── workspace_access.py
│   │   ├── report_access.py
│   │   ├── dataset_access.py
│   │   ├── dataflow_access.py
│   │   ├── refresh_history.py
│   │   ├── refresh_schedule.py
│   │   ├── domain.py
│   │   ├── tag.py
│   │   ├── capacity.py
│   │   └── workload.py
│   ├── exporters/             # Exportadores de resultados
│   │   └── file_exporter.py   # JSON/CSV com suporte a run_dir
│   ├── config.py              # Auth preference system
│   ├── progress.py            # ProgressManager (rich)
│   ├── checkpoint.py          # Sistema de checkpoint
│   └── exceptions.py          # Exceções customizadas
├── tests/
│   ├── auth/                  # Unit tests do módulo auth
│   ├── manual/                # Testes manuais para desenvolvimento
│   └── pytest.ini
├── docs/                      # Documentação
│   ├── authentication.md
│   ├── collectors.md
│   ├── exporters.md
│   ├── limitations.md
│   └── contributing.md
├── pyproject.toml             # Dependências e configuração do Poetry
└── README.md

📝 Convenções de Código¶

Estilo de Código¶

Seguimos PEP 8 com algumas adaptações:

Indentação: 4 espaços
Linha máxima: 88 caracteres (Black default)
Imports: agrupados por stdlib → third-party → local
Type hints: obrigatórios em funções públicas

Formatação¶

# Formata código automaticamente
poetry run black fabricgov/ tests/

# Verifica estilo
poetry run flake8 fabricgov/ tests/

Docstrings¶

Usamos Google Style para docstrings:

def collect(self) -> dict[str, Any]:
    """
    Executa coleta completa do inventário de workspaces.

    Returns:
        Dicionário com workspaces, artefatos e summary.

    Raises:
        ForbiddenError: se o SP não tiver permissões Admin.
        TimeoutError: se o scan exceder max_poll_time.
    """
    pass

🔧 Como Adicionar um Novo Coletor¶

Passo 1: Definir o Domínio¶

Primeiro, identifique: - Qual API será usada? (Fabric REST, Power BI REST, DAX query) - Quais dados serão coletados? - Qual a frequência recomendada? (diário, semanal, sob demanda)

Passo 2: Criar o Arquivo¶

touch fabricgov/collectors/seu_coletor.py

Passo 3: Implementar o Coletor¶

Template básico:

from typing import Any
from fabricgov.auth.base import AuthProvider
from fabricgov.collectors.base import BaseCollector


class SeuColetor(BaseCollector):
    """
    Descrição breve do que o coletor faz.

    API utilizada: [nome da API]
    Endpoint principal: [endpoint]

    Uso:
        collector = SeuColetor(auth=auth)
        result = collector.collect()
    """

    # Scope OAuth2 necessário
    SCOPE = "https://api.fabric.microsoft.com/.default"
    # ou "https://analysis.windows.net/powerbi/api/.default"

    def __init__(
        self,
        auth: AuthProvider,
        **kwargs
    ):
        """
        Args:
            auth: Provedor de autenticação
        """
        # Define a base_url correta para a API
        super().__init__(
            auth=auth,
            base_url="https://api.fabric.microsoft.com",  # ou powerbi.com
            **kwargs
        )

    def collect(self) -> dict[str, Any]:
        """
        Executa a coleta de dados.

        Returns:
            Dicionário estruturado com os dados coletados.
        """
        # Exemplo de GET simples
        response = self._get(
            endpoint="/v1/seu-endpoint",
            scope=self.SCOPE,
            params={"$top": 1000}
        )

        # Exemplo de GET com paginação
        items = self._paginate(
            endpoint="/v1/seu-endpoint",
            scope=self.SCOPE,
            params={"$top": 1000}
        )

        # Estrutura o resultado
        return {
            "items": items,
            "summary": {
                "total_items": len(items),
                "collection_time": datetime.now().isoformat(),
            }
        }

Passo 4: Expor no `init.py`¶

Edita fabricgov/collectors/__init__.py:

from fabricgov.collectors.base import BaseCollector
from fabricgov.collectors.workspace_inventory import WorkspaceInventoryCollector
from fabricgov.collectors.seu_coletor import SeuColetor  # Adiciona

__all__ = [
    "BaseCollector",
    "WorkspaceInventoryCollector",
    "SeuColetor",  # Adiciona
]

Passo 5: Criar Teste Manual¶

Cria tests/manual/test_seu_coletor.py:

from fabricgov.auth import ServicePrincipalAuth
from fabricgov.collectors import SeuColetor

auth = ServicePrincipalAuth.from_env()
collector = SeuColetor(auth=auth)
result = collector.collect()

print(f"Total de itens: {result['summary']['total_items']}")

Testa:

poetry run python tests/manual/test_seu_coletor.py

Passo 6: Adicionar Documentação¶

Adiciona seção no docs/collectors.md descrevendo: - O que o coletor faz - Parâmetros do construtor - Estrutura do output - Exemplos de uso - Limitações conhecidas

🧪 Como Adicionar Testes¶

Unit Tests¶

Cria tests/collectors/test_seu_coletor.py:

import pytest
from unittest.mock import MagicMock
from fabricgov.collectors import SeuColetor


@pytest.fixture(autouse=True)
def mock_http_client(mocker):
    """Mocka o cliente HTTP para não fazer chamadas reais."""
    mock_client = MagicMock()
    mocker.patch("httpx.Client", return_value=mock_client)
    return mock_client


class TestSeuColetor:

    def test_collect_retorna_estrutura_correta(self, mock_http_client):
        """Valida que collect() retorna a estrutura esperada."""
        # Arrange
        mock_http_client.get.return_value.json.return_value = {
            "value": [{"id": "item-1", "name": "Item 1"}]
        }
        mock_http_client.get.return_value.status_code = 200

        auth = MagicMock()
        auth.get_token.return_value = "fake-token"

        collector = SeuColetor(auth=auth)

        # Act
        result = collector.collect()

        # Assert
        assert "items" in result
        assert "summary" in result
        assert result["summary"]["total_items"] == 1

    def test_collect_lanca_erro_em_403(self, mock_http_client):
        """Valida tratamento de erro 403."""
        # Arrange
        import httpx
        mock_response = MagicMock()
        mock_response.status_code = 403
        mock_response.text = '{"error": "Forbidden"}'

        mock_http_client.get.return_value = mock_response
        mock_http_client.get.return_value.raise_for_status.side_effect = (
            httpx.HTTPStatusError("Forbidden", request=MagicMock(), response=mock_response)
        )

        auth = MagicMock()
        auth.get_token.return_value = "fake-token"

        collector = SeuColetor(auth=auth)

        # Act & Assert
        from fabricgov.exceptions import ForbiddenError
        with pytest.raises(ForbiddenError):
            collector.collect()

Roda os testes:

poetry run pytest tests/collectors/test_seu_coletor.py -v

🔍 Process de Review¶

Antes de Abrir um Pull Request¶

Roda os testes:
```
   poetry run pytest tests/ -v
```
Formata o código:
```
   poetry run black fabricgov/ tests/
```
Valida type hints:
```
   poetry run mypy fabricgov/
```
Testa manualmente com credenciais reais

Pull Request Checklist¶

[ ] Código está formatado (black)
[ ] Unit tests adicionados e passando
[ ] Teste manual executado com sucesso
[ ] Documentação atualizada (docs/collectors.md ou similar)
[ ] __init__.py atualizado para expor novos módulos
[ ] Commit segue convenção (ver abaixo)

O que Esperamos no Review¶

Clareza: Código fácil de entender
Reuso: Aproveita funcionalidades do BaseCollector
Tratamento de erros: Lança exceções customizadas apropriadas
Performance: Não faz chamadas desnecessárias à API
Documentação: Docstrings completas e exemplos de uso

📝 Convenções de Commit¶

Seguimos Conventional Commits:

<tipo>(<escopo>): <descrição curta>

<corpo opcional>

Tipos¶

feat — Nova funcionalidade
fix — Correção de bug
docs — Mudanças na documentação
test — Adiciona ou corrige testes
refactor — Refatoração sem mudar funcionalidade
chore — Tarefas de manutenção (build, CI, etc.)

Escopos¶

auth — Módulo de autenticação
collectors — Coletores de dados
exporters — Exportadores
reporters — InsightsEngine, HtmlReporter, templates
analyze — Comando fabricgov analyze
cli — Interface de linha de comando
exceptions — Exceções customizadas
docs — Documentação

Exemplos¶

# Nova funcionalidade
feat(collectors): add CapacityConsumptionCollector

# Correção de bug
fix(auth): handle token expiration in ServicePrincipalAuth

# Documentação
docs(collectors): add examples for WorkspaceInventoryCollector

# Testes
test(auth): add unit tests for DeviceFlowAuth

# Refatoração
refactor(collectors): extract pagination logic to BaseCollector

# Manutenção
chore(deps): update msal to 1.35.0

🐛 Reportando Bugs¶

Abra uma issue no GitHub com:

Título descritivo: "ForbiddenError ao coletar workspaces com SP"
Versão do Python e fabricgov
Passos para reproduzir
Comportamento esperado vs obtido
Traceback completo (sem expor credenciais)

Template:

### Descrição
[descrição curta do problema]

### Ambiente
- Python: 3.12.2
- fabricgov: 0.1.0
- SO: Ubuntu 24.04

### Reprodução
1. Execute `collector.collect()`
2. Observe erro 403

### Comportamento esperado
Deveria coletar os dados sem erro

### Comportamento obtido

ForbiddenError: [403] Acesso negado...

### Contexto adicional
O SP tem permissões de Tenant.Read.All configuradas.

💡 Sugestões de Contribuição¶

Áreas onde contribuições são especialmente bem-vindas:

Novos findings de governança (v0.9.0+)¶

Novos tipos de findings no InsightsEngine._build_findings()
Comparação entre snapshots (fabricgov diff)
Integração com Azure Key Vault para credenciais

Exportadores¶

Export para Excel (.xlsx) com múltiplas abas
Integração com Azure Blob Storage

Documentação¶

Tradução para inglês (v0.6.1)
Mais exemplos de casos de uso reais
Troubleshooting guide

Testes¶

Aumentar cobertura de unit tests nos collectors v0.5
Testes de integração com mock da API

📞 Contato¶

Issues: github.com/luhborba/fabricgov/issues
Discussões: github.com/luhborba/fabricgov/discussions
Email: [seu email se aplicável]

📄 Licença¶

Ao contribuir, você concorda que suas contribuições serão licenciadas sob a Licença MIT.

Obrigado por contribuir com o fabricgov! 🚀

← Voltar: Exportadores | Voltar ao README →