norma-earqbrasil
Provide project context and coding guidelines that AI should follow when generating code, answering questions, or reviewing changes.
Com base na análise do e-ARQ Brasil (Parte II - Especificação de requisitos para sistemas informatizados de gestão arquivística de documentos) e dos esquemas de banco de dados fornecidos (clio_entidades, gerenciador_dados, gerenciamento_googledrive), apresento a seguir a síntese de mapeamento de metadados.
Este mapeamento organiza os dados do seu sistema conforme a estrutura de metadados exigida pelo e-ARQ Brasil para garantir a gestão arquivística, preservação e interoperabilidade.
1. Entidade: DOCUMENTO
Refere-se ao registro no gerenciador_dados (a unidade arquivística).
| Código e-ARQ | Nome do Metadado | Campo Correspondente no seu Banco de Dados | Observações / Instruções e-ARQ |
|---|---|---|---|
| 1.1 | Identificador do documento | gerenciador_dados.codigo_de_referencia | Deve ser único e persistente. Ex: 1974.00.00-MOMA-EXH.CA.166. |
| 1.2 | Número do documento | metadados -> numerodocumento | Número atribuído na produção. Ex: CA.166. |
| 1.8 | Tipo de meio | Derivado de gerenciador_dados.url_pdf | Se houver URL/Arquivo, o valor para o e-ARQ é "Digital". Se houver apenas localização física, "Não digital". |
| 1.11 | Título | metadados -> titulo ou metadados -> metadata_titulo | Deve nomear o documento. Se vazio no JSON, recomenda-se criar um título atribuído conciso. |
| 1.12 | Descrição | gerenciador_dados.observacoes ou metadados -> descricao | Exposição concisa do conteúdo. Ex: "Texto extraído via OCR...". |
| 1.13 | Assunto | metadados -> assuntos | Palavras-chave. Ex: "Exposições de arte; Bibliotecas...". A tabela clio_entidades.entity_name também alimenta este campo. |
| 1.14 | Autor | metadados -> entidades_organizacoes | Entidade produtora. Ex: "Museum of Modern Art (MoMA)". Pode ser enriquecido com clio_entidades. |
| 1.18 | Interessado | clio_entidades.entity_name | Pessoas/Entidades com envolvimento (via inFileID e relationshipType). Ex: "Walter Zanini". |
| 1.19 | Identificador do componente digital | gerenciamento_googledrive.id_drive | Elo entre o registro descritivo e o arquivo físico. Ex: 1LgU.... |
| 1.20 | Gênero | gerenciador_dados.tipo | Ex: "Gênero bibliográfico". O e-ARQ sugere: Textual, Iconográfico, Audiovisual, etc. |
| 1.23 | Idioma | metadados -> idioma | Ex: "Não especificado". Recomenda-se usar padrão ISO 639-2. |
| 1.32 | Data de produção | gerenciador_dados.data_documento_str | Ex: "00/00/1974". Atenção: O e-ARQ recomenda ISO 8601 (AAAA-MM-DD). Datas incompletas devem ser normalizadas. |
| 1.33 | Local de produção | metadados -> localizao_do_original | Ex: "New York, USA". (Data tópica). |
| 1.34 | Classe | gerenciador_dados.colecao | Vinculação ao plano de classificação. Ex: "MoMA - The Museum of Modern Art". |
| 1.37 | Localização | gerenciamento_googledrive.breadcrumbs | Local de armazenamento atual (lógico ou físico). |
2. Entidade: COMPONENTE DIGITAL
Refere-se ao arquivo digital armazenado, descrito na tabela gerenciamento_googledrive.
| Código e-ARQ | Nome do Metadado | Campo Correspondente no seu Banco de Dados | Observações / Instruções e-ARQ |
|---|---|---|---|
| 5.1 | Identificador do componente digital | gerenciamento_googledrive.id_drive | Identificador único do arquivo no repositório (Google Drive). |
| 5.2 | Nome original | gerenciamento_googledrive.nome | Nome do arquivo. Ex: FMACUSP_0100...pdf. |
| 5.3 | Tamanho | gerenciamento_googledrive.tamanho | Tamanho em bytes. Ex: 1048716. Essencial para preservação. |
| 5.4 | Software de criação | Não explícito na tabela | Recomendado extrair dos metadados internos do PDF (ex: Adobe Acrobat). |
| 5.7 | Formato de arquivo | gerenciamento_googledrive.tipo_mimetype | Ex: application/pdf. O e-ARQ exige formatos abertos ou padronizados para preservação (ex: PDF/A). |
| 5.8 | Localização | gerenciamento_googledrive.web_view_link | Caminho ou URL para acesso ao objeto. |
3. Entidade: AGENTE e EVENTOS
Refere-se aos usuários e logs de auditoria (rastreabilidade).
| Código e-ARQ | Nome do Metadado | Campo Correspondente no seu Banco de Dados | Observações / Instruções e-ARQ |
|---|---|---|---|
| 7.1 | Identificador do agente | gerenciamento_googledrive.owner_email | Identificação única do usuário responsável. Ex: adm.geopoliticas@... |
| 7.2 | Nome do agente | gerenciamento_googledrive.owner_name | Nome legível. Ex: geopoliticas institucionais. |
| 2.1.6 | Data e hora do evento | gerenciador_dados.data_criacao_registro e data_ultima_atualizacao | Registra quando o documento foi capturado ou modificado no sistema. |
| 6.4 | Evento de preservação (Data) | gerenciamento_googledrive.created_time_drive | Data de criação do componente digital no repositório. |
Recomendações de Adequação ao e-ARQ Brasil
- Normalização de Datas (Requisito 1.32): O campo
data_documento_strpossui valores como "00/00/1974". Para conformidade com o e-ARQ, deve-se preencher o campodata_documento_normalizadaseguindo o padrão ISO 8601 (AAAA-MM-DD). Datas aproximadas devem ser tratadas conforme norma de descrição (ex: [1974]). - Relação Orgânica (Requisito 1.34): O campo
colecaoestá sendo usado como Classe. Certifique-se de que a coleção corresponda a uma estrutura hierárquica de classificação arquivística válida. - Fixidade (Requisito 5.14): A tabela
gerenciamento_googledrivenão possui um campo para Hash/Checksum (MD5 ou SHA-256). O e-ARQ Brasil exige isso para garantir que o arquivo digital não sofreu alteração (integridade).- Ação sugerida: Criar coluna
checksumouhashna tabelagerenciamento_googledrive.
- Ação sugerida: Criar coluna
- Vocabulário Controlado (Requisito 1.20/1.21): O campo
tipoemgerenciador_dadoscontém "Gênero bibliográfico". O e-ARQ sugere separar claramente Gênero (Textual, Iconográfico) de Espécie/Tipo (Relatório, Carta, Fotografia). - Trilha de Auditoria (Requisito 7.4): Embora existam datas de criação e atualização, um SIGAD conforme o e-ARQ deve registrar um histórico (log) de quem alterou o que e quando, e não apenas a última data de modificação.