4.3. Crítica de Dados
Os registros provenientes dos sistemas legados podem estar repletos de anomalias. Os motivos podem ser adversos, inclusive detectados em tempo de projeto. É preciso criar estruturas rígidas de críticas e filtros das informações da origem, para que sua entrada no MDM seja autorizada. Caso contrário estes problemas serão migrados para a base qualificada, afetando sua utilização estratégica.
Nesta etapa, é necessário aplicar as regras de crítica e validação da informação com objetivo de estabelecer critérios de qualidade para que a informação possa ser persistida no MDM. Alguns exemplos de regras de crítica:
- Nome de Pessoa Física deve conter mais que uma palavra;
- Nome de Pessoa Física não pode conter palavrões;
- CPF, CNPJ, CNH devem possuir o dígito verificador válido;
- O E-mail deve possuir sintaxe válida;
- O Telefone não pode conter mais que onze dígitos.
Abaixo temos a tabela com as Críticas de Dados:
Nome de Recurso | Nome | Descrição Detalhada |
Crítica CNH | Crítica CNH | A crítica de CNH segue as seguintes regras: 1- Verificação de tamanho da CNH, sendo 9 dígitos validamos de acordo com os padrões da CNH Antiga, sendo 11 dígitos validamos conforme os padrões da CNH nova 2- Verifica se todos dígitos são numéricos 3- Verifica se o documento não é viciado. 4- Valida-se dígito verificador Como adendo, caso a categoria da CNH seja inválida cria-se um alerta, porém caso o CNH seja válido o dado é somado ao Golden Record |
Crítica CTPS | Crítica CTPS | A crítica de CTPS invalida um registro nos casos em que: 1- O número de série tiver tamanho maior que 5 dígitos 2- O número do documento tiver tamanho maior que 8 dígitos 3- O número do documento estiver viciado |
Crítica DDD e DDI Nulo | Crítica DDD e DDI Nulo | Gerar alerta se o número do DDD ou DDI possuírem conteúdo nulo, vazio ou somente espaços em branco |
Crítica Documento com Vício Preenchimento | Crítica Documento com Vício Preenchimento | O número do documento não pode conter vício de preenchimento. O número do documento não pode conter vício de preenchimento, ou seja, não pode conter a repetição de um mesmo caractere em todo o conteúdo da string Exemplo: XXXXX,ZZZZZ,11111,22222 Os registros que não respeitarem essa restrição deverão ser invalidados |
Crítica E-mail com Vício de Preenchimento | Crítica E-mail com Vício de Preenchimento | O e-mail não pode conter vício de preenchimento, ou seja, não pode conter a repetição de um mesmo caractere em todo o conteúdo da string Exemplo: XXXXX,ZZZZZ |
Crítica E-mail Fora do Padrão | Crítica E-mail Fora do Padrão | Os e-mails devem obedecer uma estrutura padrão de conteúdo, conforme regra abaixo: • À esquerda do @: . O primeiro caractere deve ser alfanuméricos abcdefghijklmnopqrstuvwxyz ou 0123456789 . Ex: Exemplo: maria-rossi@hotmail.com ,maria-rossi2000@hotmail.com, 123maria@hotmail.com .É obrigatório conter pelo menos um caractere alfabético • À direita do @: . Deve haver no mínimo dois caracteres alfanuméricos abcdefghijklmnopqrstuvwxyz 0123456789 . Não é permitido iniciar com caractere diferente dos alfanuméricos Ex: nmneto@.md2.com.br (não permitido) . Não é permitida a finalização com qualquer caractere diferente do alfabético abcdefghijklmnopqrstuvwxyz Ex: nmneto@md2.com.br.. (não permitido) nmneto@md2.com.br1 (não permitido) . Deve possuir pelo menos um ponto e no máximo 3 pontos. . Entre ou após os pontos deve conter no mínimo dois caracteres alfanuméricos . Não é permitido dois ou mais pontos sequenciais, Ex: nmneto@md2..com.br => (não permitido) Ex. permitido: Ex. não permitido xpto@r7.br xpto@_r1.com xpto@r-7.aaa.com.br xpto@r7.aa-.a xpto@r_7.us xpto@aa-.a_.aa Os registros que violarem o formato padrão deverão ser invalidados |
Crítica Email Genérico | Crítica Email Genérico | O e-mail não pode conter valores genéricos Aplicar rotina QualityStage para completude e padronização da informação de e-mail para identificação de e-mails genéricos mais comuns. Exemplo: clientenaopossui clientenaopossuiem clientenaotem clientenaotememail naopossuiemail naopossuiemailpessoal Os registros identificados como e-mails genéricos deverão ser invalidados |
Crítica Endereço Nulo | Crítica Endereço Nulo | As informações de endereço devem estar preenchidas Pelo menos um dos campos de endereço, tais como nome do logradouro, bairro, cidade ou CEP devem estar preenchidos. Os registros que não respeitarem essa restrição deverão ser invalidados. |
Crítica Estrutura Padrão Passaporte | Crítica Estrutura Padrão Passaporte | Os valores de Passaporte devem respeitar a estrutura padrão. Campo composto por no máximo 11 algarismos, composto por números e letras, porém é permitido letras antes e após os números, não podendo possuir letras entre os números Ex. não permitido: W123456AB789 Ex. permitido: W123456Z Registros que não atenderem a regra estrutural, deverão ser invalidados |
Crítica Estrutura Padrão RG | Crítica Estrutura Padrão RG | Os valores de RG de estados diferente de RJ e SP devem respeitar o tamanho padrão entre 2 e 11 dígitos. Para os estados de RJ e SP o tamanho permitido é de 9 caracteres e ainda é utilizado uma regra que valida o dígito verificador.Será gerando uma alerta para registros que não atenderem essa condição |
Crítica Nome Blocklist | Crítica Nome Blocklist | O nome não pode conter palavras existentes na blocklist de nomes. A blocklist de nomes contém uma relação de palavrões e xingamentos que podem estar ocultos no nome da pessoa. Os registros que não respeitarem essa restrição deverão ser invalidados. |
Crítica Nome com Vício de Preenchimento | Crítica Nome com Vício de Preenchimento | O nome da Pessoa Física ou Jurídica não pode conter vício de preenchimento, ou seja, não pode conter a repetição de um mesmo caractere em todo o conteúdo da string Exemplo: XXXXX, ZZZZZ Os registros que não respeitarem essa restrição deverão ser invalidados |
Crítica Nome Nulo | Crítica Nome Nulo | O nome da Pessoa Física ou Jurídica deve estar preenchido O nome da Pessoa Física ou Jurídica não pode ser nulo, vazio ou somente espaços em branco. Os registros que não respeitarem essa restrição deverão ser invalidados. |
Crítica Nome Pai e Mãe com Vício de Preenchimento | Crítica Nome Pai e Mãe com Vício de Preenchimento | O nome do Pai e Mãe não pode conter vício de preenchimento, ou seja, o não pode conter a repetição de um mesmo caractere em todo o conteúdo da string Exemplo: XXXXX, ZZZZZ Os nomes de Pai e Mãe que não respeitarem essa restrição deverão ser anulados |
Crítica Nome Pai e Mãe na Blocklist | Crítica Nome Pai e Mãe na Blocklist | O nome do Pai e Mãe não pode conter palavras existentes na blocklist de nomes. A blocklist de nomes contém uma relação de palavrões e xingamentos que podem estar ocultos no nome da pessoa. Os nomes que não respeitarem essa restrição deverão ser anulados e um alerta será gerado informando essa situação |
Crítica Pessoas Diferentes Com o Mesmo CPF | Crítica Pessoas Diferentes Com o Mesmo CPF | O CPF não pode estar associado a mais de uma pessoa. Caso contrario, o registro deverá ser invalidado |
Crítica Quantidade Mínima de Caracteres Nome Pai e Mãe | Crítica Quantidade Mínima de Caracteres Nome Pai e Mãe | O nome do Pai e Mãe deve respeitar a quantidade mínima de 3 caracteres. Os nomes que não respeitarem essa restrição deverão ser anulados e um alerta será gerado informando essa situação |
Crítica Quantidade Mínima de Palavras Nome Pessoa Física | Crítica Quantidade Mínima de Palavras Nome Pessoa Física | O nome de Pessoa Física deve respeitar a quantidade mínima de palavras Os registros com Nome de Pessoa Física que não respeitarem as regras abaixo deverão ser invalidados: Nome com apenas uma palavra Nome com duas palavras, com um caractere em um das palavras |
Crítica Telefone com Vício de Preenchimento | Crítica Telefone com Vício de Preenchimento | O número do telefone não pode conter vício de preenchimento, ou seja, não pode conter a repetição de um mesmo caractere em todo o conteúdo da string Exemplo: 11111,22222 Os registros que não respeitarem essa restrição deverão ser invalidados |
Crítica Telefone Fora do Padrão | Crítica Telefone Fora do Padrão | Os telefones devem obedecer uma estrutura padrão de conteúdo, conforme regra abaixo: Telefones devem respeitar a seguinte regra estrutural: Fixo: deve conter 8 caracteres numéricos e iniciados (da esquerda para a direita) pelos números 2 (dois), 3 (três), 4 (quatro) ou 5 (cinco); Móvel:deve conter 9 caracteres numéricos iniciados pelo número 9 Especial: iniciar com 0800 e possuir até 11 números Os registros que violarem o formato padrão deverão ser invalidados |
Crítica Telefone Nulo | Crítica Telefone Nulo | O número do telefone não pode ser nulo, vazio ou somente espaços em branco. Os registros que não respeitarem essa restrição deverão ser descartados. |
Crítica Validação CPF | Crítica Validação CPF | Validação CPF pelo dígito verificador. Caso documento não seja válido , o registro deverá ser invalidado |
Crítica Validação PIS | Crítica Validação PIS | Validação PIS pelo dígito verificador. Caso documento não seja válido , o registro deverá ser invalidado |
No Comments