Artigo de Ernesto V. S. Figueiredo.
I) INTRODUÇÃO E METODOLOGIA DESCRITIVA
Propomo-nos abordar o tema em epígrafe, com o conhecimento pleno de que ao dá-lo por encerrado, não teremos senão conseguido dar testemunho (com evidência robustamente assegurada) de alguns resultados metodologicamente conseguidos através de um desenho experimental levado a cabo em meio laboratorial e não por observação direta feita no campo ou por contacto presencial e assistido, levado a cabo no terreno (fonte), geograficamente percorrido.
Na era da profusão de informação acessível e das novas tecnologias (de comunicação e informação) que lhe asseguram suporte físico, concedendo-lhe valor acrescentado, o qual (podendo ser incorporado) auxilia consideravelmente na difusão do progresso social e do desenvolvimento económico, valemo-nos desta conjuntura favorável para construir uma base de dados sólida e abrangente, sem gastar os mesmos tempos de recolha de dados que eram exigidos antigamente.
Em vez de pesquisar bibliograficamente informação atinente pelos quatro cantos do País, a fim de construir uma base de dados que ilustrasse suficientemente bem as diversas realidades de que a sociedade civil é construída, dirigimo-nos (imbuídos de fortes expectativas) ao portal da internet designado por Base de Dados de Portugal Contemporâneo (acrónimo PORDATA), da autoria da fundação Francisco Manuel dos Santos, de caracter filantrópico reconhecido.
Entre outros, constituem objetivos da PORDATA a recolha, organização, sistematização e divulgação de informação sobre múltiplas áreas socioeconómicas, culturais e político-administrativas. As estatísticas divulgadas são provenientes de fontes oficiais e certificadas, com competências de produção de informação, nas áreas respetivas. Consiste a atividade principal da PORDATA em recolher e organizar a informação disponível, tornando-a o mais possível, clara e acessível.
Indo ao encontro das expectativas, em apenas alguns meses de recolha, foi possível construir-se uma base de dados extensa para o efeito pretendido, alicerçada nos 14 temas que se enumeram abaixo, os quais (ver portal da PORDATA) admitem diversificados subtemas que nos escusamos de apresentar, exclusivamente, por escassez de espaço de grafia. Um total de 391 variáveis (objeto de observação, tratamento e estudo pelos 278 municípios incluídos) foi ganhando forma matricial.
A informação inicialmente codificada para estudo (matriz inicial dos dados) assenta nos 14 temas inventariados: 1º) População, 2º) Educação, 3º) Saúde, 4º) Proteção Social, 5º) Habitação, 6º) Justiça e Segurança, 7º) Emprego e Mercado de Trabalho, 8º) Empresas e Pessoal, 9º) Sociedade de Informação e Comunicações, 10º) Ambiente, Energia e Território, 11º) Cultura, 12º) Finanças Autárquicas, 13º) Participação Eleitoral e 14º) Turismo.
Cada variável (indicador) selecionada, foi-o com ponderação relativa, tomada em linha de conta os 14 temas, o grau de importância avaliado para cada uma e não permitindo que o seu total igualasse o da PORDATA, antes, que se aproximasse do número de municípios (elementos de observação). Sabíamos, por experiência, que do total das variáveis selecionadas (391) algumas se revelariam profundamente afetadas por missing values e que mais valeria a pena removê-las previamente.
Assim se procedeu, aplicando uma simples remoção de 52 indicadores com demasiados valores faltosos, ou seja, do primeiro elenco selecionado passou-se a um segundo, acometido de menor números de falhas de observação, definido por 339 indicadores. Sobre esta matriz de dados, mais realista porque com menos falhas, aplicou-se então uma análise estatística da estimativa dos coeficientes de correlação entre todos os pares de variáveis, originando = 57291 coeficientes.
Os resultados obtidos com esta análise pautam-se pela obtenção de coeficientes extremamente significantes (**), apenas significantes (*) e não significantes ( ). Dado o elevado número de observações (278 concelhos), verifica-se que uma esmagadora maioria dos valores dos coeficientes estimados se apresenta extremamente significante (da ordem estimada de c:a 87%), relegando as outras 2 categorias reunidas (c:a 26%) ou de per si (c:a 13%) para percentagens exíguas.
O que realmente significa a situação encontrada, de que as relações de associação (entre as variáveis recolhidas na sua esmagadora maioria) são extremamente significantes (muito intensas), é que esta maioria de variáveis identificada apresenta um padrão de comportamento de tal forma idêntico (mesmo se invertido), que faz com que qualquer uma possa substituir qualquer outra, sem perda de informação, dito doutra maneira, a informação acumulada é redundante.
Ao invés, as relações identificadas como de associação apenas significante e não significante (relações certificadas mas ténues e relações lineares independentes), constituem um conjunto de variáveis em que a informação acumulada se pode considerar não redundante ou parcimoniosa. Por conseguinte, a fim de proceder a adicionais crivos de seleção da informação alvo de estudo, há que definir e ajustar uma estratégia de seleção a ser aplicada à matriz das 339 variáveis em escrutínio.
Para dar cumprimento ao desiderato enunciado, intuiu-se (com base em experiência adquirida) que a construção de um inventário (das frequências de correlacionamento extremamente significante) para cada uma das variáveis em escrutínio, permitiria proceder a um ordenamento dessas mesmas frequências de correlacionamento, por ordem de grandeza, por exemplo, do mínimo ao máximo observados, conforme fica ilustrado pela Figura 1 abaixo.
Torna-se óbvio, através da análise do comportamento exibido pelas frequências dos correlacionamentos mais intensos das variáveis, que as suas frequências mais baixas correspondem às variáveis marcadas em abcissas situadas à esquerda na Figura 1. Vale esta evidência ainda na constatação de que a informação não redundante (linearmente independente ou mais parcimoniosa) se situa nas variáveis situadas no terço inferior da trajetória das frequências ordenadas.
Esta constatação é importante porque a indagação das frequências dos mais elevados correlacionamentos nos identificam aquelas variáveis (a enorme maioria dos indicadores) que não contribuem com informação nova reportada, quando analisadas em presença de correligionárias em situação de simultaneidade. E, nesta etapa da pesquisa, torna-se crucial poder e saber demarcar as variáveis mais redundantes (repetidas) das variáveis menos redundantes (parcimoniosas).
Observe-se que, na imagem inferior da Figura 1 acima, a trajetória (da sequência dos valores ordenados das frequências de correlacionamento) é exposta em simultâneo com as mesmas frequências (de correlacionamento) marcadas para as variáveis correspondentes da sequência (de codificação) inicial, alterada pelo ordenamento imposto. Por contraste visual, identificam-se claramente as variáveis procuradas, mais e menos redundantes ou mais ou menos parcimoniosas.
Há, no entanto, que estabelecer novo critério (usado dentro do modelo exposto das frequências ordenadas) que nos indique (explícita e inequivocamente) os valores de demarcação correspondentes a intervalos de frequências das variáveis, por exemplo, correspondentes às variáveis menos redundantes (mais parcimoniosas) constituindo a primeira parcela de 10% do total 339, quando todas elas se encontram ordenadas por ordem de grandeza crescente.
As variáveis identificadas no parágrafo anterior constituem o primeiro novo grupo de variáveis, digamos, baseado em informação mais diversificada, acometido de relações de associação mais ténues e menos redundantes. Foi então estabelecido que uma abordagem metodológica (ou plano experimental) considerando três fatias (parcelas de 10% em acumulação) do total das variáveis, constituiria uma estratégia robusta para levar a bom porto as análises subsequentes.
II) ANÁLISES COM MÉTODOS MULTIVARIADOS
A resolução do problema levantado acima, da obtenção dos valores numéricos de demarcação de intervalos nas frequências ordenadas, para obter parcelas de variáveis (indicadores), consegue-se através do cálculo simples dos percentis de ordem 10 (P10), 20 (P20) e 30 (P30) ou, equivalentemente, dos decis de ordem 1 (D1), 2 (D2) e 3 (D3). Os valores encontrados são os seguintes: P10=D1=63.40, P20=D2= 169.90 e P30=D3= 225.67.
A noção geral de quantil (comum a tercis, quartis, decis, percentis, etc) define-se pelo cálculo do valor da variável em escrutínio (valor este do intervalo, chamado largura de variação, considerado entre os valores mínimo e máximo) abaixo do qual se situa a percentagem de elementos (de indicadores, neste caso) enunciada pelo quantil de interesse. É mandatório que nesta análise os elementos (indicadores) considerados estejam ordenados por ordem de grandeza.
Neste estudo, a variável em foco é constituída pelas frequências ordenadas das correlações muito intensas dos indicadores socioeconómicos. O valor, abaixo do qual se situam os primeiros 10% do total de indicadores, é o valor 63.40 registado acima, identificando 34 indicadores. A cifra, abaixo da qual se situam os primeiros 20%, tem o valor 169.90, identificando 68 indicadores. O montante, abaixo do qual se situam os primeiros 30%, acusa o valor 225.67, identificando 102 indicadores.
Há, agora, para interpretação e análise, três conjuntos (matrizes) de dados, fazendo parte do plano experimental de observação inicialmente desenhado. O primeiro, com 34 indicadores de relações de associação mais pobres (mais ténues); o segundo, com 68 indicadores de relações intermédias; o terceiro, com 102 indicadores, de relações mais ricas (mais intensas). Haverá quatro ou mais conjuntos de dados, se entendermos aumentar o leque de ensaios levados a efeito.
Torna-se útil adiantar desde já que, aquilo que se procura com esta investigação e constitui o seu objetivo superior, consiste em descobrir, com a ajuda dos métodos e técnicas estatísticas aplicadas aos dados (que significa às suas diversas versões ou construções instrumentais), se sai confirmada ou infirmada (de forma clara) através da observação (comparação) dos mapas obtidos como resultado do estudo, o modelo padrão regional que é colocado como contra-hipótese de investigação.
O modelo padrão regional que se adota (ver Mapas 1, 2 e 3) é baseado em seis circunscrições territoriais que, grosso modo, vigoraram oficialmente desde 1299 (testamento de D. Dinis) até 1836 (Código Administrativo de Passos Manuel). As designações que se alteravam ligeiramente com as delimitações dos coreógrafos de então, podem ser reativadas para designar as regiões: 1) Douro-Minho, 2) Trás-os-Montes e Beira Interior, 3) Beira Litoral, 4) Estremadura, 5) Alentejo e 6) Algarve.
Este modelo medieval, como se fosse regional de definição contemporânea, segue todos os requisitos exigidos pelos estudos regionais (atuais) voltados para o desenvolvimento sustentável, nomeadamente, no que concerne à cultura (ou subculturas) identificada, às produções específicas (naturais ou industriais), ao clima e meio ambiente (unificador) e à escala da área espacial (autossustentável). Regiões atuais com génese na Idade Média provincial, latentes na alma popular.
Da mesma forma que um bom fotógrafo produz imensas fotografias para apenas aproveitar algumas, também aqui se trata de produzir muitos perfis regionais a fim de identificar algum ou alguns que sirvam o propósito da delimitação regional. Ou seja, que permitam confirmar uma estrutura regional (de origem provincial) construída por povos (comunidades enraizadas) ocupando espaços sociais próprios tornados territórios que poderiam e deveriam ser autárquicos.
Aos 3 escalões (subconjuntos) de indicadores acima definidos e ao conjunto global (dos indicadores todos reunidos), foram aplicados modelos de extração de componentes principais (CPs). Este procedimento metodológico transforma (por redução e concentração) o número de indicadores sobre os quais se aplica, em outro número de valor inferior (escasso) constituído de variáveis abstratas e gerais, também designadas (noutras áreas) por variáveis latentes ou de tipo ideal.
As CPs obtidas dos conjuntos ou subconjuntos de indicadores constituem (cada uma de per si) combinações de diversos indicadores afins em uma única CP, variável não observada (mas latente) de informação compacta e de significado interpretável. Para uma extração ser classificada de bem-sucedida é necessário que o número de CPs extraídas seja muito inferior ao número de indicadores (variáveis de análise) submetidos ao modelo factorial das CPs.
Em princípio, dado que a extração das CPs corresponde a uma transformação algébrica de umas coordenadas para outras, podem produzir-se tantas CPs quantos os indicadores iniciais. Mas, a maior questão está em que as variâncias das sucessivas CPs, conhecidas como valores próprios ou Eigenvalues, explicam parcelas sucessivamente mais pequenas da variância total estimada nos dados de entrada, tornando-se então triviais, quanto descem em valor abaixo da unidade.
Aqui, consideramos a extração de CPs como modelo multivariado de importância instrumental, ou seja, aplica-se a fim de prosseguir a análise com aplicação de modelos de classificação automática de dados (CLAD) e, através destes, por último, obter os almejados estratos socio espaciais, também designados por outros nomes de acordo com o ramo de conhecimento que os viu nascer e desenvolveu (ciências sociais) ou em que são frequentemente utilizados (ciências biológicas e outras).
Há a referir que, a extração de algumas CPs de conjuntos de indicadores, constitui novo filtro do caudal da informação em processamento, criando algumas variáveis compactas explicando uma parte considerável (frequentemente a maior parte) da variância total dos indicadores. Pode considerar-se uma estratégia de filtragem da informação alocada para algumas CPs extraídas. Estas novas variáveis podem ser interpretadas, rodadas (a fim de melhor aderência) e utilizadas.
Para efeitos de procedimentos classificativos, torna-se frequentemente mais eficaz utilizarem-se apenas algumas variáveis (de preferência compactadas), em vez de dezenas ou centenas delas, todas atuando sobre as unidades de observação. É assim que se explica a vantagem de utilização de CPs extraídas de conjuntos de indicadores (para classificação dos 278 municípios), do que utilizarem-se as dezenas ou centenas dos conjuntos, para proceder à mesma classificação.
Como dados intermédios produzidos para serem submetidos a modelos classificatórios produzindo classificações (chame-se-lhes tipologias, escalões, estratos, classes, grupos, categorias ou, mais propriamente, clusters), existem agora disponíveis diversos conjuntos de CPs já extraídas. Para o modelo de classificação automática produzindo classificações que acomodam clusters hierarquizados, decidiu-se solicitar soluções variando em número de dois a doze.
O objetivo de sucesso com o estudo, recorde-se, está em conseguir identificar pelo menos uma variante dos ensaios experimentados que confirme, por observação direta e empiricamente, forte homologia com, primeiro, o modelo referencial das 6 circunscrições administrativas medievais que perdurou 537 anos (ver Figuras 1, 2 e 3); em segundo lugar, que concorde com o modelo identificado no livro do autor, intitulado “Portugal: que regiões”, dado à estampa pelo INIC em 1988.
O método proposto por Ward (1963), assim se chama o bem conhecido modelo de classificação automática que utilizámos (embora haja outros alternativos), é um método aglomerativo das unidades classificadas, produz clusters coesos e relativamente homogéneos, que são propriedades muito valiosas na qualificação dos grupos produzidos, nomeadamente, no caso em estudo. A sua debilidade está, o que é comum a todos os métodos hierárquicos, em não permitir migrações de unidades entre grupos.
O método de Ward é também designado de “variância mínima”. Neste método, a formação dos grupos dá-se pela maximização da homogeneidade dentro dos grupos. A soma de quadrados dentro dos grupos é usada como medida de homogeneidade. Isto é, o método de Ward procede por minimizar a soma de quadrados dentro do grupo. Os grupos formados em cada passo são resultantes da
fusão de unidades elementares ou grupos com a menor soma de quadrados.
Os gráficos característicos dos modelos semelhantes ao método de Ward têm a designação de dendograma. Neste, quando não há unidades a classificar em número demasiadamente elevado, o que não é o nosso caso, pode percorrer-se a árvore aglomerativa, iniciada com as unidades elementares constituindo clusters de unidade única, até ao topo do dendograma em que todas as unidades estão integradas em um único grupo ou cluster global.
III) CONCLUSÕES GERAIS E ESPECÍFICAS DE IMPORTÂNCIA
No Cap. I introduzimos a problemática de estudo, descrevemos as variáveis (indicadores) objeto de estudo, referimos as unidades elementares de observação e descrevemos algumas análises descritivas. No Cap. II perorámos em torno de regiões de referência e métodos multivariados como extração de CPs e Método de Ward. No Cap. III, damos conta de alguns resultados obtidos mais significantes como elementos de comparação com outros homólogos também aqui introduzidos.
Os resultados consistentes obtidos constituem tipologias de espaços geo-sociais, elevados à relevância de regiões, i.e., territórios ocupados e construídos por comunidades a que importa reconhecer e assegurar emancipação administrativa, em alternativa à imposição exercida (sobre a sociedade civil) por redes administrativa de clivagens fraturantes, como foi o caso dos distritos (advindos da Revolução Liberal) ou das CIMs saídas do estado demoliberal, em 2013.
Trata-se, com o contributo prestado pelos resultados apurados neste estudo, de construir um novo estado democrático participativo e de direito, do topo até à base, com integração dos povos em suas regiões (de identificação) equipadas com autonomias políticas e administrativas, construindo-se um país plural e coeso, de naturalidades mais fortes sentidas e exercidas a níveis regional (sub-regional) e local (sub-local). Dar sentido de inclusão nacional às comunidades regionais vivas.
O Estado Nação atualmente vigente (dito soberano e absoluto), também de raiz na Idade Média, com as suas fronteiras erguidas para defesa do território nacional conquistado (usurpado) e altamente centralizado, demoliberal e neoliberal (antidemocrático na sua estrutura orgânica) a fim de (no plano simbólico) salvar a pátria, preservar o império e exercer o colonialismo, que lhe constituem valores de sempre, esse estado nação, dizíamos, poderá ter os dias contados.
Não há obsessão nenhuma em colocar como objetivo superior visado por este estudo, encontrar (descobrir) alguma delimitação que seja (rigorosamente) igual a alguma das três delimitações provinciais exemplificadas pelas Figuras 1, 2 e 3. Tal espectativa tomada como elemento de decisão sobre (a favor ou contra) um parentesco aproximado (semelhante, mas não igual) ou uma réplica fiel, negaria a alteração dos efeitos provocados pelas políticas exercidas ao longo dos tempos.
As realizações (mapas) obtidas pelos dados recolhidos presentemente (Mapas 7, 8 e 9), traduzindo uma perspectiva contemporânea, não têm que igualar as duas realizações anteriores, de 1985 (Mapas 4, 5 e 6) e da Idade Média (Mapas 1, 2 e 3), ou seja, a hipótese de igualdade de delimitações regionais (reportadas aos três tempos) não é a que realmente deve ser formulada e testada, antes, deve procurar-se mostrar à evidência a não rejeição de uma hipótese de relações de semelhança.
Cada conjunto ou subconjunto de CPs, extraídas das diversas variantes de matrizes de dados contendo indicadores selecionados, foi submetido a classificações hierárquicas, por aplicação do método de Ward. Primeiro, filtrou-se a informação de acordo com metodologias objetivas, depois, aplicou-se o mesmo método de classificação aos diversos vetores (eixos ou tendências) de informação controlada. Os três mapas exibidos (ver Figuras 7, 8 e 9 abaixo) coroam a pesquisa reportada.
Houve tempos em que, assumir-se (publicamente) como cidadão português de naturalidade (regional ou provincial) minhota, transmontana, alentejana, algarvia ou outra, era ignominioso e dava direito a reprimenda político religiosa. Eles explicam o impedimento da afirmação regional, que o mesmo é dizer, do desenvolvimento socioeconómico. A resiliência dos povos comunitários com as suas tradições populares, emancipados regionalmente, aí está a confirmar-se.
É a ausência das regiões administrativas (detentoras dos germes organizativos do ordenamento e da gestão da coisa pública) que explica o atraso em que o País mergulhou e em que se tem mantido desde a independência do Brasil (1822). A rede administrativa e centralizadora dos distritos (hoje das CIMs), acompanhando este período, foi a coveira do desenvolvimento sustentável, nomeadamente, por fragmentar o território e a sua população civil em retalhos desconexos.
O controlo do poder local por parte do poder central, feito através dos distritos ou das comunidades intermunicipais, ainda hoje praticado, terá que ser revertido para poder incluir (na sua estrutura articulada de Estado Democrático), o poder central descentralizado, o poder regional motor do desenvolvimento e o poder local protetor e integrador das populações. É a delimitação dos 6 espaços regionais ou, dito de outra forma, das futuras circunscrições autónomas, que aqui se planeia.
Considerando as conclusões mais óbvias que se podem aduzir no fecho deste relatório compacto, comentem-se ao de leve os 3 tipos de mapas exibidos, cada um com 3 elementos, ilustrando 9 cenários (perfis) que, não sendo iguais, deixam transparecer, como primeira característica comum, uma homologia da ação delimitadora muito evidente. Tão evidente que não nos mereceu análise adicional, utilizando algum índice de semelhança aplicado aos diversos mapas em escrutínio.
Os 3 primeiros mapas do primeiro tipo (ver Mapas 1, 2 e 3) dão testemunho do padrão regional (provincial) vigente na Idade Média, mais precisamente entre 1299 (reinado de D. Dinis) e 1836 (Código Administrativo de Passos Manuel, 1836). Este padrão de organização estatal permitiu a expansão e a epopeia dos descobrimentos. Com a Revolução Liberal de 1820, a gestão anterior viu os dias contados, sendo que a nova administração liberal veio dividir a sociedade civil.
Com o início da hecatombe descolonizadora (independência do Brasil em 1822) e com a introdução do figurino distrital (em 1836) como recentralizador do estado para uma administração mais centralista (que segurasse o Império), assiste-se, até praticamente aos dias de hoje, a uma contínua degradação da organização interna do estado dito soberano, sempre mais e mais centralizado, marcado por sucessivas tendências (de política) ensaiadas que de pouco ou nada valeram.
As configurações das 6 províncias tradicionais nasceram na Idade Média e, como as imagens revelam, sofreram alterações de alguma relevância como sejam as definições espaciais das Beiras, da Estremadura, de Trás-os-Montes e Beira Interior e do Douro Minho. O papel importante desempenhado sobretudo pelos rios Douro e Tejo, que hoje se reconhecem como unificadores regionais e, então, eram de divisão administrativa, constitui também facto assinalável.
Na Idade Média, a edificação dos mapas geográficos e administrativos constituía tarefa deixada aos coreógrafos, que (com brio profissional e competência) nos legaram mapeamentos assertivos, tais como os três passados em revista. Com o 25 de Abril de 1974, ocorreu uma vaga de fundo (tornada banal) de correntes políticas regionalistas, pretensamente descentralizadoras. Não faltaram autores a propor figurinos, os mais diversos, não compatíveis com um real processo regional.
A consciencialização dos cidadãos da sua identidade regional, sabe-se, encontra-se muito desgastada, é frequentemente menosprezada em favorecimento da nacionalidade, como se a pátria regional tivesse menos valor ou fosse irrelevante. O processo de regionalização não dispensa uma identidade regional forte, é certo; mas este fator, por si só, não conduz ao êxito de alguma mudança do estado centralista para um estado descentralizado, autónomo e participado.
Em 1985, tivemos oportunidade de apresentar publicamente um estudo que demorou alguns anos a ficar concretizado, mas sobre o qual, em matéria de resultados obtidos que interessa serem confrontados, se expõem 3 mapas assinalados como Mapas 4, 5 e 6. Constituem três versões das seis regiões batizadas Regiões Fundamentais, estruturantes do espaço social regional do Continente. Já lá vão cerca de 30 anos e uma réplica produzida, bem se justifica.
Não temos dúvidas em afirmar que os três mapas (3 alternativas), grosso modo, apontam em uníssono para delimitações regionais concordantes, pese embora serem unidades distintas. As designações regionais nos três mapas abaixo, 4, 5 e 6 e, depois, nos três últimos 7, 8 e 9, são sempre as mesmas já conhecidas, a saber (ver numeração no Mapa 4): 1) Douro-Minho, 2) Trás -os -Montes e Beira Interior, 3) Beira Litoral, 4) Estremadura, 5) Alentejo e 6) Algarve.
Observe-se nestes mapas, à exceção do primeiro (Mapa 4) que foi adicionalmente analisado com um modelo de Análise Discriminante, a fim de fazer desaparecer os clusters contendo apenas um elemento, ou pequenos clusters em situação de isolamento e sem escala regional, que a presença de tal facto não mascara ou desfaz a mensagem regional. As grandes manchas homogéneas (indicadoras de espaço regional) surgem com incongruências, mas a continuidade é mandatória.
Observe-se que o Douro-Minho ultrapassa sempre o rio Douro para sul e desce ao Entre Vouga e Douro. Atravessando o Douro e subindo (depois) pelo vale do Tâmega (limite oriental da sua bacia) entra em Espanha para reivindicar a sua outra parcela galega. Trás-os-Montes e Beira Interior faz fronteira com o Douro-Minho e com Espanha a norte e a este. Estende-se para sul pelo interior, de Castro Daire a Idanha-a-Nova, num caso, e ao complexo da Serra da Estrela, nos outros.
A Beira Litoral estende-se da zona de Aveiro às Caldas da Rainha, prolonga-se para o interior nos três mapas, com afetação dos concelhos de Nisa, Castelo de Vide, Marvão e Portalegre nas variantes dos Mapas 5 e 6. De resto, faz fronteira com o Douro-Minho e com Trás-os-Montes e Beira Interior. A Estremadura fica a sul da Beira Litoral com a qual faz fronteira e também com o Alentejo a oeste. Prolonga-se pelo litoral até Santiago do Cacém, em dois casos, e, até Odemira, noutro caso.
O Alentejo de largas extensões municipais e regional situa-se a sul da Beira Litoral, a noroeste e este com a Estremadura (conforme os Mapas em escrutínio) e a norte do Algarve, com todos os quais faz fronteiras de contiguidade. O Algarve, por último, a sul do Alentejo, encalacrado entre as serras de Monchique e do Caldeirão e o Atlântico, não deixa de ser heterogéneo no seu espaço geográfico, com um litoral diferente do espaço serrano e, até, um Barlavento e um Sotavento desiguais.
Para contrastar com estas realizações regionais percorridas há, finalmente, outras três que se lhes seguem, Mapas 7, 8 e 9, também apontando (em simultâneo) na mesma direção regional, ou seja, recomendando um recorte territorial que parece impor-se seguindo o padrão já reconhecido. As zonas fronteiriças das circunscrições administrativas, constituem sempre territórios de transição que tanto podem incluir-se numa como noutra circunscrição da vizinhança.
Uma região composta por dois ou mais espaços separados ou descontínuos (ao nível sub-nacional) não faz sentido e não tem aceitação. Tal implica que os estratos formados por elementos isolados (municípios ou pequenos grupos de municípios) são facilmente descartáveis por integração em espaços mais alargados. As idiossincrasias regionais não podem ser confundidas com as idiossincrasias sub-regionais. Estas últimas são importantes ao nível do planeamento intermunicipal.
Os Mapas 7, 8 e 9 abaixo dão-nos conta das mesmas seis regiões já acima comentadas, embora apresentem recortes delimitadores algo mais difusos, que se reproduzem tal e qual como o modelo de Ward utilizado os formatou. Sendo estes espaços regionais desprovidos dos elementos de descontinuidade que encerram, têm-se novamente reconstruídos os espaços regionais de cima. Esta constatação confirma o estudo de 1985 e radica nas províncias medievais (ver os Mapas 1,…,9).
Anote-se que os indicadores utilizados em1985 e hoje, diferem na fonte de recolha e na própria definição intrínseca. Então, a base de dados inicial comportou 416 indicadores observados em 274 municípios; a presente réplica, já se referiu, comporta 339 indicadores inicialmente selecionados para 278 municípios. Os indicadores, na sua grande maioria, têm designações e aferem propriedades, fenómenos (ou idiossincrasias) diferentes nos dois estudos.
Pela sua profusão em número, no entanto, os indicadores escrutinados cobrem muito para além da informação mínima exigida para validar o conhecimento detalhado das unidades (municípios) observados. É verdade que as realidades da Idade Média, de 1985 e de hoje, são incontornavelmente diferentes, não fossem as mudanças sociais operarem continuamente no tempo e no espaço. Mas uma coisa conseguiu-se demonstrar, que está na estabilidade (radical) regional indelével.
Os Mapas 7 e 8 abaixo são os dois mais semelhantes dos três, embora obtidos com informação ligeiramente diferente: o primeiro é originado pela classificação (em oito clusters) de oito CPs (entre 27 no total) extraídos dos primeiros 102 indicadores dotados de correlacionamentos (informação) crescentes; o segundo tem origem na classificação em 8 clusters de 6 CPs (entre 27 no total) extraídos dos primeiros 102 indicadores dotados de menores redundâncias informativas.
O terceiro (ver Mapa 9), algo menos perentório (menos taxativo) na medida em que realça menos o Douro-Minho e a Estremadura e expande em demasia a Beira Litoral, mostra-se (ainda assim) claro na mensagem mais forte das seis regiões. Esta versão teve a sua génese na classificação em 7 clusters, de 6 CPs (de um total de 22) extraídos dos primeiros 68 indicadores menos redundantes (mais parcimoniosos). A heterogeneidade do Algarve fica bem evidenciada.
Vale a pena referir que muitos outros ensaios poderiam ser ilustrados neste contexto, houvesse espaço mais alargado para adicional discussão. Diga-se que, para além destes três, em linha consonante com os anteriores passados em revista, merecem comentário algumas versões mapeadas de informação redundante, em que a faixa litoral (atlântica) e o litoral algarvio, em contraste com o interior do País mais ou menos expandido, aparecem como modelos da realidade.
Trata-se, infelizmente, da situação bem conhecida da estratificação dominante no espaço continental bipolar: uma faixa litoral descontínua de concentração e algum crescimento económico e um interior em desertificação e moribundo. De realçar que esta divisão territorial maniqueísta, obtida paulatinamente ao longo de séculos e intensificada nas últimas décadas, é a única que é aceite pelas políticas do crescimento económico a qualquer preço, mesmo sem ordenamento planeado.
Aparece também outro tipo de mapeamento dos concelhos, de feição claramente aleatório, provocado por informação aferida em relações de natureza pouco ou nada correlacionadas, linearmente independentes. Vale a pena recordar que independência linear inexistente (nula) não implica independência a níveis superiores de relacionamento, antes, esta última situação implica independência a todos os níveis inferiores, incluindo o primeiro, de função linear do primeiro grau.
Observe-se que, dados os 278 concelhos como unidades de observação, uma relação linear relativamente módica, quando aferida através do coeficiente de correlação de Pearson, se torna extremamente significante para valores numéricos logo acima de +0.11 ou abaixo de -0.11. Como os limites extremos são dados por ±1, adivinha-se mais facilmente que o valor aferido dos coeficientes da maioria das correlações se situe dentro destes dois intervalos.
Pode concluir-se que, quanto maior for o número de observações realizadas, menor (mais baixo em módulo) se torna o valor dos coeficientes capazes de passar o teste da extrema significância (grande intensidade) da relação de associação entre os indicadores envolvidos. Os métodos estatísticos paramétricos foram desenvolvidos para valores de observação elevados, suficientes para não se incorrer no erro de tipo-II da decisão que consiste em aceitar uma hipótese falsa.
Concluindo, a informação bruta dos indicadores recolhidos, nomeadamente em bancos de dados muito abundantes, corre o risco muito elevado de ser eivado de informação redundante. A fim de evitar a repetição da informação (evitar indicadores homólogos), há que proceder a diferentes filtrações da informação, tal como foram descritas acima. A redundância de informação mascara a realidade e implica as estratégias metodológicas (modelos) utilizados.
Por outro lado, se a informação bruta dos indicadores recolhidos for exclusivamente constituída por relações de independência, ainda que de aferição exclusivamente linear, temos como resultados mais frequentes (das classificações efetuadas) mapeamentos relativamente caóticos, sob um manto visível de aleatoriedade sem nexo. Os resultados de aplicações de modelos econométricos bem-sucedidas, produzem frequentemente dados residuais aleatórios.
No estudo descrito, a chave do êxito experimental reportado está na sensibilidade de se ter conseguido uma combinação de indicadores (uma mistura ou uma seleção) contendo uma informação relativamente concentrada e compacta, não sendo de natureza redundante nem extremamente parcimoniosa, que permita identificar uma estrutura fiável e estável dos dados representados pelas unidades de observação, ou seja, dos 278 municípios considerados.
Os dados originais abundantes podem diferir, os diversos crivos de filtração aplicados produzem diversos feixes informativos que, por classificações obtidas de modelos com semelhantes prestações, com alta probabilidade incorporada produzem (por análise classificatória) estruturas (dos elementos observados) coesas e estáveis. Que tais estruturas assim descortinadas, tenham ou tenham tido representação (espacial) territorial, não pode ser tomado como pura coincidência.
Pode constatar-se, ao longo dos tempos, uma sucessiva litoralização dos espaços urbanos com simultânea interiorização dos espaços rurais expostos, sofrendo sucessivas hemorragias humanas. É nosso propósito dar continuidade a este estudo, replicando o plano experimental (adotado) em cada uma das 6 regiões identificadas (sub-nacionais) a fim de inventariar demarcações espaciais de associações sub-regionais (supramunicipais) que possam ser alternativa às CIMs.
IV) REFERÊNCIAS BIBLIOGRÁFICAS
ANDERBERG, M.R., Cluster Analysis for Applications, Academic Press, 1973.
CALDAS, E. C., Loureiro, M. S. e outros, Regiões Homogéneas no Continente Português., Fundação Calouste Gulbenkian,Lisboa,1966.
FIGUEIREDO, E. V. S., Treatment of Missing Values in MacQueen’s Clustering Method, Department of Statistics, Lunds Univ., 1981.
LOPES, A. S., Desenvolvimento Regional, Vol. I/Problemática, Teoria, Modelos, Fundação Calouste Gulbenkian,Lisboa,1978.
MINGOTI, S. A.; Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada, Editora UFMG, 2005.
OLSEN, S. M., Regional Analysis, vol. II, Social Systems, autores vários, Ed. Carol A. S., Academic Press,1976.
RAO, C. R. Linear statistical inference and its applications, New York: John Wiley, 1973. 522p.
SHARMA, S. Applied multivariate techniques, New York: John Wiley & Sons, 1996.
WARD, J. H. Hierarchical grouping to optimize an objective function, Journal of the American Statistical Association, v. 58, p. 236 – 244. Mar. 1963.