Geoportal Fronterizo
Metodología
Adquisición de Datos

Los datos de entrada que se publicarán en el Geoportal pueden ser obtenidos de los sitios web de las agencias de gobierno de forma gratuita. Éstos serán seleccionados mediante un proceso que deberá documentarse. El formato original en el que se encuentren los datos puede ser espacial (.shp, .gdb, geojson, etc.) o no espacial, como archivos con formato de base de datos, archivos tabulares (.dbf, .xslx, .dat. etc.) y otros documentos con formatos no estructurados (como .pdf, .ppt, .doc, jpg, bmp, etc.).
Puesto que la calidad de la información que se genere y publique en el Geoportal es función directa de la calidad de los datos, es necesario que el proceso de selección de datos incluya solamente aquellos datos que cuenten con Metadatos, y en función de lo que contengan los metadatos se tomará la decision de incluir o no dichos datos.
Procesamiento de Datos

Una vez que los datos han sido seleccionados será necesario iniciar un proceso de normalización de datos. Este proceso incluye etapas de perfilado, diagnóstico, plan de trabajo, limpieza y estructuración, organización y documentación.
- Perfilamiento de los datos. El perfilamiento de datos se refiere al análisis de los datos para clarificar su estructura, contenido, relaciones y reglas asociadas. La creación de perfiles ayuda a comprender anomalías y evaluar la calidad de los datos.
- Diagnóstico y plan de trabajo. Una vez que se haya realizado el perfilamiento de los datos, se elaborará un diagnóstico y un plan de trabajo que priorice y especifique las actividades y el tiempo requerido para la limpieza de los conjuntos de datos.
- Limpieza y estructuración de los datos. Se ejecutará el plan de trabajo para la limpieza y estructuración de los datos. Para este fin se seguirán los procedimientos definidos previamente donde se indicarán las transformaciones. Para ello se pueden utilizar herramientas de ETL, consultas SQL o funciones definidas.
- Organización de los datos. Implica diseñar taxonomías y reglas para organizar los conjuntos de datos.
- Documentación de los datos. Implica la utilización de un esquema de metadatos para actualizar el linaje de los datos y otros atributos.
Repositorio de Datos

Un repositorio de datos es una base de datos relacional diseñada para consultas y análisis en lugar del procesamiento de transacciones. Por lo general, contiene datos históricos derivados de datos transaccionales pudiendo incluir datos de otras fuentes. Los repositorios de datos separan la carga de trabajo del análisis de la carga de trabajo de la transacción y permiten que una organización consolide datos de varias fuentes. Además de tratarse de una base de datos relacional, el ambiente de un repositorio de datos incluye la extracción, transformación y carga (ETL), un motor de procesamiento analítico en línea (OLAP), herramientas de análisis y otras aplicaciones que gestionan el proceso de recopilación de datos y entrega a los usuarios.
Publicación y distribución de los Datos

Una vez que los datos se encuentren en en el repositorio de datos, puede iniciarse el proceso de diseño cartográfico para su publicación en el Geoportal, con las siguientes etapas principales:
- Diseño de estilos para la representación de datos geográficos. Deberá realizarse y documentarse el diseño cartográfico de cada capa que se quiera publicar en el Geoportal. Para documentar la simbología de la capa deberá utilizarse un formato definido previamente.
- Publicación de capas en el Geoportal. Esta actividad implica la carga de las capas de datos geográficos en el Repositorio de datos y su configuración para el correcto despliegue dentro de los Geotemas del Geoportal. Se deberá seguir el procedimiento que se defina para este fin.
- Revisión y validación de la publicación de datos. Deberá realizarse un conjunto de pruebas de calidad para verificar que los datos hayan sido correctamente publicados. Para este fin deberá seguirse el procedimiento que se defina.
Los mecanismos de entrega de datos del Geoportal son diversos y se relacionan directamente con las tecnologías de información y comunicación (TIC) y con las normas de facto internacionales cuyo diseño está a cargo del Consorcio Abierto Geoespacial (OGC Open Geospatial Consortium). Como mecanismos, destacan los llamados Catálogos también llamados Directorios de Datos Espaciales, que permiten la búsqueda de datos espaciales en Internet, mediante un número de servidores que contienen metadatos acerca de datos espaciales existentes (no necesariamente disponibles gratuitamente) y que permiten buscar, visualizar, transferir, solicitar, promover y diseminar datos espaciales de diferentes fuentes vía Internet y proporcionar servicios complementarios
Otros mecanismos asociados con las tecnologías de información y comunicación son los Servicios Web, de los que puede considerarse hacer uso del servicio Web de Mapas, (WMS, Web Map Service), del de Rasgos (WFS, Web Feature Service), y del de Catálogo (CSW, Catalog Service for the Web). Considérese que la implementación de estos servicios se requiere de herramientas de software que cumplen los estándares del OGC y que pueden integrarse y ser accesibles a través del Geoportal. El Modelo considera que las herramientas de implementación sean de software libre.
La distribución de datos considera dos modos: el primero es transferencia de archivos mediante protocolo de internet bajo un acuerdo entre el cliente y los líderes del Geoportal. El segundo modo puede ser la distribución como datos abiertos, para lo que se requiere que el Geoportal se implemente con las herramientas que permitan descargar los archivos de datos en formatos abiertos.