4  Essayer MOSAIKS

4.1 Aperçu

Cette démo reproduit les résultats clés de la publication originale de MOSAIKS (Rolf et al. 2021). Alors que MOSAIKS a un grand potentiel pour améliorer l’accès à la prédiction par satellite dans des régions avec de faibles données, l’article d’origine s’est concentré sur la démonstration de performances aux États-Unis où des données d’entraînement de haute qualité étaient facilement disponibles.

Les États-Unis ont servi de terrain d’essai idéal pour plusieurs raisons:

  • De nombreuses données de vérité au sol disponibles sur plusieurs variables
  • référence spatiale fiable des données
  • Divers paysages et environnements construits
  • Capacité à comparer les méthodes existantes
  • Validation systématique des prédictions

Cette validation dans un environnement riche en données était cruciale pour établir des MOSAIKS comme un outil fiable avant de les déployer dans des contextes où les données de vérité au sol sont rares ou peu fiables.

4.2 code de démonstration

4.2.1 Workflow

Vous trouverez ci-dessous un lien vers un Jupyter Notebook destiné à démontrer l’utilisation pratique des mosaïques avec des données réelles.En fait, ce notebook utilise les données d’entrée et les features d’origine de Rolf et al.2021. Le code démontre:

  1. Chargement des fonctionnalités et étiquettes de MOSAIKS pré-calculés
  2. Fusion des features et des étiquettes
  3. Formation d’un modèle de régression de la crête
  4. Évaluation des prédictions
  5. Visualiser les résultats

4.2.2 Données d’étiquette

La démo présente MOSAIKS prédisant plusieurs variables et avec un sous-ensemble des données utilisées dans le papier d’origine. Les variables incluent:

Figure 4.1: Données d’entrée de la couverture forestière (à gauche) de Global Land Analysis & Discover (GLAD) Global 2010 Tree Cover (30 m)
Figure 4.2: Données d’entrée d’altitude (à gauche) fournies par Mapzen, et accessible via le service de carreaux de terrain Amazon Web Services (AWS). Le code de téléchargement peut être trouvé ici.
Figure 4.3: Données d’entrée de densité de population (à gauche) de l’ensemble de données Gridded Population of the World (GPW).Ces données sont accessibles ici.
Figure 4.4: Nighttime Lights Luminosité Données d’entrée (à gauche) générées par l’imagerie satellite nocturne, qui est fournie par le groupe d’observations de la Terre à la National Oceanic and Atmospheric Administration (NOAA) et au National Geophysical Data Center (NGDC).Ces données sont accessibles ici.
Figure 4.5: Données sur l’apport de revenus (à gauche) de l’American Community Survey (ACS) Estimations à 5 ans du revenu annuel médian des ménages en 2015. Ces données sont accessibles à l’aide du package ACS Dans R (48), numéro de tableau B19013
Figure 4.6: Données d’entrée de la longueur des routes (à gauche) de l’ensemble de données national des transports du United States Geological Survey (USGS), qui est basé sur les données Tiger / Line fournies par le Bureau du recensement américain en 2016. Ces données sont accessibles ici.

Un utilisateur doit simplement sélectionner la variable qu’il souhaite prévoir, et aucune autre modification ne doit être apportée au code.Toutes les données ont été prétraitées et le code téléchargera les fichiers nécessaires à partir de Zenodo.

4.2.3 Contraintes

Pour rester dans les limites de niveau libre de la mémoire Colab, nous sous-ensembles les données.Nous prenons un échantillon aléatoire de 50% des deux fonctionnalités (K=4000 au lieu de 8192) et des observations (N=50000 au lieu de 100000) par rapport au papier d’origine. Malgré l’utilisation de cet ensemble de données réduit, la démo obtient toujours de fortes performances prédictives, mettant en évidence l’efficacité de MOSAIKS.

4.3 Exécutez le code!

Cliquez sur l’insigne pour exécuter la démonstration!

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
Ouvrir dans Colab
N’oubliez pas de cliquer sur Fichier -> Enregistrez une copie dans Drive pour enregistrer toutes les modifications que vous apportez.
— Ou pour afficher une version statique du code sur GitHub, cliquez sur l’insigne ci-dessous.

Pour les instructions et les conseils sur l’utilisation de Google Colab, veuillez vous référer à Chapitre 1.

4.4 Vous ne voulez pas exécuter de code?

Pensez plutôt à regarder cette démonstration!

Figure 4.7: Un aperçu des MOSAIKS et une démonstration en direct de la génération de nouvelles prédictions à l’aide du système.Vidéo enregistrée par la télédétection planétaire généralisée cigare - Session de convention 2020.Présenté par Esther Rolf et Tamma Carleton.

4.5 Quelle est la prochaine étape?

Après avoir établi les capacités de MOSAIKS dans le contexte américain, l’équipe de développement de MOSAIKS a réussi à démontrer le système dans de nombreux contextes supplémentaires. Cela inclut à l’échelle globale ou dans les paramètres avec des données de qualité inférieure ou de faible qualité.Dans les prochains chapitres, nous explorerons certaines de ces applications, montrant comment les MOSAIKS peuvent aider à combler les lacunes de données dans les régions où la collecte traditionnelle des données est difficile ou coûteuse.

À venir

Dans la section suivante, nous examinerons de plus près les données d’étiquette qui peuvent être utilisées avec MOSAIKS.