Estimation de la Biomasse Aérienne avec le Package BIOMASS • CafriplotsR

Aperçu

Cette vignette montre comment utiliser CafriplotsR avec le package BIOMASS pour estimer la biomasse aérienne (AGB) des parcelles forestières permanentes. La fonction query_plots() avec output_style = "permanent_plot" fournit des structures de données optimisées pour les analyses allométriques.

Avantages clés du flux de travail intégré :

Enrichissement automatique des traits - La densité du bois et autres traits sont pré-intégrés
Table hauteur-diamètre prête à l’emploi - Table $height_diameter fournie par défaut
Sortie structurée - Tables séparées pour les métadonnées, individus et mesures
Hiérarchies taxonomiques - Héritage des traits de l’espèce → genre → famille

Prérequis

library(CafriplotsR)
library(BIOMASS)
library(dplyr)
library(ggplot2)

# Se connecter à la base de données
mydb <- call.mydb()
mydb_taxa <- call.mydb.taxa()

Étape 1 : Extraire les Données de Parcelles

Utilisez output_style = "permanent_plot" pour obtenir une sortie structurée optimisée pour l’analyse de biomasse :

# Interroger les parcelles permanentes avec les données individuelles
plot_data <- query_plots(
  plot_name = c("bouamir001", "mbalmayo001"),  # Parcelles exemples
  extract_individuals = TRUE, ## extraire les individus/tiges
  method = "1ha-IRD",
  con = mydb,
  census_strategy = "first", ## obtenir le premier recensement (s'il y en a plusieurs) - dans ce cas, parce que les hauteurs d'arbres ont été mesurées lors du premier recensement
  ## Si wd n'est pas disponible pour l'espèce, la moyenne de wd par genre est attribuée aux espèces appartenant à ce genre
  ## si wd n'est pas disponible au niveau du genre, la moyenne de la parcelle est donnée
  ## génère une colonne qui indique la source de l'information
  traits_to_genera = TRUE
)
#> ── Building plot filter query ──────────────────────────────────────────────────
#> ℹ Attempt 1 of 10...
#> ✔ ✅ Successfully connected and fetched 2 rows.
#> 
#> ── Querying plot features ──
#> 
#> ✔ Found 115 feature(s) for 2 plot(s)
#> ℹ Enriching with subplot observation features
#> 
#> ── Aggregating features to wide format ──
#> 
#> ✔ Query completed
#> ── Processing individuals ──────────────────────────────────────────────────────
#> ℹ Selected first census date column: date_census_1
#> ℹ Fetching individuals
#> ✔ Processed 888 individuals
#> ── Processing traits ───────────────────────────────────────────────────────────
#> ℹ Enriching with individual-level traits
#> 
#> ── Fetching individual features ──
#> 
#> ── Fetching trait measurements ──
#> 
#> ℹ Removed 283 measurement(s) with issues
#> ℹ Enriching with census information for first census selection
#> ✔ Selected first census for 2 plot(s)
#> ℹ Filtered out 3683 measurement(s) from other censuses
#> ✔ Query completed: 6110 measurement(s)
#> 
#> ── Aggregating features by individual ──
#> 
#> ℹ Aggregating 4597 numeric measurement(s)
#> ℹ Aggregating 1513 character measurement(s)
#> ✔ Aggregated 888 individual(s)
#> ℹ Enriching with taxonomic-level traits
#> 
#> ── Querying taxa-level traits ──
#> 
#> ℹ Fetching trait measurements for 154 taxon/taxa
#> ✔ Found 2790 measurement(s) for 140 taxa
#> ℹ Resolving taxonomic synonyms
#> 
#> ── Processing traits to wide format ──
#> 
#> ℹ Aggregating numeric traits
#> ℹ Aggregating categorical traits (mode)
#> ✔ Query completed
#> ✔ Added 12 numeric taxonomic trait column(s)
#> ✔ Added 14 categorical taxonomic trait column(s)
#> ℹ Aggregating traits to genus level
#> ℹ Source information added to columns starting with 'source_'
#> ℹ Attempt 1 of 10...
#> ✔ ✅ Successfully connected and fetched 10247 rows.
#> ℹ Attempt 1 of 10...
#> ✔ ✅ Successfully connected and fetched 6088 rows.
#> 
#> ── Querying taxa-level traits ──
#> 
#> ℹ Fetching trait measurements for 13103 taxon/taxa
#> ✔ Found 14335 measurement(s) for 2369 taxa
#> ℹ Resolving taxonomic synonyms
#> ℹ Including synonyms: 2369 taxa expanded to 5861 taxa
#> ℹ Adding taxonomic information
#> ✔ Query completed
#> ℹ Setting wood density SD to averaged species and genus level according to BIOMASS dataset
#> ! ids removed - remove_ids = TRUE
#> ℹ Auto-detected output style: 'permanent_plot' based on method field
#> ✔ Output restructured using 'permanent_plot' style. Use names() to see available tables.


# Vérifier la structure
names(plot_data)
#> [1] "metadata"        "individuals"     "height_diameter"
# $metadata - Informations au niveau de la parcelle
# $individuals - Données d'arbres individuels avec traits
# $height_diameter - Paires hauteur-diamètre (prêtes pour la modélisation)

Le style de sortie permanent_plot fournit :

$metadata : Coordonnées de parcelle, superficie, dates de recensement, investigateurs
$individuals : Inventaire complet des arbres avec traits taxonomiques
$height_diameter : Paires hauteur-diamètre pré-filtrées pour la modélisation allométrique

Étape 2 : Explorer les Données

Données d’Arbres Individuels

La table des individus inclut des traits automatiquement enrichis :

# Vérifier quelles données nous avons
str(plot_data$individuals)
#> tibble [888 × 19] (S3: tbl_df/tbl/data.frame)
#>  $ id_n                           : int [1:888] 248314 248318 248322 248326 248330 248334 248338 248342 248346 248350 ...
#>  $ plot_name                      : chr [1:888] "bouamir001" "bouamir001" "bouamir001" "bouamir001" ...
#>  $ tag                            : num [1:888] 1 2 3 4 5 6 7 8 9 10 ...
#>  $ family                         : chr [1:888] "Annonaceae" "Lecythidaceae" "Olacaceae" "Annonaceae" ...
#>  $ genus                          : chr [1:888] "Xylopia" "Petersianthus" "Heisteria" "Greenwayodendron" ...
#>  $ species                        : chr [1:888] "Xylopia quintasii" "Petersianthus macrocarpus" "Heisteria parvifolia" "Greenwayodendron suaveolens" ...
#>  $ dbh                            : num [1:888] 17.7 62.4 57.7 25.9 22.8 ...
#>  $ quadrat                        : chr [1:888] "0_0" "0_0" "0_0" "0_0" ...
#>  $ height                         : num [1:888] 12.8 NA NA NA NA ...
#>  $ census_date                    : Date[1:888], format: "2018-12-02" "2018-12-02" ...
#>  $ taxa_mean_wood_density         : num [1:888] 0.76 0.68 0.668 0.668 0.55 ...
#>  $ taxa_n_wood_density            : num [1:888] 5 10 NA NA 1 NA 3 1 4 1 ...
#>  $ taxa_sd_wood_density           : num [1:888] 0.0708 0.0708 0.0796 0.0796 0.0708 ...
#>  $ source_taxa_mean_wood_density  : chr [1:888] "species" "species" "plot_mean" "plot_mean" ...
#>  $ source_taxa_n_wood_density     : chr [1:888] "species" "species" NA NA ...
#>  $ source_taxa_sd_wood_density    : chr [1:888] "species" "species" "plot_mean" "plot_mean" ...
#>  $ taxa_sd_wood_density_plot_level: num [1:888] 0.0796 0.0796 0.0796 0.0796 0.0796 ...
#>  $ pom                            : num [1:888] 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.8 3.3 1.3 ...
#>  $ observations                   : chr [1:888] NA "rejets" NA NA ...

# Colonnes clés pour la biomasse :
# - dbh (stem_diameter) : Diamètre à hauteur de poitrine (cm)
# - species (tax_sp_level) : Nom de l'espèce
# - wood_density_mean (taxa_mean_wood_density) : Densité moyenne du bois (g/cm³)
# - wood_density_sd (taxa_sd_wood_density) : Écart-type pour la propagation d'erreur
# - source_taxa_mean_wood_density (taxa_sd_wood_density) : source d'information pour la densité du bois

# Résumé de la disponibilité de la densité du bois
plot_data$individuals %>%
  summarise(
    n_total = n(),
    n_with_wd = sum(!is.na(taxa_mean_wood_density)),
    pct_with_wd = round(100 * n_with_wd / n_total, 1),
    mean_wd = mean(taxa_mean_wood_density, na.rm = TRUE)
  )
#> # A tibble: 1 × 4
#>   n_total n_with_wd pct_with_wd mean_wd
#>     <int>     <int>       <dbl>   <dbl>
#> 1     888       888         100   0.691

Note : Les traits de densité du bois sont automatiquement : - Récupérés de la base de données taxonomique - Hérités de l’espèce → genre → famille quand les données au niveau de l’espèce ne sont pas disponibles - Moyennés au niveau de la parcelle quand aucune correspondance taxonomique n’est trouvée (si traits_to_genera = TRUE)

Données Hauteur-Diamètre

La table $height_diameter est pré-filtrée et prête pour la modélisation :

# Paires hauteur-diamètre (automatiquement filtrées)
head(plot_data$height_diameter)
#> # A tibble: 6 × 6
#>     id_n plot_name    tag     D     H   POM
#>    <int> <chr>      <dbl> <dbl> <dbl> <dbl>
#> 1 248314 bouamir001     1  17.7  12.8   1.3
#> 2 248334 bouamir001     6  22.2  15.7   1.3
#> 3 248342 bouamir001     8  38.4  28.4   1.8
#> 4 248346 bouamir001     9 123.   40.4   3.3
#> 5 248370 bouamir001    15  48.7  25.8   1.3
#> 6 248410 bouamir001    25  11.2  10.5   1.3

# Cette table inclut :
# - id_n : ID de l'individu
# - plot_name : Identifiant de la parcelle
# - tag : Numéro de l'arbre
# - D : Diamètre (dhp en cm)
# - H : Hauteur (hauteur de l'arbre en m)
# - POM : Point de mesure (si disponible)

# Résumé
plot_data$height_diameter %>%
  group_by(plot_name) %>%
  summarise(
    n_pairs = n(),
    mean_dbh = round(mean(D), 1),
    mean_height = round(mean(H), 1),
    dbh_range = paste(round(min(D), 1), "-", round(max(D), 1)),
    height_range = paste(round(min(H), 1), "-", round(max(H), 1))
  )
#> # A tibble: 2 × 6
#>   plot_name   n_pairs mean_dbh mean_height dbh_range    height_range
#>   <chr>         <int>    <dbl>       <dbl> <chr>        <chr>       
#> 1 bouamir001       76     28.9        20.4 10.9 - 122.9 8.9 - 40.4  
#> 2 mbalmayo001      46     33.2        24.7 10.3 - 134   10.7 - 41.1

Étape 3 : Construire les Modèles Hauteur-Diamètre

Utilisez la table $height_diameter pré-filtrée directement avec BIOMASS :

Option A : Modèle Unique (Toutes Parcelles)

# Ajuster un modèle hauteur-diamètre global
hd_model_global <- BIOMASS::modelHD(
  D = plot_data$height_diameter$D,
  H = plot_data$height_diameter$H,
  method = "weibull",
  useWeight = TRUE
)

# Vérifier l'ajustement du modèle
summary(hd_model_global)
#>              Length Class  Mode     
#> input          2    -none- list     
#> model          6    nls    list     
#> residuals    122    -none- numeric  
#> coefficients  12    -none- numeric  
#> R.squared      0    -none- NULL     
#> formula        7    -none- call     
#> method         1    -none- character
#> predicted    122    -none- numeric  
#> RSE            1    -none- numeric

# Erreur standard résiduelle pour la propagation d'incertitude
RSE_global <- hd_model_global$RSE
print(paste("RSE :", round(RSE_global, 3)))
#> [1] "RSE : 5.029"

Option B : Modèles Spécifiques par Parcelle

Pour les parcelles avec suffisamment de mesures de hauteur (>15 paires recommandées) :

# Construire des modèles séparés par parcelle
hd_models_by_plot <- plot_data$height_diameter %>%
  group_by(plot_name) %>%
  filter(n() >= 15) %>%  # Exiger au moins 15 paires H-D
  group_split() %>%
  lapply(function(plot_df) {
    tryCatch({
      model <- BIOMASS::modelHD(
        D = plot_df$D,
        H = plot_df$H,
        method = "weibull",
        useWeight = TRUE
      )
      list(
        plot_name = unique(plot_df$plot_name),
        model = model,
        RSE = model$RSE,
        n = nrow(plot_df)
      )
    }, error = function(e) {
      NULL  # Retourner NULL si le modèle échoue
    })
  }) %>%
  Filter(Negate(is.null), .)  # Supprimer les modèles échoués

# Résumé
cat(sprintf("Construit %d modèles spécifiques par parcelle\n", length(hd_models_by_plot)))
#> Construit 2 modèles spécifiques par parcelle

Visualiser les Relations H-D

# Tracer les données hauteur-diamètre avec la courbe ajustée
ggplot(plot_data$height_diameter, aes(x = D, y = H)) +
  geom_point(aes(color = plot_name), alpha = 0.6, size = 2) +
  geom_smooth(method = "nls",
              formula = y ~ a * (1 - exp(-b * x^c)),
              method.args = list(start = list(a = 40, b = 0.05, c = 1)),
              se = TRUE, color = "black", linewidth = 1.5) +
  labs(
    title = "Relation Hauteur-Diamètre",
    x = "Diamètre à hauteur de poitrine (cm)",
    y = "Hauteur de l'arbre (m)",
    color = "Parcelle"
  ) +
  theme_minimal() +
  theme(legend.position = "bottom")
#> Warning: Failed to fit group -1.
#> Caused by error in `pred$fit`:
#> ! $ operator is invalid for atomic vectors

Étape 4 : Prédire les Hauteurs Manquantes

La plupart des arbres n’ont pas de mesures de hauteur. Utilisez le modèle H-D pour les prédire :

# Préparer les données pour l'estimation AGB
agb_data <- plot_data$individuals %>%
  filter(!is.na(dbh)) %>%  # Doit avoir un diamètre
  mutate(
    # Prédire la hauteur en utilisant le modèle global (ou spécifique à la parcelle si disponible)
    H_predicted = BIOMASS::retrieveH(
      D = dbh,
      model = hd_model_global
    )$H,
    # Utiliser la hauteur mesurée si disponible, sinon prédite
    H_final = ifelse(!is.na(height), height, H_predicted),
    # Assigner RSE pour l'incertitude
    H_RSE = RSE_global
  )

# Vérifier le succès de la prédiction
agb_data %>%
  summarise(
    n_total = n(),
    n_measured = sum(!is.na(height)),
    n_predicted = sum(is.na(height)),
    pct_predicted = round(100 * n_predicted / n_total, 1)
  )
#> # A tibble: 1 × 4
#>   n_total n_measured n_predicted pct_predicted
#>     <int>      <int>       <int>         <dbl>
#> 1     834        122         712          85.4

Utiliser des modèles spécifiques par parcelle (si disponibles) :

# Créer une table de correspondance pour le RSE spécifique par parcelle
plot_rse <- data.frame(
  plot_name = sapply(hd_models_by_plot, function(x) x$plot_name),
  RSE_plot = sapply(hd_models_by_plot, function(x) x$RSE)
)

# Prédire avec des modèles spécifiques par parcelle où disponibles
agb_data <- agb_data %>%
  filter(!is.na(dbh)) %>%
  left_join(plot_rse, by = "plot_name") %>%
  mutate(
    # Utiliser le RSE spécifique par parcelle si disponible, sinon global
    H_RSE = ifelse(!is.na(RSE_plot), RSE_plot, RSE_global),
    # Prédire les hauteurs (nécessiterait de boucler sur les modèles spécifiques par parcelle)
    H_final = ifelse(!is.na(height), height, H_predicted)
  )

Étape 5 : Estimer la Biomasse Aérienne

Nous avons maintenant toutes les entrées requises pour BIOMASS :

D : Diamètre (dhp)
WD : Densité du bois (automatiquement depuis la base de données !)
H : Hauteur (mesurée ou prédite)
Erreurs : Écart-type pour la densité du bois, RSE pour la hauteur

Vérifier la Complétude des Données

# Résumé des variables requises
summary(agb_data[, c("dbh", "taxa_mean_wood_density", "H_final", "H_RSE")])
#>       dbh        taxa_mean_wood_density    H_final          H_RSE      
#>  Min.   : 10.0   Min.   :0.2400         Min.   : 8.93   Min.   :4.280  
#>  1st Qu.: 12.3   1st Qu.:0.6400         1st Qu.:16.39   1st Qu.:4.280  
#>  Median : 16.2   Median :0.7100         Median :19.07   Median :5.299  
#>  Mean   : 23.3   Mean   :0.6912         Mean   :20.97   Mean   :4.824  
#>  3rd Qu.: 24.8   3rd Qu.:0.8000         3rd Qu.:23.86   3rd Qu.:5.299  
#>  Max.   :175.0   Max.   :0.9300         Max.   :41.10   Max.   :5.299

# Vérifier les données manquantes
agb_data %>%
  summarise(
    missing_dbh = sum(is.na(dbh)),
    missing_wd = sum(is.na(taxa_mean_wood_density)),
    missing_height = sum(is.na(H_final)),
    complete_cases = sum(!is.na(dbh) & !is.na(taxa_mean_wood_density) & !is.na(H_final))
  )
#> # A tibble: 1 × 4
#>   missing_dbh missing_wd missing_height complete_cases
#>         <int>      <int>          <int>          <int>
#> 1           0          0              0            834

Estimation Simple d’AGB (Sans Propagation d’Erreur)

Estimation rapide sans incertitude :

# Calcul simple d'AGB en utilisant l'équation de Chave et al. 2014
agb_data <- agb_data %>%
  filter(!is.na(dbh) & !is.na(taxa_mean_wood_density) & !is.na(H_final)) %>%
  mutate(
    AGB_kg = BIOMASS::computeAGB(
      D = dbh,
      WD = taxa_mean_wood_density,
      H = H_final
    )
  )

# AGB au niveau de la parcelle
agb_by_plot <- agb_data %>%
  group_by(plot_name) %>%
  summarise(
    n_trees = n(),
    total_AGB_Mg = sum(AGB_kg)
  )

print(agb_by_plot)
#> # A tibble: 2 × 3
#>   plot_name   n_trees total_AGB_Mg
#>   <chr>         <int>        <dbl>
#> 1 bouamir001      389         350.
#> 2 mbalmayo001     445         466.

Résumé

Cette vignette a démontré le flux de travail complet pour l’estimation d’AGB en utilisant CafriplotsR et BIOMASS :

✅ Extraire des données structurées avec output_style = "permanent_plot"
✅ Utiliser les données H-D pré-filtrées de la table $height_diameter
✅ Construire des modèles allométriques avec BIOMASS::modelHD()
✅ Exploiter les traits intégrés - densité du bois automatiquement incluse

Avantages clés :

Pas de correspondance manuelle des traits - densité du bois pré-intégrée depuis la base de données taxonomique
Table H-D prête à l’emploi - filtrée et formatée pour BIOMASS

Ressources Supplémentaires

Package BIOMASS : Réjou-Méchain et al. (2017) https://CRAN.R-project.org/package=BIOMASS
Équations allométriques : Chave et al. (2014) https://doi.org/10.1111/gcb.12629
Requêtes CafriplotsR : Voir vignette("using-query-plots-fr")
Correspondance taxonomique : Voir vignette("taxonomic-app-fr")

Références

Chave, J., et al. (2014). Improved allometric models to estimate the aboveground biomass of tropical trees. Global Change Biology, 20(10), 3177-3190.

Réjou-Méchain, M., et al. (2017). biomass: an R package for estimating above-ground biomass and its uncertainty in tropical forests. Methods in Ecology and Evolution, 8(9), 1163-1167.