Dataset extent

Map data © OpenStreetMap contributors

Pohjaeläinten esiintymisen mallinnus 'Boosted Regression trees' -menetelmällä

Pohjaeläinten levinneisyysmalli Boosted Regression Trees -menetelmällä

Aineisto kuvaa pohjaeläinten mahdollista levinneisyyttä Suomen ja Ahvenanmaan merialueilla, rajoittuen Suomen talouvyöhykkeeseen. Rasteriaineiston resoluution on 20 m ja kuvaa lajien ennustettua esiintymistodennäköisyyttä (0-1), ennustettuja esiintymisalueita (0-1; 0 = puuttuu, 1 = läsnä) ja ennustettua runsautta (yksilöä/neliömetri). Esiintymistodennäköisyys sekä runsaus on visualisoitu tummansinisestä tummanpunaiseen ja esiintymisalue harmaalla (0) ja oranssilla (1).


Artutbredningsmodell för bottendjur med Boosted Regression Trees -metoden

Rasterskiktet beskriver bottendjurens potentiella utbredning inom Finlands och Ålands havsområden. Artutbredningsmodellen är begränsad inom den finska exklusiva ekonomiska zonen. Rasterskiktets resolution är 20 m och beskriver arternas förutspådda förekomstsannolikhet (0-1), de förutspådda förekomstområdena (0-1; 0 = frånvarande, 1 = närvarande) och den förutspådda abundansen av arter (individer/kvadratmeter). Förekomstsannolikheten samt abundansen är visualiserade med mörkblått till mörkrött och förekomstområdena med grått (0) och orange (1).


Species distribution modelling of benthic animals using Boosted Regression Trees

The raster data describes the potential distribution of benthic animals on the marine area of Finland and the Åland Islands. The model's distribution area is limited to the Finnish exclusive economic zone. The resolution of the raster data is 20m, and describes the species' probability of occurrence (0-1), the predicted areas of occurrence (0-1; 0 = absent, 1 = present), and the predicted abundance of species (individuals/square meter). The probability of occurrence as well as the abundance have been visualised with dark blue to dark red, and the areas of of occurrence with grey (0) and orange (1).

Aineiston on tuottanut Metsähallitus / Data har producerats av Forststyrelsen / The data has been produced by Metsähallitus

Käyttötarkoitus / Avsedd användning / Intended use: Ympäristöhallinnon käyttöön / tehtävien tueksi För Miljöförvaltningens bruk / stöd For the use / support of environmental administration

Data and Resources

Additional Info

Field Value
File Identifier {F25EE30A-97E5-437B-90E3-52F19D783C32}
Metadata Language fin
Organisation responsible for metadata Metsähallitus / Matti Sahla
Contact information of the organisation responsible for metadata matti.sahla@metsa.fi
The role of the organisation responsible for metadata pointOfContact
Metadata revision date 2020-11-13
EPSG Code of the Reference System, see https://epsg.io/ EPSG:3067
Resource Date 2020-11-17
Resource Date Type publication
Unique Resource identifier
Organisation Responsible for Resource Metsähallitus / Matti Sahla
Contact information of the organisation responsible for Resource matti.sahla@metsa.fi
The role of the organisation responsible for Resource pointOfContact
INSPIRE Data Theme Species distribution
GEMET Concepts Keyword spatial distribution
GEMET Concepts Keyword modelling
Resource Classification Paikkatietoaineisto
Other keywords Ei-Inspire
Other keywords: Thesaurus name
Use constraints and source

Aineistoa voi tarkastella VELMU-karttapalvelussa tai rajapinnan kautta. The Data set is viewable in the VELMU map service or through the interface. Materialet kan granskas via VELMU-karttjänsten eller via gränssnittet.

©Metsähallitus

Lähde: Metsähallitus

Access Constraints

Public access to spatial data sets and services would adversely affect the protection of the environment to which such information relates, such as the location of rare species.

Representation Type grid
Scale (Denominator) 10000
Scale (Denominator) 4000000
Resource Language fin
Resource Topic Category biota
Resource Topic Category environment
Service Type
Begin Date of Temporal Extent unknown
End Date of Temporal Extent unknown
Lineage Information

Pohjaeläinten esiintymistä mallinnettiin Boosted Regression Trees -menetelmällä, joka pohjautuu tilasto- (regression trees) ja koneoppimismenetelmiin (boosting). Malli selittää ja ennustaa lajien esiintymistä käyttäen ympäristömuuttujia selittävinä tekijöinä, ja mallinnuksen tuloksena olivat lajien esiintymisen todennäköisyys- ja runsauskartat. Mallinnuksessa hyödynnettiin aineistoja pohjaeläimistä ja ympäristömuuttujista. Mallinnettavat pohjaeläimet valittiin siten, että ne edustavat kuudennen tason HUB-luokkia (Helcom Underwater Biotope and Habitat Classification System). Käytettyä pohjaeläinaineistoa ei kuitenkaan ole HUB-luokiteltu, joten mallinnettavat ryhmät eivät ole HUB-luokkia, vaan niitä luonnehtivia lajeja tai lajiryhmiä. Lisäksi yhdestä näytteestä on voitu määrittää useampia lajeja, kun taas jokainen piste voi kuulua vain yhteen HUB6-tason luokkaan valtalajin peittävyyden tai biomassan mukaan. Näitä HUB6-tasoihin liittyviä mallinnettavia lajeja ja lajiryhmiä oli yhteensä 18. Ympäristömuuttujia kokeiltiin mallinnuksessa useita ja lopulta päädyttiin käyttämään 14 ympäristömuuttujaa varsinaisessa mallinnuksessa. Mallinnukseen sisällytettiin 105 pohjaeläinlajia ja -ryhmää yhteensä 2773 näytteenottopaikasta. Mallinnusta varten datasta poistettiin samojen näytepisteiden kaksoiskappaleet säilyttämällä näytteistä uudempi, jonka jälkeen lajit ja ryhmät jaoteltiin 18 HUB 6 -tason luokkaan liittyvään laajempaan lajiryhmään. Lajidata on muotoa yksilöä/m2 ja absence-presence. Lajidata sisälsi myös 122 nollanäytettä, eli tyhjää näytettä.


Bottendjurens förekomst modellerades genom att utnyttja Boosted Regression Trees -metoden som baserar sig på statistiska- (regression trees) och maskininlärningsmetoder (boosting). Modellen förklarar och förutspår arternas förekomst genom att utnyttja miljövariabler som förklarande variabler. Modelleringens resultat var kartor över arternas förekomstsannolikhet och abundans. Utnyttjade data i modelleringen var om bottendjur samt miljövariabler. De modellerade bottendjuren valdes så att de representerade den sjätte nivåns HUB-klasser (Helcom Underwater Biotope and Habitat Classification System). Bottendjursdata som användes var dock inte HUB-klassat så de modellerade artgrupperna är inte exakt HUB-klasser, utan arter och artgrupper som påminner om dem. Dessutom kan flera arter ha identifierats från ett sampel, medan varje punkt endast kan tillhöra en HUB6-nivås klass, enligt den dominerande artens täckningsgrad eller biomassa. Det fanns totalt 18 modellerbara arter och artgrupper relaterade till HUB6-nivåer. Flera miljövariabler testades i modelleringen och slutligen användes 14 miljövariabler i modelleringen. Hundrafem bottendjursarter och -grupper från 2773 provtagningspunkter inkluderades i modelleringen. Duplikat av samma provtagningspunkter avlägsnades från data för modelleringen, där det senare provet av duplikaten behölls, varefter arterna och grupperna deades in i bredare grupper av arter som motsvarade 18 HUB6-nivåkategorier. Artdata var i form av individ/m2 oh frånvaro-närvaro. Artdata innehöll också också 122 nollprov, dvs. tomma prov.


The distribution of benthic animals was modeled utilising the Boosted Regression Trees method, which is based on statistical (regression trees) and machine learning (boosting) techniques. The model explains and predicts the occurrence of benthic species by using environmental variables as explanatory factors, and the modeling resulted in probability of occurrence and abundance maps of the species. Data on benthic animals and environmental variables were utilised in the modeling. The modeled benthic animals were selected to be representative of the sixth level HUB classes (Helcom Underwater Biotope and Habitat Classification System). The benthic data used is, however, not HUB-classified, so the groups to be modeled do not correspond to HUB-categories exactly, but the species or species groups characterize certain HUB-categories. Additionally, multiple species may have been identified from a single sample, whereas each point may only belong to one HUB6-level category, according to the coverage or biomass of the dominant species. There were a total of 18 of these species and species groups that were modeled in relation to HUB6 levels. Several environmental variables were tested in the modeling, and in the end 14 environmental variables were used in the actual modeling. A total of 105 benthic animals species from 2773 sampling sites were included in the modeling. Duplicates of the same sampling points were removed, retaining the most recent sample, after which the species and species groups were divided into their broader groups of species associated with the 18 HUB6-level categories. Species data was in the form of individual/m2 and absence-presence. The species data also contained 122 "zero-samples", i.e. blank/empty samples.