Dataset extent
Turvetuotantoalueiden maanpeite
Data ja resurssit
Tässä tietojoukossa ei ole dataa
Lisätietoja
Kenttä | Arvo |
---|---|
Metatietueen ID | {D9A56451-8A92-4575-BE12-A6AB69990AFF} |
Metatiedon pääasiallinen kieli | fin |
Metatiedosta vastaava organisaatio | Suomen ympäristökeskus |
Metatiedosta vastaavan organisaation yhteystieto | gistuki@syke.fi |
Metatiedosta vastaavan organisaation rooli | pointOfContact |
Metatiedon päivityspäivämäärä | 2024-09-13 |
Koordinaattijärjestelmän EPSG-koodi, ks. https://epsg.io | EPSG:3067 |
Aineiston/järjestelmän päivämäärä | 2024-09-17 |
Aineiston/järjestelmän päivämäärän tyyppi | publication |
Aineiston/järjestelmän yksilöivä tunnus | |
Aineistosta/järjestelmästä vastaava organisaatio | GTK |
Aineistosta/järjestelmästä vastaavan organisaation yhteystieto | geodata@gtk.fi |
Aineistosta/järjestelmästä vastaavan organisaation rooli | pointOfContact |
INSPIRE-teema | Land cover |
Resurssityyppi | Paikkatietoaineisto |
Käyttörajoitteet ja lähdemerkintä | Creative Commons Nimeä 4.0 Kansainvälinen http://www.syke.fi/fi-FI/Avoin_tieto/Kayttolupa_ja_vastuut Lähde: GTK |
Saantirajoitteet | no limitations |
Aineiston/järjestelmän tyyppi | grid |
Aineiston/järjestelmän kieli | fin |
Aineiston/järjestelmän aiheluokka | environment |
Palvelun tyyppi | |
Ajallisen kattavuuden alku | None |
Ajallisen kattavuuden loppu | None |
Aineiston/tietojärjestelmän historiatiedot | Aineisto ladattu 09/2024. Turvetuotantoalueiden maanpeite -aineisto on yleistetty koneoppimismallintamisella Maanmittauslaitoksen (MML) ilmakuva-aineistosta tulkitusta turvetuotantoalueiden eri maanpeiteluokkia kuvaavasta opetusaineistosta. Opetuspisteet turvetuotantoalueiden maanpeiteluokitteluun tehtiin vuonna 2020 kuvattuja ilmakuvia tulkitsemalla. Aineiston tuottamisessa koneoppimismallintamisella on käytetty rasteri- ja vektorimuotoisia kaukokartoitus- ja paikkatietoaineistoja. Rasterimuotoisina kaukokartoitus- ja paikkatietoaineistoina on käytetty Sentinel-1 ja Sentinel-2 –satelliittiaineistoja sekä MML:n (0,5 p/m2) laserkeilausaineistosta johdettuja maaston pintamallia ja kasvillisuuden korkeusmallia. Turvetuotantoalueiden aluerajauksena on käytetty MML:n maastotietokannan vuosien 2005–2021 versioiden turvetuotantoalueita. Vektorimuotoinen aineisto on muutettu rasterimuotoiseksi ja sovitettu työssä käytettyjen rasteriaineistojen tapaan 10 m pikselikoolla tehtyyn perushilaan, joka perustuu MML:n maastotietokannan maa-alueisiin. / The Land cover of peat extraction areas dataset is generalized to cover peat extraction sites using machine learning modelling. The training data was generated by interpreting National Land Survey of Finland (NLS) aerial photographs acquired in year 2020. Remote sensing and GIS input data included Sentinel-1 ja Sentinel-2 satellite data, digital elevation and canopy height models derived from airborne laser scanning data (0,5 p/m2) by the NLS. Sentinel -1 ja -2 data were acquired in the summers 2019?2021 and airborne laser scanning data between years 2008 and 2019. The maximum aerial extent of the peat extraction areas was derived by compiling versions of the NLS topographic database from years 2005–2021. The vector data was rasterized and fitted into a 10 m pixel size base grid. Base grid was constructed on ‘land areas’ derived from the NLS topographic database, year 2021 version. Prosessointihistoria: Process step: Vuosina 2021-2022 tehtyä koko Suomen koneoppimisluokittelua edelsi pilotointivaihe, jossa kehitettiin luokittelulle työvuo, valittiin käytettävät aineistot ja niiden esikäsittelymenetelmät, päätettiin opetusaineistojen luokkasisältö sekä testattavat koneoppimismenetelmät. Pilotoinnin perusteella Random Forest -algoritmi valikoitui parhaaksi koneoppimisluokittelijaksi. Lopullinen rasteriaineistojen valinta perustui geneettisellä algoritmilla tehtyyn ajoon, joka tehtiin yhteisajona koko Suomen turvetuotantoalalle. Aineistossa käytetyt turvetuotantoalueiden maanpeiteluokkien numerokoodit ja niitä vastaavat luokkanimet on esitetty erillisessä metatietoihin liitetyssä dokumentissa ja teknisen raportin taulukossa 17 (Middleton et al. 2023). Koneoppimisluokittelu tehtiin yhdessä Random Forest ajossa käyttäen mallia, joka oli muodostettu Sentinel-1, Sentinel-2 ja laserkeilausaineiston johdannaisten avulla. Laserkeilausaineistosta johdettua korkeusmallia ja latvusmallia ei ollut saatavilla kaikkialta alueilta, joten näiden pikseleiden rasteriarvoksi tuli puuttuva arvo (65534). Aineistoon liittyy lisäksi laatuluokitusrasteri, jonka toimii tässä tapauksessa aineiston kattavuusindeksitasona. Turvetuotantoalueiden maanpeiteluokittelun yleisluokittelutarkkuus on 89,3 %. Luokkakohtaiset oikeellisuusarvot löytyvät metatiedoista löytyvästä virhematriisista. / A piloting phase was conducted prior to the machine learning classification of the entire country conducted in years 2021–2022. During the piloting phase a workflow for the classification was developed. In the beginning of the piloting phase, raster data were selected, their preprocessing methods were chosen, training data was prepared, class content was determined, and the machine learning algorithms to be tested. Based on this phase, Random Forest was selected as the classification algorithm. Final feature selection of the input raster datasets was done with genetic algorithm which was conducted for all the training points distributed across western and eastern Finland. The used number codes in the dataset representing each landcover class are shown in a separate document delivered with this metadata and in Table 17 in Middleton et al. (2023). The machine learning model was done in one Random Forest run as Sentinel-1, Sentinel-2 and derivatives of the airborne laser scanning data as inputs. Airborne laser scanning data was not available from all pixels within the peat extraction mask. Those pixels were assigned to nodata (value 65534). A data quality reference raster is also delivered with the dataset but in this case it only serves a purpose of a data index. The overall accuracy of the classification is 89.3%. Class specific accuracy measures can be found in the error matrix. |