Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Interlinking Opensource Geo-Spatial Datasets for Optimal Utility in Ranking
Autoři: Bhattacharya Devanjan | Pasquali Paolo | Komárková Jitka | Sedlák Pavel | Saha Atreyi | Boccardo Piero
Rok: 2015
Druh publikace: článek ve sborníku
Název zdroje: Lecture Notes in Geoinformation and Cartography: Modern Trends in Cartography - Selected Papers of CARTOCON 2014
Název nakladatele: Springer
Místo vydání: Heidelberg
Strana od-do: 159-172
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Propojení opensource prostorových datových sad pro optimalizaci řazení Propojení prostorových souborů dat je nutné použít jako kompletní sadu informací dostupné v každé z nich. Existuje mnoho open source prostorových datových sad jako jsou GEONAMES, Street Map Open, Natural Earth a dostat komplexní soubor dat s spojení všech dostupných informací, je důležité, aby tyto soubory dat byly spojeny optimálně bez redundance nebo ztráty informací. Jedním ze základních aspektů digitálního mapování a on-line vizualizace map je prioritním pořadí geolocations s ohledem na jejich atributy, a to je k dispozici jako pořadí sloupců v Natural Earth datových tabulek, které musí být sloučeny s jinými soubory dat pro vytvoření úplné a vyčerpávající příklad mapování. K problémům, s nimiž se potýkáme, patří vyhledávání geometrie, přizpůsobování, stanovení vyrovnávací paměti, místní začlenění pojmenování textu a přesnost. Toho bylo dosaženo ve stávajícívýzkumné práci, kde v současné době GEONAMES, Natural Earth a Open Street Map datových tabulek sloučeny s odbory všech jejich sloupce atributů, což vede k úplné geoprostorovém datové sady s místem přesností aspoň 95 % za každé dané země datovém souboru. Datové tabulky na globální úrovni se skládají ze stovek tisíc řádků s každým řádkem s vyobrazením lokace. Geometrie, jméno a geo-id kompletní a fuzzy vyhledávání a odpovídající kolem vyrovnávací paměti 50 km trvalo minimálně 30 sekund na maximálně 1 minuta na komoditní počítači s 2 GHz, 2 GB paměti, v závislosti na velikosti a složitosti dotazu prováděn v zemi, která by mohla mít seznam bodů v rozmezí od desítek až několika stovek. Budoucnost Cílem je, aby to nakonec udělat pro globální datové sady vytvořit všeobjímající geodat banku, která má takové informace, jako administrativní, politické, ekologické detailů z důležitých databází GAUL, SALB, GADM atd. opensource prostorová datová sada; mapování; propojení; Open Street Map; GeoNames; Natural Earth; Data tables; Scale ranking; Label ranking; Metadata; Fuzzy matching; geometrie
eng Interlinking Opensource Geo-Spatial Datasets for Optimal Utility in Ranking The joining of geospatial datasets is required to utilize the complete set of information available in each of them. There are many open source geospatial datasets available such as GeoNames, Open Street Map, Natural Earth and to get a comprehensive dataset with the union of all available information it is important that such datasets are linked optimally without redundancy or loss of information. One of the essential aspects of digital mapping and online visualization of maps is the prioritized ranking of geolocations with respect to their attributes and this facility is available as rank columns in Natural Earth data tables which need to be merged with other datasets for creating a complete and exhaustive mapping example. The challenges faced include geometry searching, matching, buffer determination, local naming text inclusion and accuracy. This has been achieved by the current research work where presently GeoNames, Natural Earth and Open Street Map data tables have been merged with the union of all their attribute columns resulting in a complete geospatial dataset with place accuracy of atleast 95 % for any given country dataset. The data tables at global level consist of hundreds of thousands of rows with each row depicting a geolocation. The geometry, name and geo-id complete and fuzzy searching and matching around a buffer of 50 km took a minimum of 30 secs to maximum 1 minute in a commodity computer with 2 GHz, 2 GB memory, according to size and complexity of the query run for a country which could have a list of points ranging from a dozen to several hundreds. The future aim is to ultimately do this for global datasets to create an all-encompassing geodata bank having such information as administrative, political, ecological details from important databases as GAUL, SALB, GADM etc. Geospatial open-source datasets; Mapping; Interlinking; Open Street Map; GeoNames; Natural Earth; Data tables; Scale ranking; Label ranking; Metadata; Fuzzy matching; Geometry