Выбор оптимального порядка соседства для разделения пространственного точечного образа на кластерную и шумовую составляющую (на примере анализа размещения античных поселений на Керченском полуострове)

DOI: 10.35595/2414-9179-2020-4-26-257-265

Посмотреть или загрузить статью (Rus)

Об авторе

П.А. Украинский

Белгородский государственный национальный исследовательский университет, Федерально-региональный центр аэрокосмического и наземного мониторинга объектов и природных ресурсов,
ул. Победы, д. 85, 308015, Белгород, Россия,
E-mail: pa.ukrainski@gmail.com

Аннотация

При выделении пространственных кластеров точечных объектов часто возникает проблема наличия шума, который мешает провести чёткие границы. Одним из популярных методов разделения кластерной и шумовой составляющей точечного образа является NNCR (Nearest Neighbor Clutter Removal), предложенный в 1998 г. Bayers и A.E. Raftery. Специфика метода заключается в использовании в расчётах расстояния до ближайшего соседа. При этом результат применения NNCR сильно зависит от выбранного пользователем порядка соседства. В этой работе описывается способ выбора оптимального порядка соседства для NNCR. Этот способ ориентирован на выполнение NNCR с помощью дополнительного пакета spatstat языка программирования R. Предлагается использовать в качестве основного критерия оптимального порядка соседства вероятность наличия в данных кластерной составляющей. При оптимальном порядке соседства её величина достигает максимального значения. В дополнение к этому предлагается анализировать вероятность принадлежности к кластеру для всех точек, причисленных к кластерной составляющей. Для этого строятся графики зависимости медианы и межквартильного размаха вероятности принадлежности от порядка соседства. С ростом порядка соседства медиана вероятности принадлежности для кластерной составляющей увеличивается, стремясь к значению 1,0. Межквартильный размах вероятности принадлежности, наоборот, с ростом порядка соседства уменьшается, стремясь к значению 0,0. Перегиб на этих графиках указывает на оптимальный порядок соседства. На языке программирования R написана пользовательская функция, позволяющая автоматизировать сравнение результатов NNCR, полученных при различных порядках соседства. Она возвращает матрицу, столбцами которой являются медиана вероятности принадлежности, межквартильный размах вероятности принадлежности и вероятность наличия в данных кластерной составляющей. Предложенный метод выбора оптимального порядка соседства опробован для анализа точечного слоя античных поселений Керченского п-ва. Для этих данных оптимальным оказался 3-й порядок соседства.

Ключ. слова

анализ точечных образов, античные поселения, пространственная кластеризация, удаление шума

Список литературы

  1. Бейлин Д.В., Ермолин Е.Л., Масленников А.А., Смекалов С.Л. Античные поселения Европейского Боспора эллинистического времени (каталог памятников). Древности Боспора, 2014. Т. 18. С. 35–72.
  2. Allard D., Fraley C. Nonparametric maximum likelihood estimation of features in spatial point processes using Voronoi tessellation. Journal of the American statistical Association, 1997. V. 92. P. 1485–1493. DOI: 10.2307/2965419.
  3. Baddeley A., Turner R. Spatstat: an R package for analyzing spatial point patterns. Journal of Statistical Software, 2005. V. 12. No 6. P. 1–42. DOI: 10.18637/jss.v012.i06.
  4. Byers S., Raftery A.E. Nearest-neighbor clutter removal for estimating features in spatial point processes. Journal of the American Statistical Association, 1998. V. 93. P. 577–584. DOI: 10.2307/2670109.
  5. Ester M., Kriegel H.-P., Sander J., Xu X. A density-based algorithm for discovering clusters in large spatial databases with noise. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). Portland: AAAI Press, 1996. P. 226–231.
  6. Heidenreich N.B., Schindler A., Sperlich S. Bandwidth selection for kernel density estimation: A review of fully automatic selectors. AStA Advances in Statistical Analysis, 2013. V. 97. No 4. P. 403–433.
  7. Hennig C., Coretto P. The noise component in model-based cluster analysis. Data Analysis, Machine Learning and Applications. Berlin–Heidelberg: Springer, 2008. P. 127–138.

Для цитирования: Украинский П.А. Выбор оптимального порядка соседства для разделения пространственного точечного образа на кластерную и шумовую составляющую (на примере анализа размещения античных поселений на Керченском полуострове). ИнтерКарто. ИнтерГИС. Геоинформационное обеспечение устойчивого развития территорий: Материалы Междунар. конф. M: Издательство Московского университета, 2020. Т. 26. Ч. 4. С. 257–265 DOI: 10.35595/2414-9179-2020-4-26-257-265

For citation: Ukrainskiy P.A. The choice of the optimal order of the neighborhood for separation a spatial point pattern into a cluster and noise component (by the example of analysis of location of antique settlements in the Kerch Peninsula). InterCarto. InterGIS. GI support of sustainable development of territories: Proceedings of the International conference. Moscow: Moscow University Press, 2020. V. 26. Part 4. P. 257–265. DOI: 10.35595/2414-9179-2020-4-26-257-265 (in Russian)