Посмотреть или загрузить статью (Rus)
Об авторе
П.А. Украинский
ул. Победы, д. 85, 308015, Белгород, Россия,
E-mail: pa.ukrainski@gmail.com
Аннотация
При выделении пространственных кластеров точечных объектов часто возникает проблема наличия шума, который мешает провести чёткие границы. Одним из популярных методов разделения кластерной и шумовой составляющей точечного образа является NNCR (Nearest Neighbor Clutter Removal), предложенный в 1998 г. Bayers и A.E. Raftery. Специфика метода заключается в использовании в расчётах расстояния до ближайшего соседа. При этом результат применения NNCR сильно зависит от выбранного пользователем порядка соседства. В этой работе описывается способ выбора оптимального порядка соседства для NNCR. Этот способ ориентирован на выполнение NNCR с помощью дополнительного пакета spatstat языка программирования R. Предлагается использовать в качестве основного критерия оптимального порядка соседства вероятность наличия в данных кластерной составляющей. При оптимальном порядке соседства её величина достигает максимального значения. В дополнение к этому предлагается анализировать вероятность принадлежности к кластеру для всех точек, причисленных к кластерной составляющей. Для этого строятся графики зависимости медианы и межквартильного размаха вероятности принадлежности от порядка соседства. С ростом порядка соседства медиана вероятности принадлежности для кластерной составляющей увеличивается, стремясь к значению 1,0. Межквартильный размах вероятности принадлежности, наоборот, с ростом порядка соседства уменьшается, стремясь к значению 0,0. Перегиб на этих графиках указывает на оптимальный порядок соседства. На языке программирования R написана пользовательская функция, позволяющая автоматизировать сравнение результатов NNCR, полученных при различных порядках соседства. Она возвращает матрицу, столбцами которой являются медиана вероятности принадлежности, межквартильный размах вероятности принадлежности и вероятность наличия в данных кластерной составляющей. Предложенный метод выбора оптимального порядка соседства опробован для анализа точечного слоя античных поселений Керченского п-ва. Для этих данных оптимальным оказался 3-й порядок соседства.
Ключ. слова
Список литературы
- Бейлин Д.В., Ермолин Е.Л., Масленников А.А., Смекалов С.Л. Античные поселения Европейского Боспора эллинистического времени (каталог памятников). Древности Боспора, 2014. Т. 18. С. 35–72.
- Allard D., Fraley C. Nonparametric maximum likelihood estimation of features in spatial point processes using Voronoi tessellation. Journal of the American statistical Association, 1997. V. 92. P. 1485–1493. DOI: 10.2307/2965419.
- Baddeley A., Turner R. Spatstat: an R package for analyzing spatial point patterns. Journal of Statistical Software, 2005. V. 12. No 6. P. 1–42. DOI: 10.18637/jss.v012.i06.
- Byers S., Raftery A.E. Nearest-neighbor clutter removal for estimating features in spatial point processes. Journal of the American Statistical Association, 1998. V. 93. P. 577–584. DOI: 10.2307/2670109.
- Ester M., Kriegel H.-P., Sander J., Xu X. A density-based algorithm for discovering clusters in large spatial databases with noise. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). Portland: AAAI Press, 1996. P. 226–231.
- Heidenreich N.B., Schindler A., Sperlich S. Bandwidth selection for kernel density estimation: A review of fully automatic selectors. AStA Advances in Statistical Analysis, 2013. V. 97. No 4. P. 403–433.
- Hennig C., Coretto P. The noise component in model-based cluster analysis. Data Analysis, Machine Learning and Applications. Berlin–Heidelberg: Springer, 2008. P. 127–138.
Для цитирования: Украинский П.А. Выбор оптимального порядка соседства для разделения пространственного точечного образа на кластерную и шумовую составляющую (на примере анализа размещения античных поселений на Керченском полуострове). ИнтерКарто. ИнтерГИС. Геоинформационное обеспечение устойчивого развития территорий: Материалы Междунар. конф. M: Издательство Московского университета, 2020. Т. 26. Ч. 4. С. 257–265 DOI: 10.35595/2414-9179-2020-4-26-257-265
For citation: Ukrainskiy P.A. The choice of the optimal order of the neighborhood for separation a spatial point pattern into a cluster and noise component (by the example of analysis of location of antique settlements in the Kerch Peninsula). InterCarto. InterGIS. GI support of sustainable development of territories: Proceedings of the International conference. Moscow: Moscow University Press, 2020. V. 26. Part 4. P. 257–265. DOI: 10.35595/2414-9179-2020-4-26-257-265 (in Russian)