ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ПРИ РЕШЕНИИ ГЕОИНФОРМАЦИОННЫХ ЗАДАЧ

DOI: 10.24057/2414-9179-2018-2-24-371-384

Посмотреть или загрузить статью (Rus)

Об авторах

Колесников А.А.

Сибирский государственный университет геосистем и технологий,
ул. Плахотного, д. 10, 630108, Новосибирск, Россия,
E-mail: alexeykw@mail.ru

Кикин П.М.

Сибирский государственный университет геосистем и технологий,
ул. Плахотного, д. 10, 630108, Новосибирск, Россия,
E-mail: it-technologies@yandex.ru

Комиссарова Е.В.

Сибирский государственный университет геосистем и технологий,
ул. Плахотного, д. 10, 630108, Новосибирск, Россия,
E-mail: komissarova_e@mail.ru

Касьянова Е.Л.

Сибирский государственный университет геосистем и технологий,
ул. Плахотного, д. 10, 630108, Новосибирск, Россия,
E-mail: helenkass@mail.ru

Аннотация

Машинное обучение и анализ данных являются наиболее популярными направлениями как в информационных технологиях, так и среди большинства направлений научных исследований. География, картография и геоинформатика с их разнообразием типов исходных и обрабатываемых данных, задач пространственного анализа, способов визуализации, способов моделирования и прогнозирования как нельзя лучше подходят для использования современных алгоритмов машинного обучения. Однако использование этих технологий редко выходит за рамки решения частных задач коммерческих компаний и зачастую не находит широкой огласки и тем более какой-либо систематизации и научного описания. В связи с этим было решено провести исследование технологий машинного обучения на предмет возможности их использования при решении наиболее типовых задач географических исследований. Приведена классификация задач, алгоритмов и методов компьютерного зрения с точки зрения геоинформационных систем. Описаны возможные способы решения некоторых задач классификации и сегментации растровых изображений. Проанализированы наиболее популярные из них, включая такие, как использование сверточных и предобученных нейронных сетей для распоз- навания объектов на спутниковых снимках. Апробация прошла в рамках соревнования по векторизации объектов гидрографии и классификации объектов в открытом море Statoil/C-CORE Iceberg Classifier Challenge. В качестве исходных данных были взяты размеченные спутнико- вые снимки водной поверхности. Рассмотрены способы анализа пространственных данных и визуализации результатов с помощью пространственной автокорреляции по индексу Морана и расчета коэффициента Джини. Также были исследованы способы решения задач прогнозирования с использованием наиболее популярных алгоритмов регрессии, апробированные на примере определения положения координат дома и работы по временному ряду транзакций банкоматов и касс в пунктах сервиса. Для проведения данного исследования использовался набор данных всероссийского соревнования по машинному обучению Raiffeisen Data Cup. Произведено сравнение результатов работы алгоритмов машинного обучения с традиционными методами пространственного анализа. По результатам проведенных исследований были сформулированы выводы о применимости исследованных алгоритмов и технологий для конкретных географических задач с учетом зависимости результатов от типов используемых данных, требований к ресурсам, точности, универсальности.

Ключ. слова

машинное обучение, картография, сегментация, нейронные сети, регрессия, геоинформатика, спутниковые снимки

Список литературы

  1. Колесников А.А., Кикин П.М., Комиссарова Е.В. Программирование для ГИС в рамках подготовки студентов, обучающихся по специальности «Информационные системы и технологии» // Актуальные вопросы образования. Ведущая роль университета в технической и кадровой модернизации российской экономики: Сб. материалов Междунар. науч.-методич. конф. В 3-х ч. Ч. 1. Новосибирск: СГУГиТ, 2015. С. 87–90.
  2. Колесников А.А., Кикин П.М., Комиссарова Е.В. Создание виртуальных моделей местности и зданий // Интерэкспо ГЕО-Сибирь-2016. XII Междунар. науч. конгр., 18–22 апреля 2016 г., Новосибирск. Междунар. науч. конф. «Раннее предупреждение и управление в кризисных ситуациях в эпоху больших данных»: Сб. материалов. Т. 2. Новосибирск: СГУГиТ, 2016. С. 37–40.
  3. Колесников А.А., Кикин П.М., Комиссарова Е.В. Использование открытых семантических баз данных для получения пространственной информации // Интерэкспо ГЕО-Сибирь-2017. XIII Междунар. науч. конгр., 17–21 апреля 2017 г., Новосибирск. Междунар. науч. конф. «Геодезия, геоинформатика, картография, маркшейдерия»: Сб. материалов. Т. 2. Новосибирск: СГУГиТ, 2017. С. 53–57.
  4. Колесников А.А., Кикин П.М., Комиссарова Е.В., Грищенко Д.В. Использование машинного обучения для построения картографических изображений // Междунар. науч.-практ. конф. «От карты прошлого — к карте будущего», 28–30 ноября 2017 г., г. Пермь — г. Кудымкар. С. 110–120.
  5. Badrinarayanan V., Kendall A., Cipolla R. Convolutional encoder-decoder architecture for image segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence, IEEE Transactions on Pattern Analysis and Machine Intelligence. 39 (12), No 7803544. 2017. P. 2481–2495.
  6. Benedetti R., Rossini P. On the use of NDVI profiles as a tool for agricultural statistics the case study of wheat yield estimate and forecast in Emilia Romanga // Remote Sensing of Environment. 1993. V. 45. P. 311–326.
  7. Bottou L. Large-scale machine learning with stochastic gradient descent // Proceedings of COMPSTAT’ 2010. Springer, 2010. P. 177–186.
  8. Breiman L. Random forests // Machine learning. 2001. Т. 45, No 1. P. 5–32.
  9. Brown F.J., Reed C.B., Hayes J.M. et al. A prototype drought monitoring system integrating climate and satellite data. Proceedings of the Pecora L5/land satellite information 1V/ISPRS commission I/FIEOS. 2002. Colarado, USA.
  10. Chen L.-C., Papandreou G., Kokkinos I. et al. Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs. arXiv preprint arXiv:1606.00915, 2016.
  11. Dai J., He K., Sun J. Boxsup: Exploiting bounding boxes to supervise convolutional networks for semantic segmentation // Proceedings of the IEEE International Conference on Computer Vision. 2015. P. 1635–1643.
  12. Eigen D., Fergus R. Predicting depth, surface normals and semantic labels with a common multi-scale convolutional architecture // Proceedings of the IEEE International Conference on Computer Vision. 2015. P. 2650–2658; for Large-Scale Image Recognition, CoRR, vol. abs/1409.1556, 2014.
  13. Girshick R., Donahue J., Darrell T., Malik J. Rich feature hierarchies for accurate object detection and semantic segmentation // Proceedings of the IEEE conference on computer vision and pattern recognition. 2014. P. 580–587.
  14. Giusti J. Guzzi, Cires D.C., He F.-L. et al. A machine learning approach to visual perception of forest trails for mobile robots // IEEE Robotics and Automation Letters. 2016. Т. 1, No 2. P. 661–667.
  15. Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press. 2016. 800 с. ISBN: 9780262035613.
  16. Hariharan B., Arbelaez P., Girshick R., Malik J. Simultaneous detection and segmentation // European Conference on Computer Vision. Springer, 2014. P. 297–312.
  17. Haug S., Ostermann J. A Crop Weed Field Image Dataset for the Evaluation of Computer Vision Based Precision Agriculture Tasks // Computer Vision—ECCV 2014 Workshops. Zurich: Springer, 2014. P. 105–116.
  18. Hung C., Nieto J., Taylor Z. et al. Orchard fruit segmentation using multi-spectral feature learning // Intelligent Robots and Systems (IROS) IEEE/RSJ International Conference on. IEEE. 2013. P. 5314–5320.
  19. Jia Y., Shelhamer E., Donahue J. et al. Caffe: Convolutional architecture for fast feature embedding. arXiv preprint arXiv: 1408.5093, 2014.
  20. Mitchell T. Machine learning. McGraw-Hill, 1997. 414 с. ISBN: 0070428077.
  21. Mortensen K., Dyrmann M., Karstoft H. et al. Semantic segmentation of mixed crops using deep convolutional neural network. International Conference on Agricultural Engineering, 2016.
  22. Peters J.A., Walter-Shea A.E., Ji L. et al. Drought monitoring with NDVI-based standardized vegetation index // Photogrammetric Engineering and Remote Sensing. 2002. V. 68: 7175.
  23. Rey S.J., Smith R.J. A spatial decomposition of the Gini coefficient // Letters in Spatial and Resource Sciences. 2013. V. 6. P. 55–70.
  24. Russakovsky O., Deng J., Su H. et al. ImageNet Large Scale Visual Recognition Challenge // International Journal of Computer Vision (IJCV). 2015. Т. 115, N 3. P. 211–252.
  25. Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv technical report, eprint arXiv:1409.1556, 2014.

Для цитирования: Колесников А.А., Кикин П.М., Комиссарова Е.В., Касьянова Е.Л. ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ПРИ РЕШЕНИИ ГЕОИНФОРМАЦИОННЫХ ЗАДАЧ. Материалы Международной конференции «ИнтерКарто. ИнтерГИС». 2018;24(2):371–384. DOI: 10.24057/2414-9179-2018-2-24-371-384

For citation: Kolesnikov A.A., Kikin P.M., Komissarova E.V., Kasyanova E.L. USE OF MACHINE LEARNING TECHNOLOGIES IN DECISION OF GEOINFORMATIONAL TASKS. Proceedings of the International conference “InterCarto. InterGIS”. 2018;24(2):371–384 DOI: 10.24057/2414-9179-2018-2-24-371-384 (in Russian)