Big data w modelach przestrzennych

Written by Korneliusz Krysiak

09/20/2019

Cel projektu

Głównym celem tego projektu jest efektywne oprogramowanie modeli regresji przestrzennej w R umożliwiające ich estymację na dużych zbiorach danych.

Modele regresji przestrzennej są stosowane na danych dotyczących obszarów (np. administracyjnych jednostek terytorialnych – powiatów czy gmin) lub punktów w przestrzeni (np. lokalizacji osób, firm czy innych obiektów). Obiekty zlokalizowane blisko siebie w przestrzeni mają zwykle na siebie wzajemnie wpływ, który nie jest automatycznie uwzględniany w tradycyjnych modelach statystycznych czy algorytmach uczenia maszynowego. W modelach regresji przestrzennej uwzględnia się zależność między zjawiskami w przestrzeni – np. wpływ na wartość zmiennej zależnej w modelu wartości tej samej zmiennej dla obiektów sąsiadujących albo wartości innych cech obiektów sąsiadujących.

Planowanym rezultatem projektu będzie pakiet R pozwalający na efektywne zastosowanie modeli regresji przestrzennej na dużych zbiorach danych.

Relacje w przestrzeni są uwzględniane za pomocą kwadratowej macierzy odległości, która opisuje wzajemne relacje między obiektami i ma wymiar nxn, gdzie n jest liczbą obserwacji w modelu. Mimo że macierz odległości zawiera wiele zer (jest macierzą rzadką) optymalizacja modeli regresji przestrzennej dla dużych zbiorów danych jest dużym wyzwaniem.
Planowanym rezultatem projektu będzie pakiet R pozwalający na efektywne zastosowanie modeli regresji przestrzennej na dużych zbiorach danych.

Opiekunowie Projektu

Jakub Ajchel

Bartłomiej Wieczorek

Spodobały ci się nasze projekty? Masz pomysł na własny?

Biuro

Długa 44/50, 00-241 Warszawa

Godziny

Pon - Pt: 9.00 - 17.00
Sob - Nd: Zamknięte

Kontakt

dr Piotr Wójcik