Neo4j versus PostGIS

Posted on Posted in Uncategorized

[:en]My master thesis on a NoSQL system called Neo4j, its capabilities, advantages and disadvantages when using it to store and query OpenStreetMap data. This study and research tasks started in July 2011 and were completed in May 2012. The summary can be found here.

My research reports on a comparison of Neo4j with the traditional relational database PostgreSQL when storing and querying spatial vector data. The goal of this study was to determine whether a traditional relational database system like PostGIS, or a NoSQL system, such as Neo4j-Spatial, would be more effective as the underlying technology for operating OpenStreetMap data.

Multiple aspects are of interest when comparing spatial database systems. The evaluation methodology designed to compare the two, involves both objective measurements and subjective measurements based on documentation and experience. The objective tests include processing speed based on a predefined set of queries, disk space requirements, and scalability. Subjective tests include maturity/level of support, stability and ease of use. Two test environments have been created using the same OpenStreetMap data in both the graph database and the relational database. While the systems have fundamental differences, identical operations have been developed that provides equal results from differently sized study areas.

The complete research can be downloaded here.[:nl]Mijn MSc. onderzoek naar een NoSQL systeem genaamd Neo4j, de mogelijkheden, voordelen en nadelen wanneer dit systeem wordt gebruik om OpenStreetMap op te slaan en te bevragen. Deze studie en onderzoek startte in juli 2011 was in in mei 2012 afgerond. De samenvatting is hier te vinden.

Dit onderzoek vergelijkt de NoSQL Neo4j database met de traditionele relationele database PostgreSQL wanneer ruimtelijke vector data wordt opgeslagen en bevraagd. Het doel van deze studie was om te bepalen of een traditionele relationele database zoals PostGIS, of een NoSQL-systeem, zoals Neo4j-Spatial, effectiever zou zijn als onderliggende technologie voor OpenStreetMap data.

Meerdere aspecten zijn van belang bij het vergelijken van ruimtelijke database-systemen. Om de twee verschillende systemen goed te kunnen vergelijken is een evaluatie methode ontwikkeld die zowel objectieve als subjectieve metingen beoordeeld, dit op basis van documentatie en ervaring. De objectieve tests beoordelen verwerkingssnelheid van een vooraf gedefinieerde set van vragen, het gebruik van schijfruimte en de schaalbaarheid van het systeem. Subjectieve tests omvatten looptijd/niveau van support, stabiliteit en gebruiksgemak.
Twee testomgevingen zijn gemaakt met identieke OpenStreetMap gegevens in zowel de grafische database als de relationele database. Hoewel de systemen fundamenteel verschillen, zijn identieke bewerkingen (queries) ontwikkeld die gelijke resultaten leveren van meerdere studiegebieden.

Het volledige onderzoek kan hier worden gedownload.[:]