BigData. Производительность хранения в файлах и базах
Есть распространенная задача читать-сохранять большое кол-во пар ключ-значение с приемлемой производительностью. Есть несколько способов, и при малом кол-ве ключей обычно проблем нет при любом способе, но когда число становится большим, то могут возникнуть проблемы. Пусть ключем будет число, значением текст 1Кб. Большим объемом будем считать объем 100-200Gb. Использовать будем один диск.
Способов несколько
- в файлах с иерархией
- в БД postgresql
- в БД Mongo
- в HBase
Выводы сделаем после првоерки всех способов.