Współczesna rzeczywistość wymaga gromadzenia olbrzymich ilości danych. Lawinowo rosną archiwa informacji dotyczących najróżniejszych dziedzin (bankowych, personalnych, pogodowych itp.). Jednocześnie istnieje potrzeba szybkiego przetwarzania danych, a następnie na ich podstawie raportowania, podejmowania decyzji czy oceny ryzyka procesu opisywanego przez bazę danych.
Dla człowieka ogarnięcie dużych ilości danych liczbowych oraz operowanie na nich jest trudne i niewygodne, a czasami po prostu niemożliwe. Oczekujemy informacji w języku naturalnym, który może nie jest szczególnie precyzyjny, ale za to powszechnie zrozumiały. Zwłaszcza kiedy chodzi jedynie o szybką ocenę sytuacji, przedkładamy określenia takie jak „bardzo dużo”, „średnio”, „prawie nikt” nad dane procentowe. Dlatego też w pewnych dziedzinach język naturalny powinien być pomostem między maszyną przetwarzającą dane a człowiekiem, dla którego są one przeznaczone. (Np. kiedy interesujemy się pogodą w Zakopanem, wystarczy wiedzieć, że od lipca do września opady są tam niewielkie, a od grudnia do lipca pokrywa śniegu jest duża. Niepotrzebne są dane liczbowe opadów z każdego miesiąca z ostatnich dziesięciu lat).