Jak działa Elastic Search?

18.06.2020 Angelika Siczek
mężczyzna przesuwający palcem po pasku wyszukiwania

W czasach nieustannego pośpiechu niezwykle ważne jest szybkie docieranie do interesujących nas informacji. Niezależnie od tematu każdy chce mieć odpowiedź na wyciągnięcie ręki. Wyszukiwanie szczególne znaczenie ma w środowisku internetowym oraz w samym procesie tworzenia narzędzi informatycznych. Niezależnie od tego, w jakim języku stworzona jest aplikacja, najczęściej posiada ogromną ilość zapisanych danych. Aby znaleźć te odpowiednie, trzeba je przeszukiwać. Istotna jest więc kolejność wykonywanych kroków oraz sama struktura zapisu. Ułatwieniem dla całego procesu wyszukiwania jest właśnie ElasticSearch. Sprawdź, na czym dokładnie polega i dlaczego dobrze jest z niego korzystać!

Elastic Search

W jaki sposób wyszukuje się dane?

Zanim skupimy się na samym ElasticSearch, warto przypomnieć, jak wyszukiwane są dane. W przypadku wyszukiwania pełnotekstowego danych zawartych w aplikacji najczęściej należy nam na tzw. wyszukiwaniu inteligentnym. Dzięki niemu jesteśmy w stanie odfiltrować wartości pól i wyświetlić pasujące do zapytania pozycje. Pozwala ono na drobne błędy występujące w pisowni wyszukiwanej frazy, a także na uwzględnienie odmian słów, które występują w niemal każdym języku.

W przypadku, gdy danych nie ma zbyt dużo, wyszukiwarka wbudowana w aplikację (silnik bazodanowy) w zupełności się sprawdzi. Jednak, gdy liczba indeksów, które trzeba przeszukać, rośnie, warto zastosować bardziej zaawansowane rozwiązania wyszukiwania. Jednym z nich jest właśnie ElasticSearch, który wspomoże zarówno programistę tworzącego serwis, jak i użytkownika końcowego, czyli klienta.

Co to jest ElasticSearch?

Jak już nieco wspomnieliśmy, ElasticSearch to oprogramowanie służące wyszukiwaniu informacji. Jest silnikiem wyszukiwania pełnotekstowego, a co za tym idzie – bazą danych, wykorzystującą bibliotekę Apache Lucene. Dzięki takiemu połączeniu tworzy potężne narzędzie, pozwalające na kompleksowe przeszukiwanie danych w czasie rzeczywistym. Nie jest więc jedynie klasycznym wyszukiwaniem, ale pozwala także na zaawansowane grupowanie oraz filtrowanie wyników według określonych wytycznych.

Na ElasticSearch składa się grupa systemów, w tym Narzędzie Kibana, Narzędzie Logstasha i Rodzina narzędzi „beat”. Dzięki nim można wizualizować dane (także graficznie), zarządzać procesem dodawania logów systemowych, dodawać dane o różnym pochodzeniu, np. z plików tekstowych, informacji o działaniu serwisu lub związanych z pakietami przesyłanymi w sieci.

Wśród głównych zastosowań ElasticSearch można wyróżnić więc pełnotekstowe wyszukiwanie tekstu, zbieranie i analizę logów, zbieranie i analizę danych dostępnych publicznie, zbieranie i analizę danych z pomiarów oraz wizualizację danych.

Jak zbudowane jest ElasticSearch?

Aby w dokładnie zrozumieć możliwości ElasticSearch, warto zapoznać się z jego strukturą. Dzięki temu łatwiej zrozumieć jego funkcjonowanie i możliwości zastosowania w swoich działaniach. Oto kilka podstawowych pojęć, z którymi ma się do czynienia podczas korzystania z narzędzia.

Node – oznacza pojedynczy serwer, na którym zachodzi przeszukiwanie i przetwarzanie danych. Każdy z tego typu serwerów posiada własną unikalną nazwę oraz port, na którym działa. W standardzie jest to port 9200.

Cluster – to zbiór jednego lub kilki node’ów.

Index – jest zbiorem dokumentów o podobnej charakterystyce. Na podstawie nazwy indeksu można odwołać się do konkretnych zbiorów (kolekcji) dokumentów, usunąć lub wyszukać istotne w danej chwili dokumenty. W standardowych, relacyjnych bazach danych indeks jest uznawany za pełnoprawną bazę danych.

Type – to inny od Indexu sposób grupowania danych. Może być nazywany także tabelą. Jednak jej struktura nie jest ściśle zdefiniowana, co odróżnia ją od tabel zawartych w relacyjnych bazach danych. Struktura Type zależy od przechowywanych w określonej grupie dokumentów (Document).

Document – są to rekordy zapisywane w formacie JSON.

Co jeszcze warto wiedzieć o ElasticSearch? To informacja kluczowa przede wszystkim dla programistów. Jest to projekt typu Open Source, co oznacza jego darmowość i brak konieczności uiszczania jakichkolwiek opłat za używanie z narzędzia. Możesz więc bez problemu korzystać z zaawansowanego silnika wyszukiwania, który stale jest rozwijany. Co więcej, wiele oprogramowań pozwala na intuicyjne połączenie z silnikiem ElasticSearch. Można więc wykorzystać go w pracy z Javą, C# oraz z Pythonem.

Kiedy przydaje się ElasticSearch?

Z wyszukiwań za pomocą ElasticSearch mogą korzystać zarówno małe, jak i duże platformy sprzedażowe. Dobrze obrazującym przykładem odpowiedniego wykorzystania jest natomiast sytuacja, w której posiada się około 200 tysięcy produktów i pewne doświadczenie z zakresu programowania.

Zakładamy, że wiemy, jak powinno wyglądać zapytanie do bazy SQL. Wiemy także, że powinno ono działać prawidłowo, ale również być szybkie i wydajne, aby wyszukujący dany produkt klient szybko dotarł do tego, co go interesuje i nie zamienił naszego sklepu na sklep konkurencji i jego szybciej działającą wyszukiwarkę artykułów. Pamiętamy także, że zapytanie nie musi być złożone jedynie z nazwy produktu. Może również w swojej nazwie uwzględniać np. nazwę producenta. To jednak trochę utrudnia nam sprawę. Musimy zdecydować, który element zapytania jest ważniejszy, a także jaki człon wyszukiwania powinien wywierać większy wpływ na ostatecznie wyświetlony wynik.

W tego typu sytuacji, dzięki ElasticSearch, do każdego pola możesz dołożyć wagę i tym samym wpłynąć na scoring zapytania. Samodzielnie zdecydujesz więc, co jest dla Ciebie ważniejsze oraz co pod kątem UX ma większą wartość dla Twojego klienta. Wszystko to zrobisz za pomocą niezbyt skomplikowanych komend. A to zaledwie jedna z funkcji ElasticSearch, która już bardzo ułatwia funkcjonowanie Twojego sklepu.

Poprawnie wdrożona wyszukiwarka ElasticSearch zapewnia niezwykle prostą i przyjemną obsługę strony www, aplikacji lub platformy e-commerce.  Z tego względu cieszy się ona rosnącą popularnością wśród programistów oraz właścicieli internetowych biznesów. Dzięki swojej elastyczności i możliwości dostosowania kodu do ElasticSearch jest to narzędzie, z którego warto skorzystać, aby osiągnąć wymierne efekty!

Cyfrowe newsy / Bądź na bieżąco

Od początku 2022 roku wchodzimy w skład Unity Group. Teraz zapisując się do naszego newslettera, będziesz na bieżąco z informacjami całej naszej organizacji.

    Wypełniając formularz wyrażasz zgodę na wysyłkę newslettera przez Unity S.A. z siedzibą we Wrocławiu. Zgodę możesz wycofać w każdej chwili. Więcej informacji na ten temat znajdziesz w naszej polityce prywatności.

    *Wymagane

    Andrzej-kurs-programowania

    Andrzej Szylar

    Chief Executive Officer

    E-mail:

    andrzej.szylar@unitygroup.com
    Magda2

    Magdalena Paczyńska-Kamienik

    HR Manager

    E-mail:

    magdalena.paczynska@unitygroup.com
    Aleksandra

    Aleksandra Bielawska-Clegg

    HR Business Partner

    E-mail:

    Michal

    Michał Duława

    New Business Developer

    E-mail:

    Katarzyna

    Katarzyna Zajchowska

    Marketing Partner

    E-mail: