Kalkulator odległości Levenshteina











Kalkulator do obliczania odległości Levenshteina, czyli miary odmienności konkretnych ciągów znaków (słów, wyrazów czy napisów jak kto woli). Sam algorytm obliczania został wynaleziony w 1965 roku przez rosyjskiego naukowca z dziedziny informatyki Władimira Lewensztejna. I właśnie od jego nazwiska wzięła się nazwa.

Szerzej jest to mało znana metoda, wykorzystywana w informatyce i lingwistyce, dzięki której można określić minimalną liczbę operacji edycyjnych, potrzebnych do przekształcenia jednej nazwy w drugą. Każda taka operacja, składa się z

1. Wstawienie jednego znaku w ciągu
2. Zamiana jedngo znaku na drugi
3. Usunięcie jednego znaku z ciągu

I teraz najlepiej pokazać to na przykładzie, wtedy dużo się rozjaśni o co tutaj chodzi.

Weźmy pierwszy przykład. Mamy dwa napisy:

drzewo
drzewo

Tutaj odległość Levenshteina między napisami będzie wynosiła 0, no bo przecież są to dwa takie same wyrazy i nie trzeba trzeba przeprowadzać żadnych operacji w celu zmiany jednego słowa w drugie.

Teraz kolejny. Zmieńmy nieznacznie pierwszy napis:

drzewko
drzewo

W tym przypadku, żeby przeprowadzić proces przekształcenia pierszego napisu w drugi, trzeba wykonać jedną operację - dodać literę k. Więc tutaj odległość wyniesie 1

Weźmy jeszcze inny przykład. Dwa napisy:

drzewka
drzewo

Tutaj zachodzą dwie operacje, musimy dodać literę k oraz zamienić literę o na a. Tutaj wynikiem działania algorytmu odległości Levenshteina będzie 2.

W taki sposób to działa. Jest to bardzo przydatne przy wyłapywaniu literówek słów, w informatycznych bazach danych, słownikach i wiele innych. Zwłaszcza jeśli istnieje potrzeba porównania ze sobą, dwóch dłuższych ciągów znaków. Powyższy kalkulator potrafi porównać, dwa słowa z polskimi znakami oraz rozróżnia małe i duże litery.