Kalkulator odległości Levenshteina
Kalkulator do obliczania
odległości Levenshteina, czyli miary odmienności konkretnych ciągów znaków (słów, wyrazów czy napisów jak kto woli). Sam algorytm obliczania został wynaleziony w 1965 roku przez rosyjskiego naukowca z dziedziny informatyki
Władimira Lewensztejna. I właśnie od jego nazwiska wzięła się nazwa.
Szerzej jest to mało znana metoda, wykorzystywana w informatyce i lingwistyce, dzięki której można określić
minimalną liczbę operacji edycyjnych, potrzebnych do przekształcenia jednej nazwy w drugą. Każda taka operacja, składa się z
1. Wstawienie jednego znaku w ciągu
2. Zamiana jedngo znaku na drugi
3. Usunięcie jednego znaku z ciągu
I teraz najlepiej pokazać to na przykładzie, wtedy dużo się rozjaśni o co tutaj chodzi.
Weźmy pierwszy przykład. Mamy dwa napisy:
drzewo
drzewo
Tutaj odległość Levenshteina między napisami będzie wynosiła
0, no bo przecież są to dwa takie same wyrazy i nie trzeba trzeba przeprowadzać żadnych operacji w celu zmiany jednego słowa w drugie.
Teraz kolejny. Zmieńmy nieznacznie pierwszy napis:
drzewko
drzewo
W tym przypadku, żeby przeprowadzić proces przekształcenia pierszego napisu w drugi, trzeba wykonać
jedną operację - dodać literę
k. Więc tutaj odległość wyniesie
1
Weźmy jeszcze inny przykład. Dwa napisy:
drzewka
drzewo
Tutaj zachodzą
dwie operacje, musimy dodać literę
k oraz zamienić literę
o na
a. Tutaj wynikiem działania algorytmu odległości Levenshteina będzie
2.
W taki sposób to działa. Jest to bardzo przydatne przy wyłapywaniu literówek słów, w informatycznych bazach danych, słownikach i wiele innych. Zwłaszcza jeśli istnieje potrzeba porównania ze sobą, dwóch dłuższych ciągów znaków. Powyższy kalkulator potrafi porównać, dwa słowa z polskimi znakami oraz rozróżnia małe i duże litery.