|
W jaki sposób można zbadać podobieństwo ciągów znaków ? |
proponujemy skorzystać z następujących funkcji
http://php.net/manual/en/function.soundex.php
http://www.php.net/manual/en/function.levenshtein.php
http://www.php.net/manual/en/function.metaphone.php
http://www.php.net/manual/en/function.similar-text.php
Powyższe funkcje mozna zastosować np. do porównywania treści, do wykazania podobieństw pomiędzy zawartością 2 stron internetowych.
Jeśli mamy podejrzenie że jakaś strona internetowa kopiuje nasze treści możemy ściągnąć jej zawartość przez file_get_contents i to samo zrobić z naszą stroną.
Obie zawartości stron "przepuścić" przez w/w funkcje i określić podobieństwo np. w procentach.
Podobieństwo w zakresie 85-100% oznacza wysoką mozliwość, że ktoś skopiował naszą stronę.
Właśnie z takich mechanizmów korzystają serwisy służące do ochrony praw autorskich i zabezpieczające przed powielaniem treści.