v0.9 (b310)
Наблюдаю следующее:
Есть 6-минутная музыкальная композиция, из которой делаем две вырезки: первая вырезка - 5 минут с начала композиции, вторая - 3 минуты с конца.
При сравнении получаем следующие процентные результаты сходства:
5-минутная с начала и оригинал - 98,2%;
Оригинал и 3-минутная с конца - 2,3% (*)
5-минутная с начала и 3-минутная с конца - 4,6%
То же соотношение в 4,6% наблюдаю при сравнении:
Минуты с начала и 3 минут с конца
3 минут с начала и 3 минут с конца
5 мин 55 секунды с начала и 3 минут с конца (*)
Полагаю, результат в 4,6% в случаях отсутствия совпадающих частей композиции связан с используемыми при написании композиции инструментами (ритм одинаков, инструменты практически не меняются, редкие переходы), однако не понятны результаты, отмеченные звездочкой (*), где процентное сходство должно быть явно больше этих значений.
Сделал еще две вырезки из оригинала: первая - с 1 мин 00сек до 2 мин 00сек, вторая - с 1 мин 00сек по 5 мин 00сек. Они показывают совпадение только между собой 80,7%, при полном отсутствии совпадений с оригиналом и указанными в первой части сообщения файлами.