Думка експерта
Антикорупційна експертиза відео-звукозапису
Войовнича безграмотність – це ознака часу. Розумієш, не розумієш, але доцільність найголовніше. А якщо це антикорупційна справа – то це вже зазвичай.
До такого невтішного висновку я вкотре прийшов будучи захисником у антикорупційній справі, де стороною обвинувачення було призначено судову експертизу відео-звукозапису до Державного науково-дослідного експертно-криміналістичного центру МВС України (далі – ДНДЕКЦ МВС України).
Я почав вивчати цю експертизу, та побачив, що для ідентифікації диктора за голосом та мовленням було використано програмний комплекс «Sive Base» та методичні рекомендації до нього. Відповідно до ст.8 Закону «Про Судову експертизу» «Методики проведення судових експертиз (крім судово-медичних та судово-психіатричних) підлягають атестації та державній реєстрації в порядку, встановленому Кабінетом Міністрів України». Згідно з п.8 Порядку атестації та державної реєстрації методик проведення судових експертиз: «Державна реєстрація методик проводиться Мін’юстом, який є держателем Реєстру методик проведення судових експертиз (далі – Реєстр) і визначає організаційні та методологічні принципи його ведення». Я звернувся із запитом до Міністерства Юстиції, та отримав відповідь, що реєстрації у Реєстрі методик зазначених методичних рекомендацій немає. З цього випливає, що експертиза зроблена з порушенням чинного законодавства. Але розумію, що цього може бути замало для ВАКС (на жаль).
Працюю далі, та звертаюся з проханням до ДНДЕКЦ МВС України надати методичні рекомендації. Отримую відповідь від ДНДЕКЦ МВС України, що ця інформація – інформація з обмеженим доступом. Ага, секретний закон Ньютона!!!
Міркую так – гаразд, раз сторона обвинувачення розібралася з цією експертизою за відсутності методики до програмного комплексу «Sive Base» та їм все зрозуміло, то і я в дурнях не ходив ніколи. Спробую сам. Доходжу до результатів ідентифікаційного дослідження із застосуванням програмного забезпечення «Sive Base». Там для контрольного зразка та для зразка диктора побудовані гістограми висоти основного тону, максимальної гармоніки, тембру та частоти голосу, тобто чотири гістограми. Для кожної пораховані наступні статистичні характеристики.
1). Мінімум (тут усе зрозуміло) – це статистична характеристика, яка є найменшим значенням у наборі даних. У статистиці щонайменше використовується для опису нижньої межі значень у вибірці або генеральній сукупності.
2). Максимум (тут усе зрозуміло) – це статистична характеристика, яка є найбільшим значенням у наборі даних. У статистиці максимум використовується для опису верхньої межі значень у вибірці чи генеральній сукупності.
3). Значення (ЩО ЦЕ ТАКЕ????)– це скоріше за всього переклад з англійської терміну Mean. На українській мові – це перекладається як математичне очікування. Математичне очікування – це одна з основних характеристик випадкової величини, що показує середнє значення її значень.4). Статистична характеристика Відхилення. (ЩО МАВ НА УВАЗІ АВТОР, НУ ЯК ЗРОЗУМІТИ????) Як статистична характеристика, відхилення – це міра розкиду даних навколо їхнього середнього значення. Вона може бути виміряна за допомогою різних заходів, таких як дисперсія, стандартне відхилення та середнє абсолютне відхилення.Дисперсія – це середнє значення квадратів відхилень кожного від середнього значення вибірки.Стандартне відхилення – це квадратний корінь із дисперсії.Середнє абсолютне відхилення – це середнє значення абсолютних значень відхилень кожного значення середнього значення вибірки.ТАК В ДАНОМУ ВИПАДКУ ВІДХИЛЕННЯ ЦЕ ЩОСЬ З ВКАЗАНОГО, АБО ЩОСЬ ЗОВСІМ ІНШЕ?????5). Коефіцієнт асиметрії (тут усе зрозуміло) – це міра асиметрії форми розподілу ймовірності випадкової величини. Він визначає, наскільки сильно форма розподілу відрізняється від симетричної (нормальної). 6). Коефіцієнт ексцесу (тут усе зрозуміло) – це міра гостроти (крутості) вершини розподілу випадкової величини, яка показує, наскільки вершина розподілу «гостра» або «плоска» в порівнянні з вершиною нормального розподілу.
Порахувавши якимось чином усе це для кожної гістограми, експерт для кожної гістограми отримує наступні результати:
7). Збіги (ЩО ЦЕ ТАКЕ????) – це мабуть англійською статистична характеристика Convergence? Тоді це має назву – збіжність послідовності випадкових величин. Збіжність послідовності випадкових величин оцінюється з допомогою різних критеріїв, залежно від типу збіжності. Одним із найпоширеніших критеріїв є критерій Колмогорова-Смирнова для збіжності за розподілом. Для використання цього критерію необхідно спочатку визначити функції розподілу Fn(x) і F(x) кожної випадкової величини Xn і X відповідно, де F(x) – гранична функція розподілу. Потім необхідно обчислити статистику Dn, яка вимірює максимальне відхилення між Fn(x) і F(x) і перевірити, наскільки ймовірно, що Dn може бути отриманий випадковим чином. Якщо ймовірність мала, можна зробити висновок, що послідовність випадкових величин сходить до граничної функції розподілу F(x). Для збіжності можна використовувати критерій Колмогорова або критерій Чебишева, які вимірюють ймовірність того, що різниця між Xn і X перевищує задане граничне значення. Якщо ця ймовірність прагне нулю принаймні n прагне нескінченності, можна дійти висновку, що послідовність випадкових величин сходиться з ймовірності. Збіг майже напевно можна оцінити за допомогою закону великих чисел. Якщо послідовність випадкових величин задовольняє умові Чебишева чи умові Колмогорова, можна зробити висновок, що вона сходиться майже напевно. У середньому квадратичному збіжність оцінюється за допомогою нерівності Бесселя, яке вимірює середньоквадратичне відхилення між Xn і X. Якщо це відхилення прагне нулю принаймні n прагне нескінченності, можна дійти висновку, що послідовність випадкових величин сходиться у середньому квадратичному.
АЛЕ, Схожість послідовності випадкових величин не вимірюється у числових значеннях в інтервалі [0, 1]!!!!!!!!!!!!!!!!!!!!!!!!, як вказано у експертизі. ТОДІ ПРО ЩО ВЗАГАЛІ ЙДЕ МОВА???????
8). Кореляція (тут усе зрозуміло) – це статистична залежність між двома випадковими змінними. Вона показує, наскільки сильно дві змінні пов’язані між собою і в якому напрямку відбувається цей зв’язок. Але до чого тут вона? У даному випадку змінні випадкові? Та і є певна складність у розумінні. Так, наприклад, цим більше пожеж у місті, тим більше пожежних машин. Тобто є велика позитивна кореляція, але, наприклад, неможливо зменшити кількість пожеж, зменшуючи кількість пожежних машин. Тобто тут все трохи складніше, чим здається на перший погляд.
9). Відстань Кульбака-Лейблера (KL-відстань) (тут усе зрозуміло) – це міра розбіжності між двома імовірнісними розподілами. Вона може бути застосована для будь-яких двох розподілів, але вона найбільш корисна у випадках, коли ми хочемо порівняти два розподіли, які мають однакову носійну множину. Відстань Кульбака-Лейблера є НЕСИМЕТРИЧНОЮ функцією, тобто в ЗАГАЛЬНОМУ ВИПАДКУ ВІДСТАНЬ МІЖ РОЗПОДІЛАМИ P(X) І Q(X) НЕ ДОРІВНЮЄ ВІДСТАНІ МІЖ РОЗПОДІЛАМИ Q(X) ТА P(X). Ця властивість відбувається через те, що відстань Кульбака-Лейблера оцінює інформаційну втрату при використанні одного розподілу для наближення іншого, і в загальному випадку вона залежить від порядку цих розподілів. У зазначеної експертизі зовсім не зазначено, що було розраховано KL(p|q) чи KL(q|p). Зазначено KL дорівнює і значення. Розумій як хочеш.
Далі якимось дивним чином з чотирьох збігів, кореляцій та розбіжностей Кульбака-Лейблера вираховуються загальні результати, тобто збіг, кореляція та відстань Кульбака-Лейблера. А як це? Тобто кореляція висоти основного тону додається до кореляції максимальної гармоніки, до кореляції тембру та до кореляції частоти голосу, та ділиться на чотири. І що це в нас тоді виходить??? Антикорупційна нісенітниця у кубі (на мій погляд). Та потім, ще, Загальний коефіцієнт.
10). Взагалі то, Загальний коефіцієнт (також відомий як коефіцієнт лінійної кореляції або коефіцієнт кореляції Пірсона) – це міра ступеня лінійного зв’язку між двома випадковими змінними у статистиці. Загальний коефіцієнт кореляції Пірсона обчислюється як міра лінійного зв’язку між двома безперервними змінними.
Формула для розрахунку коефіцієнта кореляції Пірсона:
r = (n * Σxy – Σx * Σy) / (sqrt(n * Σx^2 – (Σx)^2) * sqrt(n * Σy^2 – (Σy)^2))
де:n – кількість спостережень чи пар значень двох змінних;
Σxy – сума добутків відповідних значень двох змінних;
Σx – сума значень першої змінної;
Σy – сума значень другої змінної;
Σx^2 – сума квадратів значень першої змінної;
Σy^2 – сума квадратів значень другої змінної.
АЛЕ!!!! Загальний коефіцієнт рахується не з збігів, кореляцій та розбіжностей Кульбака-Лейблера, а як зазначено у формулі зовсім з інших даних. Так для чого ми розраховували усе з 1го по 9ий пункт? Чи у даному випадку загальний коефіцієнт – це щось зовсім інше?
Так, як вишенька на торті у експертизі зазначено, що якщо загальний коефіцієнт більше або дорівнює 0.76, то параметри основного тону та його похідних збігаються, якщо менше або дорівнює 0.55, то ні. Ну з якого біса такий висновок? Вітром надуло? Між іншим, а яка достовірність методики? З якою вірогідністю можливо отримати помилково позитивний результат?
Як ми бачимо, дуже багато питань та жодних відповідей.
Як сторона обвинувачення усе зрозуміла для мене велика загадка.
Між іншим, що до обмеженого доступу до методики, як вказало ДНДЕКЦ МВС України.
Відстань Кульбака-Лейблера була введена в 1951 році в роботі «On Information and Sufficiency» авторів Карла Кульбака та Річарда Лейблера.
Загальний коефіцієнт кореляції Пірсона було запроваджено 1895 року англійським математиком Карлом Пірсоном у його роботі «Contributions to the Mathematical Theory of Evolution» .
Термін «кореляція» був введений французьким математиком Френсісом Гальтоном (Francis Galton) в 1888 році в його роботі «Co-relations and their measurement, chiefly from anthropometric data».
Сміх да і годі.
Я у порядку ст.160 КПК звернувся до ВАКС з клопотанням про тимчасовий доступ до зазначеної методики. Також додав клопотання про використання проектора, щоб усе це та багато іншого пояснити у презентації у першу чергу шановному суду. В перше у житті суд відмовив мені у дозволі використовувати проектор. Тоді, як кажуть, будуть слухати вухами.
Ми звісно звернемося до суду з клопотанням про трансляцію, але, не дивлячись на відкритість, шановний ВАКС може відмовити. Тому, запрошую як вільних слухачів усіх охочих (їх ВАКС поки не забороняє), у першу чергу, адвокатів та експертів 06.04.23 на 13:00 до приміщення ВАКС (просп. Берестейський, 41, м. Київ).
Такого Ви ще не бачили та можливо не побачите ніколи у житті. Чекаю на вас.
З повагою,
Адвокат ЮК «Амбер»
Семен Ханін