SlideShare a Scribd company logo
1 of 33
НОВІ МЕТОДИ СТАТИСТИЧНОГО
    МОДЕЛЮВАННЯ ТА ЇХ
  ЗАСТОСУВАННЯ В АНАЛІЗІ
     СКЛАДНИХ СИСТЕМ

       д.ф.-м.н., проф. Бахрушин В.Є.;
                   Дудко І.О.;
         к.ф.-м.н., доц. Ігнахіна М.О.
 Класичний приватний університет, Запоріжжя
       Vladimir.Bakhrushin@gmail.com


                    2012
1. ІДЕНТИФІКАЦІЯ МОДЕЛЕЙ СКЛАДНИХ
                 РОЗПОДІЛІВ

Завдання: визначити кількість компонент, їх тип та
  параметри розподілу.

1. Попередній аналіз із застосуванням методів
   кластерного аналізу й Р-Р діаграм статистичних
   пакетів (SPSS, Statistica тощо).
2. Вибір найпростішої з прийнятних моделей як
   початкового наближення.
3. Визначення параметрів моделі шляхом мінімізації
   критерію Колмогорова – Смирнова або Крамера –
   фон Мізеса.
4. Перевірка адекватності отриманої моделі.
     Для перевірки адекватності пропонується
використовувати як розрахункові значення
досліджуваних критеріїв, так і статистичні
властивості залишків цих моделей, зокрема
наявність їх автокореляції за критерієм Дарбіна –
Уотсона.
5. Якщо модель виявляється неадекватною,
ускладнення її шляхом зміни закону розподілу
компонент або їх кількості й повернення до п. 3.
Normal P-P Plot of VAR2010                                                Lognormal P-P Plot of VAR2010

                    1,0                                                                       1,0


                                                                                                                                                      Рейтинг
                                                                                                                                                      ARWU
                    0,8                                                                       0,8
Expected Cum Prob




                                                                          Expected Cum Prob
                    0,6                                                                       0,6




                    0,4                                                                       0,4




                    0,2                                                                       0,2




                    0,0                                                                       0,0
                          0,0      0,2      0,4     0,6       0,8   1,0                             0,0       0,2      0,4     0,6        0,8   1,0

                                         Observed Cum Prob                                                          Observed Cum Prob

                                Weibull P-P Plot of VAR2010                                                Pareto P-P Plot of VAR2010

                    1,0                                                                       1,0




                    0,8                                                                       0,8
                                                                          Expected Cum Prob
Expected Cum Prob




                    0,6                                                                       0,6




                    0,4                                                                       0,4




                    0,2                                                                       0,2




                    0,0                                                                       0,0
                          0,0      0,2      0,4     0,6       0,8   1,0                             0,0       0,2      0,4     0,6        0,8   1,0

                                         Observed Cum Prob                                                          Observed Cum Prob
Рейтинг ARWU




                                                                         2,57
                       24,5 
                                 2,47
                                           2                   24,2 
 2010:   F( x ) = 1 −       ÷                   F( x ) = 1 −       ÷
                                        009:                    x 
                       x 
                             2,68                                    2,63
   2                   24,0                                  24,2 
         F( x ) = 1 −       ÷           2007:   F( x ) = 1 −       ÷
008:                    x                                    x 
.




   2012:   F(R) = 0,73N ( 50,1;6,2 ) + 0,27N ( 79,3;12,5 )
   2        F(R) = 0,51N ( 61,6;5,3 ) + 0, 49N ( 79,9;12,5 )
009:
Функції розподілу World University Ranking
Вибори Президента
України, 2010



  Янукович




 Тимошенко
Результати ПР на
виборах до ВР
України у 2007 р.


 Центр + Північ




 Всі результати
Висновки за п. 1:

1. Поставлені    цілі  досягнуті,   але     потребує
   статистичного обґрунтування вибір критеріїв
   адекватності одержуваних моделей.
2. Для багатокомпонентних сумішей розподілів
   процедура мінімізації стає нестійкою через
   наявність декількох (багатьох) екстремумів
   цільового функціонала та його яружність.
Бахрушин В.Е. Проблемы идентификации моделей распределения случайных величин с применением
   современного программного обеспечения // Успехи современного естествознания. – 2011. – № 11.
    – С. 50 – 54.
Бахрушин В.Є. Статистичний аналіз університетських рейтингів // Освіта і управління. – 2011. – № 1. –
   С. 7 – 12.
Бахрушин В.Є., Ігнахіна М.О. Застосування емпіричних функцій розподілу в дослідженні соціально-
   економічних систем // Складні системи і процеси. – 2012. – № 1. – С. 103 - 111
2. НОВИЙ ПІДХІД ДО РОЗРАХУНКУ ВИБІРКОВОГО
          КОЕФІЦІЄНТА ДЕТЕРМІНАЦІЇ

Завдання: підвищити стійкість оцінок коефіцієнта
  детермінації, зробити можливим його розрахунок
  для немонотонних та неоднозначних статистичних
  зв’язків.

Для вирішення завдань пропонується:
1. Відмовитися від попереднього впорядкування
   даних у випадках, коли очікувана модель зв'язку є
   неоднозначною функцією.
2. Використовувати згладжування даних методом
   ковзних середніх для оцінювання значень моделі
   зв'язку.
КОЕФІЦІЄНТ ДЕТЕРМІНАЦІЇ
     (універсальний показник зв'язку для кількісних
                         ознак)
                                         2
                                        sε            1 n
              K d ( y; X ) = 1 −                         (        )
                                                                      2
                                                s2
                                                 y   = ∑ yk − y
                                        s2
                                         y
                                                      n k =1
            1 n
                 (              )
                                    2
1)
       2
      sε   = ∑ y i − f ( Xi )
                     ˆ
                       - у цьому випадку ми повинні
            n i =1
     мати рівняння зв'язку в явному вигляді; зазвичай
     таку форму використовують при перевірці
     адекватності регресійних моделей.
                     ν
         1 m 1 j
                         (              )
                                            2
     sε = ∑ ∑ yij − y j*
      2
2)       m j=1 ν j i =1              - у цьому випадку ми маємо
     здійснити               попереднє групування даних за
     змінною х.
1 n
                                       (              )
                                                          2
                              s ε = ∑ yi − f ( Xi )
                                2          ˆ
                                   n i =1




          ν
    1 m 1 j
              (       )
                          2
sε = ∑ ∑ yij − y j*
 2
    m j=1 ν j i =1
Нами запропоновано альтернативний підхід
до визначення коефіцієнта детермінації. Він
базується на застосуванні методу ковзних
середніх для оцінювання невідомих значень
функції зв'язку:
                         i+p
                         ∑ yj
            f ( Xi ) =
            ˆ            j=i− p
                         2p + 1

 де
              d = 2p + 1

  – є довжиною інтервалу згладжування .
R2 = 0,59; Kd1 = 0,94 –
0,95; Kd2 = 0,97 – 0,98




R2 = 0,0001; Kd1 = 0,96 –
0,97; Kd2 = 0,99
R2 = 0,03; Kd1 = 0,28 –
0,78; Kd2 = 0,87 – 0,98




R2 = 0,005; Kd1 = 0,05 –
0,09; Kd2 = 0,01 – 0,02
R2 = 0,02; Kd1 = 0,06 – 0,1; Kd2 = 0,06 – 0,1

Бахрушин В.Е. Методы оценивания характеристик нелинейных статистических связей // Системні
технології: Регіональний міжвузівський збірник наукових праць. Дніпропетровськ, 2011. - № 2(73). – С. 9
– 14.
3. НОВИЙ ПІДХІД ДО АВТО- ТА КРОС-
      КОРЕЛЯЦІЙНОГО АНАЛІЗУ ЧАСОВИХ РЯДІВ

Завдання: запропонувати методику авто- та крос-
  кореляційного аналізу даних, яка б була
  чутливою до нелінійних зв'язків.
Для      вирішення     завдань     пропонується
  використовувати як міру зв'язку вибірковий
  коефіцієнт детермінації. Розроблено відповідне
  програмне забезпечення.
Бахрушин В.Є., Павленко В.Є., Петрова С.В. Застосування показників нелінійної кореляції для
   побудови й аналізу крос-кореляційних функцій // Складні системи і процеси. – 2009, № 2. – С. 78 –
   85.
Бахрушин В.Е., Павленко В.Е., Петрова С.В. Применение выборочного коэффициента детерминации
   для построения и анализа кросс-корреляционных функций // Фундаментальные физико-
   математические проблемы и моделирование технико-технологических систем / Под ред. Ю.М.
   Соломенцева, Б.Н. Четверушкина, А.В. Боголюбова и др. – М.: МГТУ "СТАНКИН", Янус-К, 2010. –
   Вып. 13. – С. 4 – 12
Y = Asin(x) + ε
Y = Asin(x) + Bx + ε
Y = Aexp(|Bx|)sin(x) +
Cx + ε
Сталь       Нафта
                  Кокс        ПФТС




                Показники                           R2max            Kd max         Лаг
             Нафта – Сталь                          0,59              0,88            0
             Нафта – кокс                           0,38              0,90            1
        Нафта – індекс ПФТС                         0,42              0,84          –2
              Сталь – кокс                          0,55              0,91            1
         Сталь – індекс ПФТС                        0,37              0,82          –3
         Кокс – індекс ПФТС                         0,01              0,71          –6

Бахрушин В.Є., Биткін С.В., Літвин В.М., Нацюк І.М., Редько А.Г. Кореляції в динаміці індексу ПФТС й
цін на сталь та енергоресурси // Складні системи і процеси. – 2010. – № 2. – С. 78 – 82
Кореляція динаміки цін
  на кокс та індексу
  ПФТС




Крос-кореляція для пари
"Кокс – індекс ПФТС"
Обсяги промислового
 виробництва у 2001 –
       2011 р.




Крос-кореляція обсягів
    промислового
  виробництва США/
       Японія
Динаміка світових цін
         на метали в 2002 –
         2011 г.




       Крос-кореляція у динаміці
        цін на свинець та нікель


0,68
Висновки за п. 2, 3:

1. Запропонована методика дає змогу підвищити
   стійкість оцінок КД, а також розраховувати його
   для неоднозначних залежностей, але потребують
   подальшого дослідження методики визначення
   довірчих інтервалів для одержуваних значень
   коефіцієнта детермінації та оцінювання рівня їх
   значущості.
2. Для вирішення завдань авто- і крос-
   кореляційного аналізу часових рядів традиційна
   методика оцінювання КД є більш прийнятною,
   оскільки модифікована методика призводить до
   відсутності залежності КД від лагу (тобто зв’язок
   або є, або його немає при будь-якому лазі).
4. АНАЛІЗ НАЯВНОСТІ ДИФЕРЕНЦІАЛЬНИХ
             ЗВ'ЯЗКІВ МІЖ ДАНИМИ

Завдання: запропонувати методику визначення
  показника наявності диференціального зв'язку
  між даними.

Для     вирішення      завдань     пропонується
 використовувати коефіцієнт парної кореляції
 Пірсона між одним з досліджуваних рядів даних
 та іншим рядом, що одержують чисельним
 інтегруванням другого з досліджуваних рядів.
f1 ( x ) = kf 2 ( x ) + c
                                   '




y1i = a1f 2 ( x i ) + b1

y11 = f 2 ( x1 ) ;


                 ( ( ) ( ))(x
y1j = y1 j−1 + f1 x j−1 + f1 x j           j         )
                                               − x j−1 / 2; j = 2,...,n,


 R(y1 , f 2 )
f1 ( x ) = 2x + 5 + ε1   f 2 ( x ) = x + 5x − 2 + ε 2
                                    2
Температурні залежності внутрішнього тертя та похідної
     динамічного модуля нормальної пружності
        сплаву Nb – 12 ат. % W – 0,3 ат. % N
Висновки за п. 4:

1. Запропонована методика дає змогу оцінювати
   силу лінійного диференціального зв'язку, але
   потребують подальшого дослідження методики
   визначення довірчих інтервалів для одержуваних
   значень показника зв'язку та оцінювання його
   значущості.
Бахрушин В.Є. Критерій для перевірки гіпотези про наявність зв'язку типу f1 ( x ) = kf 2 ( x )
                                                                                       '
                                                                                               // Складні
   системи і процеси. – 2010, № 1. – С. 3 – 5.
Бахрушин В.Е. Статистический анализ дифференциальных связей в колебательных системах //
   Фундаментальные физико-математические проблемы и моделирование технико-технологических
   систем: Ежегодный сборник научных трудов, вып. 14. Труды второй международной конференции
   Моделирование нелинейных процессов и систем / Под ред. Л.А. Уваровой. – М.: Янус-К, 2011. – С.
   57 – 62
Дякую за увагу

More Related Content

Viewers also liked

Робота з файлами даних в R, блоки виразів, цикли, функції
Робота з файлами даних в R, блоки виразів, цикли, функціїРобота з файлами даних в R, блоки виразів, цикли, функції
Робота з файлами даних в R, блоки виразів, цикли, функціїVladimir Bakhrushin
 
Statistical analysis of university rankings
Statistical analysis of university rankingsStatistical analysis of university rankings
Statistical analysis of university rankingsVladimir Bakhrushin
 
Часові ряди: випадкова складова
Часові ряди: випадкова складоваЧасові ряди: випадкова складова
Часові ряди: випадкова складоваVladimir Bakhrushin
 
Статистичний аналіз ЗНО 2009 - 2011
Статистичний аналіз ЗНО 2009 - 2011Статистичний аналіз ЗНО 2009 - 2011
Статистичний аналіз ЗНО 2009 - 2011Vladimir Bakhrushin
 
Часові ряди: моделі
Часові ряди: моделіЧасові ряди: моделі
Часові ряди: моделіVladimir Bakhrushin
 
Cluster analysis using k-means method in R
Cluster analysis using k-means method in RCluster analysis using k-means method in R
Cluster analysis using k-means method in RVladimir Bakhrushin
 
Критерий максимакса
Критерий максимаксаКритерий максимакса
Критерий максимаксаVladimir Bakhrushin
 
Нові застосування статистичних методів в прикладних дослідженнях
Нові застосування статистичних методів в прикладних дослідженняхНові застосування статистичних методів в прикладних дослідженнях
Нові застосування статистичних методів в прикладних дослідженняхVladimir Bakhrushin
 
Критерий максимина
Критерий максиминаКритерий максимина
Критерий максиминаVladimir Bakhrushin
 

Viewers also liked (11)

Робота з файлами даних в R, блоки виразів, цикли, функції
Робота з файлами даних в R, блоки виразів, цикли, функціїРобота з файлами даних в R, блоки виразів, цикли, функції
Робота з файлами даних в R, блоки виразів, цикли, функції
 
Statistical analysis of university rankings
Statistical analysis of university rankingsStatistical analysis of university rankings
Statistical analysis of university rankings
 
Часові ряди: випадкова складова
Часові ряди: випадкова складоваЧасові ряди: випадкова складова
Часові ряди: випадкова складова
 
Статистичний аналіз ЗНО 2009 - 2011
Статистичний аналіз ЗНО 2009 - 2011Статистичний аналіз ЗНО 2009 - 2011
Статистичний аналіз ЗНО 2009 - 2011
 
Часові ряди: моделі
Часові ряди: моделіЧасові ряди: моделі
Часові ряди: моделі
 
Starting work with R
Starting work with RStarting work with R
Starting work with R
 
Функція plot() в R
Функція plot() в RФункція plot() в R
Функція plot() в R
 
Cluster analysis using k-means method in R
Cluster analysis using k-means method in RCluster analysis using k-means method in R
Cluster analysis using k-means method in R
 
Критерий максимакса
Критерий максимаксаКритерий максимакса
Критерий максимакса
 
Нові застосування статистичних методів в прикладних дослідженнях
Нові застосування статистичних методів в прикладних дослідженняхНові застосування статистичних методів в прикладних дослідженнях
Нові застосування статистичних методів в прикладних дослідженнях
 
Критерий максимина
Критерий максиминаКритерий максимина
Критерий максимина
 

More from Vladimir Bakhrushin

Decision-making on assessment of higher education institutions under uncertainty
Decision-making on assessment of higher education institutions under uncertaintyDecision-making on assessment of higher education institutions under uncertainty
Decision-making on assessment of higher education institutions under uncertaintyVladimir Bakhrushin
 
Якими бути стандартам вищої освіти для докторів філософії
Якими бути стандартам вищої освіти для докторів філософіїЯкими бути стандартам вищої освіти для докторів філософії
Якими бути стандартам вищої освіти для докторів філософіїVladimir Bakhrushin
 
Академічна автономія і трансформація української освіти
Академічна автономія і трансформація української освітиАкадемічна автономія і трансформація української освіти
Академічна автономія і трансформація української освітиVladimir Bakhrushin
 
Оптимізація в освіті і управлінні
Оптимізація в освіті і управлінні Оптимізація в освіті і управлінні
Оптимізація в освіті і управлінні Vladimir Bakhrushin
 
Українські університети: Сучасні виклики та можливі відповіді
Українські університети: Сучасні виклики та можливі відповідіУкраїнські університети: Сучасні виклики та можливі відповіді
Українські університети: Сучасні виклики та можливі відповідіVladimir Bakhrushin
 
Два проекти закону україни
Два проекти закону україниДва проекти закону україни
Два проекти закону україниVladimir Bakhrushin
 
Окремі аспекти реформування освіти України з погляду системного підходу
Окремі аспекти реформування освіти України з погляду системного підходуОкремі аспекти реформування освіти України з погляду системного підходу
Окремі аспекти реформування освіти України з погляду системного підходуVladimir Bakhrushin
 
Decision-making in education based on multi-criteria ranking of alternatives
Decision-making in education based on multi-criteria ranking of alternativesDecision-making in education based on multi-criteria ranking of alternatives
Decision-making in education based on multi-criteria ranking of alternativesVladimir Bakhrushin
 
Деякі проблеми прийняття рішень в освіті
Деякі проблеми прийняття рішень в освітіДеякі проблеми прийняття рішень в освіті
Деякі проблеми прийняття рішень в освітіVladimir Bakhrushin
 
Описова статистика в R
Описова статистика в RОписова статистика в R
Описова статистика в RVladimir Bakhrushin
 
Парадоксы голосования
Парадоксы голосованияПарадоксы голосования
Парадоксы голосованияVladimir Bakhrushin
 
Початок роботи в R: змінні, вектори та матриці
Початок роботи в R: змінні, вектори та матриціПочаток роботи в R: змінні, вектори та матриці
Початок роботи в R: змінні, вектори та матриціVladimir Bakhrushin
 
Часові ряди: основні поняття та характеристики
Часові ряди: основні поняття та характеристикиЧасові ряди: основні поняття та характеристики
Часові ряди: основні поняття та характеристикиVladimir Bakhrushin
 

More from Vladimir Bakhrushin (19)

Decision-making on assessment of higher education institutions under uncertainty
Decision-making on assessment of higher education institutions under uncertaintyDecision-making on assessment of higher education institutions under uncertainty
Decision-making on assessment of higher education institutions under uncertainty
 
Якими бути стандартам вищої освіти для докторів філософії
Якими бути стандартам вищої освіти для докторів філософіїЯкими бути стандартам вищої освіти для докторів філософії
Якими бути стандартам вищої освіти для докторів філософії
 
Академічна автономія і трансформація української освіти
Академічна автономія і трансформація української освітиАкадемічна автономія і трансформація української освіти
Академічна автономія і трансформація української освіти
 
Оптимізація в освіті і управлінні
Оптимізація в освіті і управлінні Оптимізація в освіті і управлінні
Оптимізація в освіті і управлінні
 
Мій 2015
Мій 2015Мій 2015
Мій 2015
 
Українські університети: Сучасні виклики та можливі відповіді
Українські університети: Сучасні виклики та можливі відповідіУкраїнські університети: Сучасні виклики та можливі відповіді
Українські університети: Сучасні виклики та можливі відповіді
 
Два проекти закону україни
Два проекти закону україниДва проекти закону україни
Два проекти закону україни
 
Окремі аспекти реформування освіти України з погляду системного підходу
Окремі аспекти реформування освіти України з погляду системного підходуОкремі аспекти реформування освіти України з погляду системного підходу
Окремі аспекти реформування освіти України з погляду системного підходу
 
Decision-making in education based on multi-criteria ranking of alternatives
Decision-making in education based on multi-criteria ranking of alternativesDecision-making in education based on multi-criteria ranking of alternatives
Decision-making in education based on multi-criteria ranking of alternatives
 
Деякі проблеми прийняття рішень в освіті
Деякі проблеми прийняття рішень в освітіДеякі проблеми прийняття рішень в освіті
Деякі проблеми прийняття рішень в освіті
 
Закон про освіту
Закон про освітуЗакон про освіту
Закон про освіту
 
Описова статистика в R
Описова статистика в RОписова статистика в R
Описова статистика в R
 
Files,blocks and functions in R
Files,blocks and functions in RFiles,blocks and functions in R
Files,blocks and functions in R
 
Парадоксы голосования
Парадоксы голосованияПарадоксы голосования
Парадоксы голосования
 
Начало работы в R
Начало работы в RНачало работы в R
Начало работы в R
 
Початок роботи в R: змінні, вектори та матриці
Початок роботи в R: змінні, вектори та матриціПочаток роботи в R: змінні, вектори та матриці
Початок роботи в R: змінні, вектори та матриці
 
Часові ряди: основні поняття та характеристики
Часові ряди: основні поняття та характеристикиЧасові ряди: основні поняття та характеристики
Часові ряди: основні поняття та характеристики
 
Критерий Сэвиджа
Критерий СэвиджаКритерий Сэвиджа
Критерий Сэвиджа
 
Критерий Гурвица
Критерий ГурвицаКритерий Гурвица
Критерий Гурвица
 

Нові методи статистичного аналізу складних систем_ Львів 2012

  • 1. НОВІ МЕТОДИ СТАТИСТИЧНОГО МОДЕЛЮВАННЯ ТА ЇХ ЗАСТОСУВАННЯ В АНАЛІЗІ СКЛАДНИХ СИСТЕМ д.ф.-м.н., проф. Бахрушин В.Є.; Дудко І.О.; к.ф.-м.н., доц. Ігнахіна М.О. Класичний приватний університет, Запоріжжя Vladimir.Bakhrushin@gmail.com 2012
  • 2. 1. ІДЕНТИФІКАЦІЯ МОДЕЛЕЙ СКЛАДНИХ РОЗПОДІЛІВ Завдання: визначити кількість компонент, їх тип та параметри розподілу. 1. Попередній аналіз із застосуванням методів кластерного аналізу й Р-Р діаграм статистичних пакетів (SPSS, Statistica тощо). 2. Вибір найпростішої з прийнятних моделей як початкового наближення. 3. Визначення параметрів моделі шляхом мінімізації критерію Колмогорова – Смирнова або Крамера – фон Мізеса.
  • 3. 4. Перевірка адекватності отриманої моделі. Для перевірки адекватності пропонується використовувати як розрахункові значення досліджуваних критеріїв, так і статистичні властивості залишків цих моделей, зокрема наявність їх автокореляції за критерієм Дарбіна – Уотсона. 5. Якщо модель виявляється неадекватною, ускладнення її шляхом зміни закону розподілу компонент або їх кількості й повернення до п. 3.
  • 4. Normal P-P Plot of VAR2010 Lognormal P-P Plot of VAR2010 1,0 1,0 Рейтинг ARWU 0,8 0,8 Expected Cum Prob Expected Cum Prob 0,6 0,6 0,4 0,4 0,2 0,2 0,0 0,0 0,0 0,2 0,4 0,6 0,8 1,0 0,0 0,2 0,4 0,6 0,8 1,0 Observed Cum Prob Observed Cum Prob Weibull P-P Plot of VAR2010 Pareto P-P Plot of VAR2010 1,0 1,0 0,8 0,8 Expected Cum Prob Expected Cum Prob 0,6 0,6 0,4 0,4 0,2 0,2 0,0 0,0 0,0 0,2 0,4 0,6 0,8 1,0 0,0 0,2 0,4 0,6 0,8 1,0 Observed Cum Prob Observed Cum Prob
  • 5. Рейтинг ARWU 2,57  24,5  2,47 2  24,2  2010: F( x ) = 1 −  ÷ F( x ) = 1 −  ÷ 009:  x   x  2,68 2,63 2  24,0   24,2  F( x ) = 1 −  ÷ 2007: F( x ) = 1 −  ÷ 008:  x   x 
  • 6. . 2012: F(R) = 0,73N ( 50,1;6,2 ) + 0,27N ( 79,3;12,5 ) 2 F(R) = 0,51N ( 61,6;5,3 ) + 0, 49N ( 79,9;12,5 ) 009: Функції розподілу World University Ranking
  • 7. Вибори Президента України, 2010 Янукович Тимошенко
  • 8. Результати ПР на виборах до ВР України у 2007 р. Центр + Північ Всі результати
  • 9. Висновки за п. 1: 1. Поставлені цілі досягнуті, але потребує статистичного обґрунтування вибір критеріїв адекватності одержуваних моделей. 2. Для багатокомпонентних сумішей розподілів процедура мінімізації стає нестійкою через наявність декількох (багатьох) екстремумів цільового функціонала та його яружність. Бахрушин В.Е. Проблемы идентификации моделей распределения случайных величин с применением современного программного обеспечения // Успехи современного естествознания. – 2011. – № 11. – С. 50 – 54. Бахрушин В.Є. Статистичний аналіз університетських рейтингів // Освіта і управління. – 2011. – № 1. – С. 7 – 12. Бахрушин В.Є., Ігнахіна М.О. Застосування емпіричних функцій розподілу в дослідженні соціально- економічних систем // Складні системи і процеси. – 2012. – № 1. – С. 103 - 111
  • 10. 2. НОВИЙ ПІДХІД ДО РОЗРАХУНКУ ВИБІРКОВОГО КОЕФІЦІЄНТА ДЕТЕРМІНАЦІЇ Завдання: підвищити стійкість оцінок коефіцієнта детермінації, зробити можливим його розрахунок для немонотонних та неоднозначних статистичних зв’язків. Для вирішення завдань пропонується: 1. Відмовитися від попереднього впорядкування даних у випадках, коли очікувана модель зв'язку є неоднозначною функцією. 2. Використовувати згладжування даних методом ковзних середніх для оцінювання значень моделі зв'язку.
  • 11. КОЕФІЦІЄНТ ДЕТЕРМІНАЦІЇ (універсальний показник зв'язку для кількісних ознак) 2 sε 1 n K d ( y; X ) = 1 − ( ) 2 s2 y = ∑ yk − y s2 y n k =1 1 n ( ) 2 1) 2 sε = ∑ y i − f ( Xi ) ˆ - у цьому випадку ми повинні n i =1 мати рівняння зв'язку в явному вигляді; зазвичай таку форму використовують при перевірці адекватності регресійних моделей. ν 1 m 1 j ( ) 2 sε = ∑ ∑ yij − y j* 2 2) m j=1 ν j i =1 - у цьому випадку ми маємо здійснити попереднє групування даних за змінною х.
  • 12. 1 n ( ) 2 s ε = ∑ yi − f ( Xi ) 2 ˆ n i =1 ν 1 m 1 j ( ) 2 sε = ∑ ∑ yij − y j* 2 m j=1 ν j i =1
  • 13. Нами запропоновано альтернативний підхід до визначення коефіцієнта детермінації. Він базується на застосуванні методу ковзних середніх для оцінювання невідомих значень функції зв'язку: i+p ∑ yj f ( Xi ) = ˆ j=i− p 2p + 1 де d = 2p + 1 – є довжиною інтервалу згладжування .
  • 14. R2 = 0,59; Kd1 = 0,94 – 0,95; Kd2 = 0,97 – 0,98 R2 = 0,0001; Kd1 = 0,96 – 0,97; Kd2 = 0,99
  • 15. R2 = 0,03; Kd1 = 0,28 – 0,78; Kd2 = 0,87 – 0,98 R2 = 0,005; Kd1 = 0,05 – 0,09; Kd2 = 0,01 – 0,02
  • 16. R2 = 0,02; Kd1 = 0,06 – 0,1; Kd2 = 0,06 – 0,1 Бахрушин В.Е. Методы оценивания характеристик нелинейных статистических связей // Системні технології: Регіональний міжвузівський збірник наукових праць. Дніпропетровськ, 2011. - № 2(73). – С. 9 – 14.
  • 17. 3. НОВИЙ ПІДХІД ДО АВТО- ТА КРОС- КОРЕЛЯЦІЙНОГО АНАЛІЗУ ЧАСОВИХ РЯДІВ Завдання: запропонувати методику авто- та крос- кореляційного аналізу даних, яка б була чутливою до нелінійних зв'язків. Для вирішення завдань пропонується використовувати як міру зв'язку вибірковий коефіцієнт детермінації. Розроблено відповідне програмне забезпечення. Бахрушин В.Є., Павленко В.Є., Петрова С.В. Застосування показників нелінійної кореляції для побудови й аналізу крос-кореляційних функцій // Складні системи і процеси. – 2009, № 2. – С. 78 – 85. Бахрушин В.Е., Павленко В.Е., Петрова С.В. Применение выборочного коэффициента детерминации для построения и анализа кросс-корреляционных функций // Фундаментальные физико- математические проблемы и моделирование технико-технологических систем / Под ред. Ю.М. Соломенцева, Б.Н. Четверушкина, А.В. Боголюбова и др. – М.: МГТУ "СТАНКИН", Янус-К, 2010. – Вып. 13. – С. 4 – 12
  • 18. Y = Asin(x) + ε
  • 19. Y = Asin(x) + Bx + ε
  • 20. Y = Aexp(|Bx|)sin(x) + Cx + ε
  • 21. Сталь Нафта Кокс ПФТС Показники R2max Kd max Лаг Нафта – Сталь 0,59 0,88 0 Нафта – кокс 0,38 0,90 1 Нафта – індекс ПФТС 0,42 0,84 –2 Сталь – кокс 0,55 0,91 1 Сталь – індекс ПФТС 0,37 0,82 –3 Кокс – індекс ПФТС 0,01 0,71 –6 Бахрушин В.Є., Биткін С.В., Літвин В.М., Нацюк І.М., Редько А.Г. Кореляції в динаміці індексу ПФТС й цін на сталь та енергоресурси // Складні системи і процеси. – 2010. – № 2. – С. 78 – 82
  • 22. Кореляція динаміки цін на кокс та індексу ПФТС Крос-кореляція для пари "Кокс – індекс ПФТС"
  • 23. Обсяги промислового виробництва у 2001 – 2011 р. Крос-кореляція обсягів промислового виробництва США/ Японія
  • 24. Динаміка світових цін на метали в 2002 – 2011 г. Крос-кореляція у динаміці цін на свинець та нікель 0,68
  • 25. Висновки за п. 2, 3: 1. Запропонована методика дає змогу підвищити стійкість оцінок КД, а також розраховувати його для неоднозначних залежностей, але потребують подальшого дослідження методики визначення довірчих інтервалів для одержуваних значень коефіцієнта детермінації та оцінювання рівня їх значущості. 2. Для вирішення завдань авто- і крос- кореляційного аналізу часових рядів традиційна методика оцінювання КД є більш прийнятною, оскільки модифікована методика призводить до відсутності залежності КД від лагу (тобто зв’язок або є, або його немає при будь-якому лазі).
  • 26. 4. АНАЛІЗ НАЯВНОСТІ ДИФЕРЕНЦІАЛЬНИХ ЗВ'ЯЗКІВ МІЖ ДАНИМИ Завдання: запропонувати методику визначення показника наявності диференціального зв'язку між даними. Для вирішення завдань пропонується використовувати коефіцієнт парної кореляції Пірсона між одним з досліджуваних рядів даних та іншим рядом, що одержують чисельним інтегруванням другого з досліджуваних рядів.
  • 27. f1 ( x ) = kf 2 ( x ) + c ' y1i = a1f 2 ( x i ) + b1 y11 = f 2 ( x1 ) ; ( ( ) ( ))(x y1j = y1 j−1 + f1 x j−1 + f1 x j j ) − x j−1 / 2; j = 2,...,n, R(y1 , f 2 )
  • 28. f1 ( x ) = 2x + 5 + ε1 f 2 ( x ) = x + 5x − 2 + ε 2 2
  • 29.
  • 30. Температурні залежності внутрішнього тертя та похідної динамічного модуля нормальної пружності сплаву Nb – 12 ат. % W – 0,3 ат. % N
  • 31.
  • 32. Висновки за п. 4: 1. Запропонована методика дає змогу оцінювати силу лінійного диференціального зв'язку, але потребують подальшого дослідження методики визначення довірчих інтервалів для одержуваних значень показника зв'язку та оцінювання його значущості. Бахрушин В.Є. Критерій для перевірки гіпотези про наявність зв'язку типу f1 ( x ) = kf 2 ( x ) ' // Складні системи і процеси. – 2010, № 1. – С. 3 – 5. Бахрушин В.Е. Статистический анализ дифференциальных связей в колебательных системах // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем: Ежегодный сборник научных трудов, вып. 14. Труды второй международной конференции Моделирование нелинейных процессов и систем / Под ред. Л.А. Уваровой. – М.: Янус-К, 2011. – С. 57 – 62