Balance: 0.00
Авторизация
Демонстрационный сайт » Рефераты » Математика (Рефераты) » Элементы корреляционного и регрессионного анализа
placeholder
Openstudy.uz saytidan fayllarni yuklab olishingiz uchun hisobingizdagi ballardan foydalanishingiz mumkin.

Ballarni quyidagi havolalar orqali stib olishingiz mumkin.

Элементы корреляционного и регрессионного анализа Исполнитель


 корреляционного и регрессионного анализа~.docx
  • Скачано: 27
  • Размер: 168.24 Kb
Matn

Элементы корреляционного и регрессионного анализа

План:

  1. Виды зависимостей между случайными величинами.
  2. Условные средние и выборочные уравнения регрессии.
  3. Нахождение выборочного уравнения регрессии по несгруппированным данным.
  4. Корреляционная таблица.
  5. Нахождение выборочного уравнения регрессии по сгруппированным данным.

Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики и предназначены для изучения по выборочным данным статистической зависимости случайных величин. Две случайные величины могут быть связаны либо функциональной зависимостью, либо статистической зависимостью, либо быть независимыми.

Если каждому возможному значению случайной величины  соответствует одно возможное значение случайной величины , то  называется функцией случайного аргумента :

,

а зависимость между случайными величинами  и  называется функциональной зависимостью.

Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин, т.е. такие факторы, которые воздействуют как на , так и на . В этом случае возникает статистическая зависимость. Статистической называется зависимость, при которой изменение одной из величин влечет изменение распределения другой. Частным случаем статистической зависимости является корреляционная зависимость.

Если статистическая зависимость проявляется в том, что при изменении одной из рассматриваемых случайных величин изменяется среднее значение другой случайной величины, то такая статистическая зависимость называется корреляционной.

Приведем пример случайной величины , которая не связана с величиной  функционально, а связана корреляционно. Пусть  — урожай зерна,  — количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т.е.  не является функцией от . Это объясняется влиянием случайных факторов, таких, как осадки, температура воздуха и др. С другой стороны, средний урожай является функцией от количества удобрений, т.е.  связан с  корреляционной зависимостью.

Условным средним  называется среднее арифметическое наблюдавшихся значений , соответствующих . Например, если при  величина  приняла значения , , , то условное среднее равно .

Условным средним  называется среднее арифметическое наблюдавшихся значений , соответствующих .

Как видно из определения, условное среднее  является функцией от ; обозначив эту функцию через , получим уравнение

                                                .                                       (14.1)

Это уравнение называется выборочным уравнением регрессии  на ; функция  называется выборочной регрессией  на , а ее график — выборочной линией регрессии  на .

Аналогично уравнение

                                                                                        (14.2)

называется выборочным уравнением регрессии  на ; функция  называется выборочной регрессией  на , а ее график — выборочной линией регрессии  на .

В связи с вышеизложенным возникают две задачи теории корреляции. Первая — нахождение по данным наблюдений параметров функций  и  при условии, что известен их вид. Вторая — оценка силы (тесноты) связи между случайными величинами  и  и установление наличия корреляционной зависимости между этими величинами.

Пусть изучается система количественных признаков . В результате  независимых опытов получены  пар чисел , , ... , .

Найдем по данным наблюдений выборочное уравнение прямой линии регрессии. Для определенности будем искать уравнение

                                                                                      (14.3)

регрессии  на .

Поскольку различные значения  признака  и соответствующие им значения  признака  наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому уравнение (14.3) можно записать следующим образом:

                                               .                                       (14.4)

Угловой коэффициент прямой линии регрессии  на  называется выборочным коэффициентом регрессии  на  и обозначается через . Следовательно, искомое выборочное уравнение (14.4) прямой линии регрессии  на  следует искать в виде

                                             .                                     (14.5)

Нужно найти такие параметры  и , при которых точки  , , ... , , построенные по данным наблюдений, на плоскости  лежали как можно ближе к прямой (14.5).

Для осуществления этого воспользуемся методом наименьших квадратов. При использовании этого метода сумма квадратов отклонений  (), где  — вычисленная по уравнению (14.5) ордината, соответствующая наблюдаемому значению , а  — наблюдаемая ордината, соответствующая , должна быть минимальной. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров:

                                                                (14.6)

или

          {spoiler=Подробнее}                      .                      (14.7)

Для отыскания минимума приравняем нулю соответствующие частные производные:

                             .                   (14.8)

Решив эту систему двух линейных уравнений относительно  и , найдем искомые параметры:

          ; (14.9)

   . (14.10)

Аналогично можно найти выборочное уравнение прямой линии регрессии  на :

                                           ,                                    (14.11)

где  — выборочный коэффициент регрессии  на .

Пример 1. Найти выборочное уравнение прямой линии регрессии  на  по данным  наблюдений:

Т а б л и ц а  14.1

  1,00 1,50 3,00 4,50 5,00
  1,25 1,40 1,50 1,75 2,25

Решение. Составим следующую расчетную табл. 14.2.

Найдем искомые параметры из соотношений (14.9) и (14.10):

;

.

Напишем искомое уравнение прямой линии регрессии  на :

.

Т а б л и ц а  14.2

       
1,00 1,25 1,00 1,250
1,50 1,40 2,25 2,100
3,00 1,50 9,00 4,500
4,50 1,75 20,25 7,875
5,00 2,25 25,00 11,250
=15 =8,15 =57,50 =26,975

При большом числе наблюдений одно и тоже значение  может встретится  раз, одно и тоже значение  —  раз, одна и та же пара чисел  может наблюдаться  раз. Поэтому данные наблюдений следует группировать, для этого подсчитываются частоты , , . Все сгруппированные данные записываются в виде таблицы (например, табл. 14.3), которая называется корреляционной.

Т а б л и ц а  14.3

     
10 20 30 40
0,4 5 7 14 26
0,6 2 6 4 12
0,8 3 19 22
  8 21 13 18  

В первой строке корреляционной таблицы 14.3 указаны наблюдаемые значения (10; 20; 30; 40) признака , а в первом столбце — наблюдаемые значения (0,4; 0,6; 0,8) признака . На пересечении строк и столбцов находятся частоты  наблюдаемых пар значений признаков.

В последнем столбце записаны суммы частот строк, а в последней строке — суммы частот столбцов. В клетке, расположенной в нижнем правом углу таблицы, помещена сумма всех частот, т.е. общее число всех наблюдений . Очевидно, что .

Теперь определим параметры выборочного уравнения прямой линии регрессии  на  в случае, когда получено большое число данных (практически для удовлетворительной оценки искомых параметров должно быть хотя бы 50 наблюдений), среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы.

Из системы (14.8) можно получить следующую систему:

                               .                    (14.12)

Для простоты приняв обозначения , , ,  и воспользовавшись соотношениями , , ,  (в предположении, что пара чисел  наблюдалась  раз), из (14.12) получаем

                                  .                      (14.13)

Второе уравнение системы (14.13) преобразуем к виду  и подставив правую часть этого равенства в уравнение , получим следующее соотношение

                                         .                            (14.14)

Учитывая соотношения (12.15) и (12.19), найдем из системы (14.13) выборочный коэффициент регрессии :

.

Умножим обе части этого равенства на дробь :

                                 .                      (14.15)

Обозначим правую часть равенства (14.15) через :

                                      .                           (14.16)

Тогда из (14.15) получаем

                                            .                                  (14.17)

Подставив правую часть этого равенства в (14.14), окончательно получим выборочное уравнение прямой линии регрессии  на  вида

                                       .                         (14.18)

Аналогично можно найти выборочное уравнение прямой линии регрессии  на :

                                       .                         (14.19)

Вопросы для повторения и контроля:

  1. Что изучают корреляционный и регрессионный анализ, как могут быть связаны случайные величины, что такое функция случайного аргумента и функциональная зависимость?
  2. Что вы знаете о статистической зависимости и корреляционной зависимости?
  3. Что такое условное среднее, выборочное уравнение регрессии, выборочная регрессия,  выборочная линия регрессии, и какие две задачи теории корреляции вы знаете?
  4. В каком виде ищется выборочное уравнение прямой линии регрессии по несгруппированным данным и что такое выборочный коэффициент регрессии?
  5. В чем суть метода наименьших квадратов и как с его помощью находится выборочное уравнение прямой линии регрессии?
  6. Что вы знаете о корреляционной таблице?
  7. Как находятся параметры выборочного уравнения прямой линии регрессии по сгруппированным данным?

Опорные слова:

Корреляционный анализ, регрессионный анализ, функция случайного аргумента, функциональная зависимость, статистическая зависимость, корреляционная зависимость, условное среднее, выборочное уравнение регрессии, выборочная регрессия,  выборочная линия регрессии, две задачи теории корреляции, выборочное уравнение прямой линии регрессии по несгруппированным данным, выборочный коэффициент регрессии, метод наименьших квадратов, корреляционная таблица, выборочное уравнение прямой линии регрессии по сгруппированным данным.{/spoilers}

Комментарии (0)
Комментировать
Кликните на изображение чтобы обновить код, если он неразборчив
Copyright © 2024 г. mysite - Все права защищены.