Studopediya

КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

Линеен и нелинеен регресионен

Двойки регресионен анализ

Регресионният анализ е един от основните методи в иконометрията. Нейната същност е да се идентифицира връзката между различни явления и показатели. Обикновено това са статистически зависимост. Тяхната особеност се състои в това, че моделът на събития и явления проявява само в масата на наблюдения. Освен статистическата математически комуникацията в допълнение към основния компонент, и да вземе предвид случаен компонент, който оказва значително влияние върху нивото на явленията или индекс. Статистическа комуникация се състои в това, че когато стойността на променливата фактор се променя разпределението на получената променлива, т.е. различни стойности на променливите X съответстват на различното разпределение на променливата величина - резултат черта, Х - фактор).

Корелация и регресионен анализ е статистическа техника се изучава подробно в иконометрията. Съотношение - специален случай на статистическа връзка, в която различните стойности на променливите X съответстват на различните средната стойност на променливата у. Връзката на корелация може да се определи като между количествени и качествени показатели между. Изследванията на връзката между количествените показатели се нарича регресионен анализ. Ако проучване на връзката между двете променливи, един от които може да се счита като X, и други подобни, като регресионен анализ се нарича чифт. През избран регресионен анализ математическа функция Y = F (X), което е най-добрият начин в съответства на оригиналните данни, т.е. Тя осигурява най-доброто сближаване на съответствието на полето. Съотношение поле - графика, показваща връзката между X и Y. Според формата, можете да прецени какво е по-подходящ математически отношения с първоначалните данни.

Математическият описание на зависимостта на средните промени в променливата под влиянието на променливата X се нарича уравнението на регресия удвоява. Най-често се използва линейно уравнение чифт регресия (по математическо уравнение на права линия у х = 0 + A 1 х, където 0 - безплатно срок на уравнението на регресия - като правило, отразява влиянието на случайни фактори, а 1 - коефициент на регресия, която показва на колко единици на променлив промяна в средното, когато промените променливите х с една единица). Смята се, че силата на въздействие на X на Y е постоянно за всички стойности на х. Знакът на коефициенти на регресия 1 съответства на посоката на връзката между Y и X: ако 1> 0, пряката връзка, ако 1 <0, връзката е обратна. Ако данните за източник има х нулева стойност, експонентата на 0 ще се отрази на средната стойност на Y, когато х = 0.



Ако връзката между х и у са нелинейни, а след това използвайте следната регресия уравнение:

ш х = 0 + 1 х + 2 х 2 - парабола от втори ред;

ш х = 0 - функция мощност;

ш х = 0 + 1 / х - хипербола, и т.н.

Всички нелинейни уравнения доведат до линейна форма (линеаризиран) чрез замяна на променливи или логаритми.

Параметрите на линейното уравнение се намират по метода на най-малките квадрати (OLS). Нейната същност е да се гарантира, че минималните между действителната стойност и стойността в момента, получена от уравнението, т.е.

,

където у, - действителната стойност на Y;

- Стойността, изчислена съгласно уравнението.

Ако вместо да замести уравнение му, ние получаваме следното условие за OLS:

Т.е. Тя трябва да осигури минимално количество на действителните стойности на квадрат отклонения на Y от своята теоретична стойност, изчислена на базата на уравнението на регресия.

За да се определят параметрите на 0 и 1, при която е (0, 1) отнема на минимална стойност, което се равнява на нула първите производни (частни) от тази функция:

За да се намери минимума на тези производни е необходимо да се равняват на нула; получаваме система от уравнения:

Разделянето на двете уравнения 2 и се умножава по п, ние получаваме трансформира системата от уравнения:

Разделяне двете страни на системата на N, ние получаваме система от уравнения нормални под формата:

След това може да се изрази както следва:

А е равна на:

Коефициентът б 1 се нарича селективна коефициент на регресия при х. 1 В показва колко единици на средната промяна в променливата с увеличаване на променливата X по един. може да се намери от следната формула, основана при условие, че - проба ковариация или време корелация, и - проба вариацията на х. След това.

Графично представяне на линията на регресия минава през точката с координати (), което следва от това състояние.

Пример. Според таблицата за намиране на регресия уравнение у по отношение на х, за да се определи коефициент на регресия сключи.

Таблица 1 дава информация за производителността на един работник (в кг) и мощност оборудване (кг) от данните, описващи процеса на производство на десетте компании.


Таблица 1

Изчислените данни за определяне на параметрите на математически функции

664/10 = 66.4; 908/10 = 90.8;

68/10 = 6.8; 94/10 = 9.4; () 2 = 9,4 2 = 88,36.

Заместването на получените стойности във формулата за изчисление на В 1:

б = 1 = 1.016.

б 0 = = 6,8-1,016 * 9,4 = -2,75.

Уравнението на регресия приема формата:

-2.75 + 1.016 х.

Стойност 1 б показва, че средното увеличение на оборудване капацитет на 1 кг производителност за единица време се увеличава с 1,016 кг.

При оценяване на необходимостта от оценка на съответствието на своята ограниченост. Meter ограниченост на комуникация е селективен коефициент на корелация R. Тя се определя като къде.

R показва колко стойност ще се промени средно, когато х се увеличава с една стойност.

Колкото по-близо връзката, толкова повече точки на съответствието на терена до линията на регресия.

R коефициент може да варира между 1 и 1, и знак показва посоката на комуникация. А отрицателна връзка R заден ход, с положителен - прав. Колкото по-близо R в абсолютна стойност до 1, толкова по-близо връзката. Обикновено се използва следната скала: при R = 0, че няма връзка, 0,1 <R <0,3 - връзка незначителен, 0,3 <R <0,5 - слабото звено, 0,5 <R <0,7 - средно връзка (умерено), 0,7 <R <1 - тясна връзка. И когато = 1 казват, че връзката е в пълно съответствие с функционалната зависимост на всички точки лежат точно на линията на регресия.

Освен горната формула има R 3 на неговата модификация:

;

;

,

Изчислено на базата на нашия пример, коефициентът на корелация между мощността на оборудване и изпълнение на работника. Ние се изчисли стойността на R съгласно формулата:

R =.

66,4; 6.8; 9.4.

1.56.

Определете. За да направите това, да направи таблица 2.

Таблица 2

Изчислените данни за определяне на параметрите на математически функции

= 33,6 / 10 = 3,36.

R = = 0,47.

По този начин, връзката е права, херметичността на връзката е слаба.

Следващата стъпка в анализа е да се провери значението на регресионно уравнение, което е да се установи дали на математическия модел, който изразява връзката между променливите х и у е достатъчно доказателства и дали тя е включена в променливите, за да опише момента.

тест уравнение значение регресия се извършва въз основа на анализ на промяната, същността на която се състои в това, че той винаги се спазва върховенството на добавяне на дисперсията, т.е. σ = +, където σ - общото разсейване - разсейването се дължи на регресия и остатъчната дисперсия, съответно.

ANOVA схема може да бъде представено в таблица 3.

Таблица 3

Схема анализ на промяната

вариацията Компоненти Сбор от квадрати Броят на степените на свобода средна квадратна
1. Регресия М-1
2. Остатъчен нм
3. Общо N-1

Къде - действителната стойност на Y;

- Стойности на у изчислява от уравнението на регресия;

п - общият брой на първоначалната информация;

м - брой променливи, включени в модела.

Остатъчен вариация показва влиянието на случайни фактори и неотчетени грешки. За да се оцени практическото значение на изчислява F-тест на Fisher. Този тест показва колко добре регресията оценява промяната в ш. Тя се определя от следните формули:

1. В случай на не-линейна връзка:

Получената стойност F в сравнение с масата за дадено ниво α и броят на степените на свобода K 1 = М-1, К = 2 пМ.

2. В случай на линейна връзка:

Значението на двойката линейна регресия уравнение може да се извърши чрез оценка на коефициента на регресия 1. Тази оценка се извършва с помощта на Т-тест на Стюдънт:

Получената стойност тон трябва да бъде по-голяма от критичната стойност на модул, посочен в таблицата. стойност A маса се определя при ниво на значимост 1-α и броят на степените на свобода н-2.

За сдвояване линеен модел може да се провери стойността на начина на използване на F-теста и с помощта на Т-тест. За тях, там е връзката: F = T 2.

Често за оценка на значимостта на корелационен коефициент на R. В същото време на базата на условията, когато няма връзка, равенството:

Следователно, ако значителен фактор R, след тона, определена от горната формула, трябва да бъде по-голямо от т, намерено в таблицата.

Ние дефинираме нашия пример значението на всички по-горе критерии.

Да започнем с това ние определяме ефективността на анализа на вариацията на маса:

σ = (5-6,8) 2 + (10-6,8) 2 + (10-6,8) 2 + (7-6,8) 2 + (5-6.8) 2 + (6- 6.8) 2 + (6-6,8) 2 + (5-6,8) 2 + (6-6,8) 2 + (8-6,8) 2 = 33.6 .

σ е =.

Дефиниране, т.е. теоретични стойности на Y, изчислени от уравнението на регресия

-2.75 + 1.016 х.

Заместването на х неговите конкретни стойности, получаваме:

= 5378; = 8,426; = 9,442; = 6,394; = 5378; = 5378; = 6,394; = 6,394; = 5378; = 9,442;

σ д == (5-5,378) 2 + (10-8,426) 2 + (10-9,442) 2 + (7-6,394) 2 + (5-5,378) 2 + (6-5,378) 2 + (6-6,394 ) 2 + (5-6,394) 2 + (6-5,378) 2 + (8-9,442) 2 = 8.39 .

Според правилото на добавяне на отклонения:

σ = σ д + σ R; σ R = σ- σ д = 33,6-8,39 = 25,21.

Ние дефинираме на F-тест Фишер:

F = = 24,04.

Таблично F при ниво на значимост α = 0,05 и броят на степените на свобода K 1 = М-1 = 2-1 = 1 и К = N-2 2 = 10-2 = 8:

Таблица F = 5,32.

Тъй като F изчислява> F маса, получената регресия уравнение може да се счита за значително.

Ние се провери значението на уравнението чрез Т-тест на Стюдънт:

Т =.

S 2 = = 3,73, S = 1,93.

т = = 2,6.

Също сравнение получената Т таблицата.

т = Таблица 2.3.

От тона, изчислено> т маса, уравнението на регресия може да се счита за значително.

Налице е също така оценка на адекватността на регресионния модел (регресия уравнение мярка за качество). Тя играе важна роля, когато изпълни прогнозата уравнение.

Експресията на качеството на уравнението на регресия е коефициентът на определяне, която се определя от формулата:

R 2 = R σ / σ = 1 σ E / σ.

Стойността на R 2 показва съотношението на вариация поради влиянието на променливата в променливата X. Коефициентът R 2 варира от 0 до 1. Колкото е 1, по-високото качество на регресия.

В нашия случай: R 2 = 25,21 / 33,6 = 0,75.

По този начин, промяната в производителността (у) от 75% се дължи на влиянието на промените в енергетичното оборудване.

В случай на обикновено линейна регресия: R 2 = R 2.

Връзката може да се открие не само между количествени променливи, и между качествено. Единственото условие е, че тези качествени променливи са редни (пореден). За да направите това, променливите са подредени в зависимост от тежестта на измерваната величина, т.е. присвоите ранг на 1, ..., и се определя от близостта на съответствието ранг. Тя се определя с използване на коефициент на корелация ранг Спиърман:

къде - в редиците на обекта и в променливите х и у;

п - брой наблюдения.

Тя варира от -1 до 1. знак показва посоката на комуникация. Ако = 1, това показва наличието на пълна връзка между X и Y.

Често, когато класира случай, че две или повече обекти са абсолютно равни, тогава те са възложени среден клас. Например:

п Стойността на х ранг
A
B
Най-
T

(1 + 2 + 3) / 3 = 2.

При тестване на значимостта на коефициента, определен от Т-тест на Student:

Ако т изчислява> т маса, критерият е значително Спиърман.

Пример. Има резултатите от тестването на 10 студенти в 2 дисциплини А и Б. Въз основа на тези точки бяха пуснати надолу класове. Изчислете Спиърман коефициент и оценява нейното значение при α = 0,05.

Таблица 4

Уверете се, че е важно:

Съгласно таблиците на алфа = 0.05 и к = N-2 = 8 Таблица Т = 2.3. От тона, изчислено> т маса, тогава коефициентът е значителен.

Излишно стойност = 0.763, показва наличието на дисциплини между A и B достатъчно тясна връзка с права.

<== Предишна лекция | На следващата лекция ==>
| Линеен и нелинеен регресионен

; Дата: 01.07.2014; ; Прегледи: 844; Нарушаването на авторските права? ;


Ние ценим Вашето мнение! Беше ли полезна публикуван материал? Да | не



ТЪРСЕНЕ:


Вижте също:



zdes-stroika.ru - Studopediya (2013 - 2017) на година. Тя не е автор на материали, и дава на студентите с безплатно образование и използва! Най-новото допълнение , Al IP: 66.102.9.22
Page генерирана за: 0.057 сек.