Studopediya

КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

Лекция анализ 4. Корелация

Концепцията на корелация. В някои случаи е важно да се знае какво е връзката между изменението на две или повече функции, дали две функции варират независимо един от друг, или един вариант характеристика, свързана с изменението на друга.

Има две категории на връзки (зависимости) между атрибути: функционални и корелационни (статистически).

Когато функционални зависимости за всяка стойност на една променлива съответства на определена стойност на друга променлива. Например, между радиуса на кръга (R) и периферията (С) има функционална връзка изразява с формулата:

C = 2pR

Когато съотношението свързва цифровата стойност на една променлива отговаря на набор от стойности на друга променлива. Например, между размера на торове и добив vnesennnyh има неоспорим отношения. Но това не означава, че определено количество тор, съответстващ на определена стойност на реколтата, той се запознава с няколко количества от реколтата.

По този начин, съответствието се появява само на средния за целия набор от наблюдения.

В биологията, най-често срещаните корелации, но не функционален. Изследването на връзката е от голямо практическо значение.

Видовете корелации. Когато положителна корелация отношения между знаците направо: с увеличение от една черта увеличава от друга. А отрицателна корелация отношения между знаците на обратното: чрез увеличаване на една функция, другите спадове.

В допълнение, се прави разграничение между права и извита корелация. Когато една права корелация равни стъпки да съответстват на една функция същото увеличение на други функции. В същото увеличените криволинейни корелационни съответства на една характеристика различните стъпки от други функции.

За да визуализирате типа на корелационен анализ обикновено са построени корелация решетка (Фигура 1).

Корелационният коефициент. Тъй като симптомите може да се измерва в различни единици, за да се оцени тяхната комбинация непредвидени прибягва до стандартно отклонение (Т) - отклонение на отделните версия на средното, изразена в броя на Sigma.

Установено е, че връзката може да бъде мярка за средната нормализирана отклонение на продукта от два признака:

Тази средна продукт има две ценни свойства:

1) нормализирани отклонения от средната продукт на два признака варира от 0 до 1; при липса на комуникация между характеристиките на тази работа е 0, когато функционалната връзка между характеристиките на тази работа е 1;

2) произведения на знака ще бъдат различни в зависимост от вида на комуникацията: положителен знак отговаря на пряка корелация е отрицателен - обратна връзка.



Фиг.1. опция Разпространение в масива на съответствието, когато корелации се различават в знак и магнитуд

Това е средната продукта от две нормализирани отклонения и получи името - коефициент на корелация:

където х I - стойността на опция една функция; - Средноаритметичната стойност на една функция; у, - стойността на опция друг статус; - Средноаритметичната стойност на друг знак; σ х - стандартно отклонение на една функция; σ Y - стандартно отклонение на друг знак; N - размер на извадката.

Горната формула е смислено. Работната формулата за изчисляване на коефициента на корелация е, както следва:

Коефициентът на определяне е квадрата на коефициента на корелация:

Той показва съотношението на комбинация, която се обяснява с конюгирането на вариация между анализирани черти.

Например, ако R = 0.7, тогава г 2 = 0,49, т.е., 49% от дисперсията се обясни с характерна черта на друг вариант.

Поради това, в случаите, когато «R» корелация под 0,7 трябва да се считат за средна или под средното ниво. Ако R> 0,7 корелация между счита за високо.

Оценка на надеждността на коефициент на корелация проба.

Надеждността на коефициента на корелация може да се измерва по три начина:

1) стойност «Т» съотношение. Агрегатите, чийто обем е по-голям от 100, коефициент «T» се изчислява по формулата:

Ако t≥t во нулевата хипотеза, че няма корелация, е отхвърлена.

С по-малки размери на пробите «Т» съотношение се изчислява, както следва:

2) Другият начин да се оцени надеждността на коефициента на корелация е да се обжалва пред специална таблица, която показва най-важните ценности на корелационни коефициенти за различен брой степени на свобода (DF = N-2). Ако коефициентът на емпирична корелация се оказа по-голяма от критичната корелацията се счита за точна на определено ниво на значимост;

3) Третият начин да се оцени валидността на трансферната стойност на «R» в «Z». Фактът, че разпределението на «R» съотношение до голяма степен се отклонява от нормалния. Стойността на «Z» разпределени почти нормално.

Трансфер «R» в «Z» се провежда на специална маса. Средната грешка за «Z» се изчислява, както следва:

След това се изчислява коефициентът «T» чрез формулата:

Ако стойността на «т» е по-малка от стандартната ставка не е доказана корелация.

Определяне на надеждността на разликата между «R» на. С помощта на «Z» можем да определим валидността на разликата между коефициентите на корелация:

Когато т> т во нулевата хипотеза на никаква разлика е отхвърлена.

доверителния интервал на коефициента на корелация в населението. Ако точността на коефициент на корелация проба се оказа от неговата средна грешка доверителен интервал може да се определи коефициента на корелация на населението (ρ).

За да се определи това, първият интервал на достоверност за «Z» (това се определя от факта, че разпределението на стойностите «R» асиметрично):

След това се превежда «Z» в «R» и получи последно доверителен интервал.

Коефициентът на корелация. Мерките за корелационните коефициенти само направо компонент на връзката между знаците. Всъщност, повечето от линковете по биология в една или друга степен са извити. Коефициентът на корелация (η) мерки, така праволинейни и криволинейни зависимост.

Ако η = R, след това връзката с права (линейни). Колкото по-«η» надвишава «R» г. (нелинейност) връзката по-силно изразени криволинейна.

За разлика от коефициента на корелация за двойката има два изчисляват корелационни връзки: една отразява зависимостта на "най" знак от знака "х" - п у / Х; друг показва зависимостта на знака "х" от знак "от" - п х / г. Колкото по-силна връзка, и колкото по-близо е до по-малко ясна разликата между η г / х и η х / г.

Друга разлика от коефициента на корелация е съотношението на стойността на съответствието не приема от -1 до +1 и 0-1. В тази връзка, формата трябва да се определя от появата на корелация масив.

Коефициентът на корелация е частното, получено чрез разделяне на стандартното отклонение, което е характерно за промяната се дължи на първите признаци на зависимостта си от втората черта (σ г / х) на стандартното отклонение от общата вариабилност на първия знак (σ ш):

Оценка на надеждността на коефициента на корелация се препоръчва за своя квадрат, като се използва точен тест на Фишер:

Къде:

K - броят на класовете в редица вариации

N - размер на извадката (брой двойки наблюдения)

Теоретичната стойност на F взето на:

DF = 1 K-1

DF = 2 Nk

Ако емпиричната стойност на F над съотношение F 05 корелация значително.

Критерии връзка нелинейност. Абсолютно ясно отношения в областта на биологията е толкова рядко, колкото по-строго нормално разпределение на признака. На практика, незначителни отклонения от линейна връзка не могат да бъдат взети под внимание и да използват линейни методи, за да се улесни анализа на връзката между функциите.

Важно е, обаче, да премине прага, при който отклонение от линейна връзка става съществено значение. За това и прилага критериите за връзка на нелинейност. Обикновено се използва две от тези критерии:

1) критерий Blackman (В):

където:

N - размер на извадката

η 2 - по-голямата от двете корелации

R - коефициент на корелация

2) тествате Фишър (F):

където:

к х - броят на класовете в редица функция "х"

N - размер на извадката

η г / х 2 - един от техните корелации

Изчислената стойност на F се сравнява по обичайния начин с фиксирана стойност, когато броят на степените на свобода:

DF 1 = к х -2

DF 2 = Nk х

критерий на Fisher, се счита за по-точна.

Корелация и причинност. Ако корелация е доказано, то това означава, че е налице извънредни ситуации в знаците на вариации. Но този факт не може да се направи извод за причинно-следствена връзка между изследваните черти.

Понякога връзката между симптоми могат да се дължат на чисто случайни причини, свързани с избора на материал за изследване.

Това е възможно да се установи връзка между характеристиките, защото функциите, взети от една част на друга функция или и двете са части от една трета характеристика.

Multiple и частична корелация. Множествена корелация - зависимостта на стойността на "х" знак от едновременни промени в няколко други признаци: «у», «Z», и т.н.

Нека три функции "х", "Y" и "Z» корелира с друг. Техните цени са проста корелация: R XY, R XZ и R YZ.

Private корелация - оценка на връзката между знаци "Х" и "У", като се изключва влиянието на третата особеност, например «Z».

Частично корелация се използва широко в биология за отстраняване на съотношенията между различните параметри, например влиянието на възрастта.

Формулите за изчисляване:

Точката в индекса индексът показва признак на влиянието на които трябва да бъдат изключени от съотношението на другите два знака.

Същият метод се прилага за отстраняване на 2 стойности при 4 променливи

Грешката на разликата между средното аритметично, когато съществува взаимна връзка. Ако доказано съществуването на връзка между спрямо общата проба, грешка на разликата се изчислява poformule:

Това означава, че разликата между средната грешка в присъствието на съответствието ще бъде малко по-малко.

Непараметрични корелация изчислява. Използва се, за да се оцени съответствието на функции, които се изразяват или в някоя скала, обикновено номинално или редни, интервал и ако това е законът на разпределение на случайната променлива.

Тези критерии включват: Chuprov коефициент на корелация, коефициент на корелация ранг на Spearman.

Chuprov коефициент на корелация. Той се използва за оценка на степента на извънредни ситуации, качествени характеристики, изразени в номиналната скала. Всеки един от признаците може да има няколко условия (състояния). Първоначално построен корелация решетка. След това, за всяка стойност на емпиричната честотата на възникване изчислява теоретичната стойност при липса на връзка между знаци. В резултат на това, с помощта на теста хи-квадрат, за да се оцени надеждността на този фактор.

където "а" брой на модалности на първия знак, «б» - брой modalnoey втората функция.

Ако:

корелация счита за точна (нулевата хипотеза е отхвърлена) и изчислената стойност на R а з.

коефициент на корелация ранг на Spearman. Той се използва за оценка на осигурителния, които се изразяват в редни везни или интегрирани.

Първите признаци на стойностите, превърнати в класове. коефициент на корелация на Spearman, се определя по формулата

,

където R 1 и R 2 - степени двама герои в I-ия обект; N - брой обекти, които се проучват.

коефициент на корелация на Spearman се нормализира в диапазона от -1 до 1. Надеждността на този показател се изчислява по формулата:

,

където Т - ток критерий Student, който трябва да бъде в сравнение с масата на определено ниво на значимост, когато броят на степените на свобода DF = N -2.

Ако т> т во, конюгацията на две надеждни признаци (нулевата хипотеза за никаква връзка е изпускан).

<== Предишна лекция | На следващата лекция ==>
| Лекция анализ 4. Корелация

; Дата: 01.11.2014; ; Прегледи: 1036; Нарушаването на авторските права? ;


Ние ценим Вашето мнение! Беше ли полезна публикуван материал? Да | не



ТЪРСЕНЕ:


Вижте също:



zdes-stroika.ru - Studopediya (2013 - 2017) на година. Тя не е автор на материали, и дава на студентите с безплатно образование и използва! Най-новото допълнение , Al IP: 66.102.9.22
Page генерирана за: 0.058 сек.