Аритметична медиана. Медиана

Медианата на триъгълника, подобно на височината, служи като графичен параметър, който определя целия триъгълник, стойността на неговите страни и ъгли. Три стойности: медиани, височини и ъглополовящи - това е като баркод на продукт, нашата задача е просто да можем да го преброим.

Определение

Медианата е отсечката, която свързва надморската височина и средната точка на противоположната страна. Триъгълникът има три върха и следователно три медиани. Медианите не винаги съвпадат с височини или ъглополовящи. Най-често това са отделни сегменти.

Средни свойства

  • Медианата на равнобедрен триъгълник, прекарана към основата, съвпада с височината и ъглополовящата. В равностранен триъгълник всички медиани съвпадат с ъглополовящите и височините.
  • Всички медиани на триъгълник се пресичат в една точка.
  • Медианата разделя триъгълника на два равни триъгълника, а три медиани на 6 равни триъгълника.

Равните повърхнини са триъгълници, чиито повърхнини са равни.

Ориз. 1. Три медиани образуват 6 равни триъгълника.

  • Пресечната точка на медианите ги разделя в съотношение 2:1, като се брои отгоре.
  • Медианата, прекарана към хипотенузата на правоъгълен триъгълник, е половината от хипотенузата.

Задачи

Всички тези свойства са лесни за запомняне, лесно се фиксират на практика. За по-добро разбиране на темата ще решим няколко проблема:

  • IN правоъгълен триъгълникса известни крака, които са равни на a=3 и b=4. Намерете стойността на медианата m, начертана към хипотенузата c.

Ориз. 2. Чертеж към проблема.

За да намерим стойността на медианата, трябва да намерим хипотенузата, тъй като медианата, прекарана към хипотенузата, е равна на половината от нея. Хипотенузата чрез Питагоровата теорема: $$a^2+b^2=c^2$$

$$c=\sqrt(a^2+b^2)=\sqrt(9+16)=\sqrt(25)=5$$

Намерете стойността на медианата: $$m=(c\over2)=(5\over2)=2.5$$ - полученото число е стойността на медианата.

Средните стойности в триъгълника не са равни. Следователно е необходимо да си представим каква точно стойност трябва да се намери.

  • В триъгълник са известни стойностите на страните: a=7; b=8; c=9. Намерете стойността на медианата надолу към страна b.

Ориз. 3. Чертеж към проблема.

За да разрешите този проблем, трябва да използвате една от трите формули, за да намерите медианата по страните на триъгълник:

$$m^2 =(1\над2)*(a^2+c^2-b^2)$$

Както можете да видите, основното тук е да запомните коефициента в скоби и знаците за стойностите на страните. Знаците са най-лесни за запомняне - винаги се изважда страната, на която е спусната медианата. В нашия случай това е b, но може да бъде и всяко друго.

Заменете стойностите във формулата и намерете средната стойност: $$m=\sqrt((1\over2)*(a^2+c^2-b^2))$$

$$m=\sqrt((1\over2)*(49+81-64))=\sqrt(33)$$ - оставете резултата като корен.

  • В равнобедрен триъгълник медианата, прекарана към основата, е 8, а самата основа е 6. Заедно с останалите две тази медиана разделя триъгълника на 6 триъгълника. Намерете площта на всеки от тях.

Медианите разделят триъгълника на шест равни. Това означава, че площите на малките триъгълници ще бъдат равни една на друга. Достатъчно е да намерите площта на по-голямото и да го разделите на 6.

Като се има предвид медианата, начертана към основата, в равнобедрен триъгълник това е ъглополовящата и височината. Така че триъгълникът има основа и височина. Можете да намерите района.

$$S=(1\над2)*6*8=24$$

Площ на всеки малък триъгълник: $$(24\over6)=4$$

Какво научихме?

Научихме какво е медианата. Определихме свойствата на медианата и намерихме решение на типични проблеми. Говорихме за основните грешки и разбрахме как бързо и лесно да запомним формулата за намиране на медианата през страните на триъгълник.

Тематическа викторина

Рейтинг на статията

Среден рейтинг: 4.7. Общо получени оценки: 87.

Квантилите са стойности, разделящи множеството на определен брой части, равни по брой елементи. Най-известните са медианата, квартилите, децилите, процентилите.

1) Най-известният квантил е Медиана ,разделяне на комплекта на две равни части. В допълнение към медианата често се използват квартили, разделящи класираната серия на 4 равни части, децили - 10 части и персентили - на 100 части.

Медиана за дискретна серия.

За определяне медиани в дискретна серияпърво пореден номер на медианата по формулата: и след това Оопредели коя стойност на характеристиката има кумулативна честота, равна на средното число.

Ако редът съдържа четен бройелементи, тогава медианното число ще бъде нецяло число и медианата ще бъде равна на средната стойност на двете стойности на характеристиките в средата . Номерът на първия от тези знаци е цялата част от медианното число, за втория - числото на медианата, закръглено до цяло число.

Медиана за интервални серии

При изчисляване на медианата за серия от интервални вариации първо се определя медианният интервал, в който се намира медианата.

За това:

1) числото на медианата се определя по формулата: ,

2) след това чрез натрупаната честота се определя интервалът, който включва елемент с такъв номер,

3) след това - стойността на медианата по формулата:

- е желаната медиана

- е долната граница на интервала, който съдържа медианата

- ширина на интервала (горна граница на интервала - долна граница)

- - сумата от честотите или броя на елементите в групата

Кумулативна честота на интервала, предхождащ медианата

- е честотата на средния интервал

Пример. Намерете модата и медианата за интервалната серия.

Решение:

1) Дефинирайте модата

В този пример модалният интервал е във възрастовата група от 25-30 години, тъй като този интервал представлява най-високата честота (1054).

Нека изчислим стойността на режима:

Това означава, че модалната възраст на студентите е 27 години.

2) Определете медианата.

Медианният интервал е във възрастовата група 25-30 години, тъй като в рамките на този интервал има вариант, който разделя населението на две равни части (Σf i /2 = 3462/2 = 1731). След това заместваме необходимите числени данни във формулата и получаваме стойността на медианата:

Това означава, че половината от студентите са на възраст под 27,4 години, а другата половина са над 27,4 години.


2) Квартили

Квартилипредставляват стойността на характеристиката, която разделя обхватната популация на четири части, равни по брой елементи.

Разграничете квартила от първи ред (долния квартил) , квартил от трети ред (горен квартил). Първият (долен) квартил отрязва ¼ от единиците с минимални стойности от съвкупността, а третият (горният) отрязва ¼ от единиците с максимални стойности, вторият квартил е медианата. Вторият квартил разделя населението на две равни части и е медианата.

За да изчислите квартили, можете да разделите вариационните серии по медианата на две равни части и след това да намерите медианата във всяка от тях.

напр.ако извадката се състои от 6 елемента, тогава вторият елемент се приема като начален квартил на извадката, а петият елемент се приема като долен квартил.

Медиана

Ако вариационната серия се състои, например, от 9 елемента, тогава аритъмът се приема като горен квартил. средната стойност на 2-ри и 3-ти елемент, а за долния аритм. средната стойност на 7-ия и 8-ия елемент.

Медиана

1-ви квартил 3-ти квартил

Изчисляване на квартили за дискретна серия:

Изчисляване на квартили за дискретна серия:

1. В дискретна серия първо определете числа (позиции) на квартили:

1-ва квартилна позиция

3-та квартилна позиция

2. Ако квартилното числое цяло число, тогава стойността на квартила ще бъде равна на стойността на елемента от серията, който има натрупана честота, равна на числото на квартила. Например, ако квартилното число е 20, неговата стойност ще бъде равна на стойността на характеристиката с S = 20 (кумулативна честота, равна на 20).

Ако квартилното числое нецяло число, тогава квартилът ще бъде условно число между две наблюдения. Квартилната стойност ще бъде сумата от стойността на елемента, за който натрупаната честота е равна на целочислената стойност на квартилното число, и определената част (нецяла част от квартилното число) от разликата между стойността на този елемент и стойността на следващия елемент.

Например, ако числото на квартила е 20,25, квартилът попада между 20-то и 21-во наблюдение и неговата стойност ще бъде равна на стойността на 20-то наблюдение плюс 1/4 (0,25) от разликата между стойността на 20-то и 21-ви наблюдения.

Изчисляване на квартили за интервална серия:

За да изчислите квартили за интервална серия:

1) Определете квартилното число,

2) Определете квартилния интервал,

3) Изчислете квартила, като използвате формулата:

Долната граница на интервала, съдържащ първия квартил. Интервалът се определя от натрупаната интервална честота
- долната граница на интервала, съдържащ третия квартил. Интервалът се определя от натрупаната интервална честота
- ширина на интервала
- акумулирана честота на интервала, предхождащ интервала, съдържащ първия квартил
- акумулирана честота на интервала, предшестващ интервала, съдържащ третия квартил
- честота на интервала, съдържащ първия квартил
- честота на интервала, съдържащ третия квартил

ТЕСТ

По темата: "Режим. Медиана. Методи за изчисляването им"


Въведение

Средните стойности и свързаните с тях показатели за вариация играят много важна роля в статистиката, което се дължи на предмета на нейното изследване. Затова тази тема е една от централните в курса.

Средната стойност е много често срещан обобщаващ показател в статистиката. Това се обяснява с факта, че само с помощта на средната стойност е възможно да се характеризира съвкупността според количествено вариращ признак. Средната стойност в статистиката е обобщаваща характеристика на набор от явления от един и същи тип според някакъв количествено вариращ признак. Средната стойност показва нивото на този атрибут, свързано с единицата от съвкупността.

Изучавайки социалните явления и стремейки се да идентифицират техните характерни, типични черти в конкретни условия на място и време, статистиците широко използват средните стойности. С помощта на средни стойности различните популации могат да се сравняват една с друга според различни характеристики.

Средните стойности, използвани в статистиката, принадлежат към класа на степенните средни. От средните мощности най-често се използва средноаритметичното, по-рядко средното хармонично; средната хармонична се използва само при изчисляване на средните темпове на динамика, а средната квадратична - само при изчисляване на вариационните показатели.

Средно аритметичното е частното от разделянето на сумата от опциите на техния брой. Използва се в случаите, когато обемът на променлив атрибут за цялата съвкупност се формира като сума от стойностите на атрибута за отделните му единици. Средноаритметичното е най-разпространеният вид средна стойност, тъй като тя съответства на естеството на социалните явления, където обемът на вариращите признаци в съвкупността най-често се формира именно като сума от стойностите на признака в отделни единици на населението.

Съгласно определящото си свойство хармоничната средна трябва да се използва, когато общият обем на атрибута се формира като сума от реципрочните стойности на варианта. Използва се, когато в зависимост от наличния материал теглата не трябва да се умножават, а да се разделят на опции или, което е същото, да се умножат по обратната им стойност. Средната хармонична стойност в тези случаи е реципрочната на средната аритметична стойност на реципрочните стойности на атрибута.

Средната хармонична стойност трябва да се използва в случаите, когато теглата не са единиците от съвкупността - носители на признака, а произведенията на тези единици и стойността на признака.


1. Дефиниция на режим и медиана в статистиката

Средните аритметични и хармонични са обобщаващите характеристики на съвкупността по един или друг променлив признак. Спомагателни описателни характеристики на разпределението на променлив атрибут са модата и медианата.

В статистиката модата е стойността на характеристика (вариант), която най-често се среща в дадена популация. В серията вариации това ще бъде вариантът с най-висока честота.

Медианата в статистиката се нарича вариант, който е в средата на вариационната серия. Медианата разделя серията наполовина, от двете й страни (нагоре и надолу) има еднакъв брой единици съвкупност.

Модата и медианата, за разлика от експоненциалните средни, са специфични характеристики, тяхната стойност е всеки конкретен вариант във вариационната серия.

Режимът се използва в случаите, когато е необходимо да се характеризира най-често срещаната стойност на характеристика. Ако е необходимо, например, да се установи най-често срещаната заплата в предприятието, пазарната цена, на която са продадени най-голям брой стоки, размерът на обувките, които са най-търсени сред потребителите и т.н., в тези случаи прибягват до модата.

Медианата е интересна с това, че показва количествената граница на стойността на променливата характеристика, която е достигната от половината от членовете на съвкупността. Нека средната заплата на банковите служители възлиза на 650 000 рубли. на месец. Тази характеристика може да бъде допълнена, ако кажем, че половината от работниците са получили заплата от 700 000 рубли. и по-висока, т.е. нека вземем медианата. Модата и медианата са типични характеристики в случаите, когато популациите са хомогенни и големи по брой.


2. Намиране на модата и медианата в дискретна вариационна серия

Намирането на режима и медианата във вариационна серия, където стойностите на атрибутите са дадени с определени числа, не е много трудно. Разгледайте таблица 1. с разпределението на семействата по броя на децата.

Таблица 1. Разпределение на семействата по брой деца

Очевидно в този пример модата ще бъде семейство с две деца, тъй като тази стойност на опциите съответства на най-голям бройсемейства. Може да има разпределения, при които всички варианти са еднакво често срещани, в който случай няма мода или, с други думи, може да се каже, че всички варианти са еднакво модални. В други случаи не една, а две опции могат да бъдат най-високата честота. Тогава ще има два режима, разпределението ще бъде бимодално. Бимодалните разпределения могат да показват качествената хетерогенност на популацията според изследваната черта.

За да намерите медианата в серия от дискретни вариации, трябва да разделите сумата от честотите наполовина и да добавите ½ към резултата. И така, при разпределението на 185 семейства по броя на децата, медианата ще бъде: 185/2 + ½ = 93, т.е. 93-та опция, която разделя наредения ред наполовина. Какъв е смисълът на 93-та опция? За да разберете, трябва да натрупате честоти, като започнете от най-малките опции. Сумата от честотите на 1-ва и 2-ра опция е 40. Ясно е, че тук няма 93 опции. Ако добавим честотата на 3-та опция към 40, тогава получаваме сумата, равна на 40 + 75 = 115. Следователно 93-тата опция съответства на третата стойност на променливия атрибут, а медианата ще бъде семейство с две деца .

Режимът и медианата в този пример съвпадат. Ако имахме четна сума от честоти (например 184), тогава прилагайки горната формула, получаваме броя на опциите за медиана, 184/2 + ½ = 92,5. Тъй като няма дробни опции, резултатът показва, че медианата е в средата между 92 и 93 опции.

3. Изчисляване на модата и медианата в интервалните вариационни серии

Описателният характер на модата и медианата се дължи на факта, че те не компенсират индивидуалните отклонения. Те винаги отговарят на определен вариант. Следователно режимът и медианата не изискват изчисления, за да ги намерят, ако всички стойности на характеристиката са известни. Въпреки това, в интервалните вариационни серии, изчисленията се използват за намиране на приблизителната стойност на модата и медианата в рамките на определен интервал.

За изчисляване на определена стойност на модалната стойност на знак, заграден в интервал, се използва следната формула:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Където X Mo е минималната граница на модалния интервал;

i Mo е стойността на модалния интервал;

fMo е честотата на модалния интервал;

f Mo-1 - честотата на интервала, предхождащ модалния;

f Mo+1 е честотата на интервала след модала.

Ще покажем изчислението на режима, като използваме примера, даден в таблица 2.


Таблица 2. Разпределение на работниците в предприятието според изпълнението на производствените норми

За да намерим модата, първо определяме модалния интервал на дадената серия. От примера се вижда, че най-високата честота съответства на интервала, където вариантът е в диапазона от 100 до 105. Това е модалният интервал. Стойността на модалния интервал е 5.

Замествайки числовите стойности от таблица 2. в горната формула, получаваме:

M o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) \u003d 108,8

Значението на тази формула е следното: стойността на тази част от модалния интервал, която трябва да бъде добавена към минималната му граница, се определя в зависимост от големината на честотите на предходния и следващите интервали. В този случай добавяме 8,8 към 100, т.е. повече от половината от интервала, тъй като честотата на предишния интервал е по-малка от честотата на следващия интервал.

Нека сега изчислим медианата. За да намерим медианата в интервалната вариационна серия, първо определяме интервала, в който тя се намира (средния интервал). Такъв интервал ще бъде този, чиято кумулативна честота е равна или по-голяма от половината от сбора на честотите. Кумулативните честоти се формират чрез постепенно сумиране на честотите, като се започне от интервала с най-малка стойност на характеристиката. Половината от сбора на честотите, които имаме, е 250 (500:2). Следователно, според таблица 3. средният интервал ще бъде интервалът със стойност на заплатите от 350 000 рубли. до 400 000 рубли.

Таблица 3. Изчисляване на медианата в интервалните вариационни серии

Преди този интервал сумата от натрупаните честоти беше 160. Следователно, за да се получи стойността на медианата, е необходимо да се добавят още 90 единици (250 - 160).

4. Мода. Медиана. Обща и извадкова средна стойност

Режимът е на екрана, медианата е в триъгълника, а средните са температурата в болницата и в отделението. Продължаваме нашия практически курс забавна статистика (Урок 1)изследване на централните характеристики статистическа съвкупност, чиито имена виждате в заглавката. И ще започнем от края му, т.к средни стойностиречта дойде почти от първите параграфи на темата. За напреднали читатели съдържание:

  • Обща и извадкова средна стойност– изчисление по първични данни и за генерираните дискретни вариационни редове;
  • Мода– определение и констатация за отделен случай;
  • Медиана– общо определение за това как да се намери медианата;
  • Средна стойност, режим и медиана на интервалната вариационна серия– изчисление от първични данни и от готова серия. Формули за режим и медиана,
  • Квартили, децили, процентили - накратко за основното.

Е, по-добре е „манекените“ да се запознаят с материала по ред:

Така че нека проучим някои населениеобем, а именно числовата му характеристика, няма значение отделенили непрекъснато (Уроци 2, 3).

Общо средно Наречен средно аритметичновсички стойности на този набор:

Ако числата са еднакви (което е характерно за дискретна серия) , тогава формулата може да бъде написана в по-компактна форма:
, Където
опцияповтарящи се пъти;
опция - пъти;
опция - пъти;

опция - пъти.

Пример за изчисление на живо средно общообразователносрещнах в Пример 2, но за да не съм скучен, дори няма да припомням съдържанието му.

По-нататък. Както си спомняме, обработката на цялата обща популация често е трудна или невъзможна и затова те се организират Представителвземане на проби сила на звука, като въз основа на изследването на тази извадка се прави заключение за цялата популация.

Примерна средна стойност Наречен средно аритметичновсички примерни стойности:

и при наличието на същите опции, формулата ще бъде написана по-компактно:
- като сбор от произведенията на варианта върху съответния честоти .

Средната извадка ни позволява точно да оценим истинската стойност на , което е напълно достатъчно за много изследвания. Колкото по-голяма е извадката, толкова по-точна ще бъде тази оценка.

Нека започнем практиката или по-скоро да продължим с дискретни вариационни сериии познатото условие:

Пример 8

Въз основа на резултатите от селективно проучване на цеховите работници са установени техните квалификационни категории: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5 , 5, 2, 3, 6, 5, 4, 6, 4, 3.

как решизадача? Ако ни се даде първични данни(първоначални необработени стойности), тогава те могат да бъдат глупаво сумирани и разделени на размера на извадката:
- средната квалификационна категория на работниците в цеха.

Но в много задачи се изисква съставянето на вариационна серия (см. Пример 4) :

- или тази серия е била първоначално предложена (което се случва по-често). И тогава, разбира се, използваме "цивилизованата" формула:

Мода . Режимът на дискретна вариационна серия е опцияс максимална честота. В такъв случай . Модата се намира лесно на масата и още по-лесно честотен диапазоне абсцисата на най-високата точка:


Понякога има няколко такива стойности (със същата максимална честота) и тогава всяка от тях се счита за мода.

Ако всички или почти всички настроикиразличен (което е характерно за интервални серии), тогава модалната стойност се определя по малко по-различен начин, който се обсъжда във 2-ра част на урока.

Медиана . Медиана на вариационната серия * - това е стойността, която го разделя на две равни части (според броя на опциите).

Но сега трябва да намерим средната стойност, модата и медианата.

Решение: да намеря средатаспоред първичните данни е най-добре да сумирате всички опции и да разделите резултата на обема на населението:
бърлога единици

Тези изчисления, между другото, няма да отнемат много време дори при използване на офлайн калкулатор. Но ако има Excel, тогава, разбира се, резултат във всяка свободна клетка =SUM(, изберете всички числа с мишката, затворете скобата ) , поставете знак за деление / , въведете числото 30 и натиснете Въведете. Готов.

Що се отнася до модата, нейната оценка въз основа на първоначални данни става неизползваема. Въпреки че виждаме едни и същи числа сред тях, но сред тях лесно може да има пет или шест или седем опции със същата максимална честота, например честота 2. Освен това цените могат да бъдат закръглени. Следователно модалната стойност се изчислява според генерираната интервална серия (повече за това по-късно).

Какво можете да кажете за медианата: включване в ексел =МЕДИАН(, изберете всички числа с мишката, затворете скобата ) и щракнете Въведете: . Освен това тук дори не е нужно да сортирате нищо.

Но в Пример 6сортирани във възходящ ред (запомнете и сортирайте - линк по-горе), и това е добра възможност да повторим формалния алгоритъм за намиране на медианата. Разделяме пробата наполовина:

И тъй като се състои от четен брой опции, медианата е равна на средноаритметичната стойност на 15-та и 16-та опция подреден(!) вариационна серия:

бърлога единици

Ситуация две. Когато е дадена готова интервална серия (типична учебна задача).

Продължаваме да анализираме същия пример с ботуши, където според първоначалните данни е съставен от IVR. Да изчисля средатанеобходими са средните точки на интервалите:

– да използвате познатата формула за дискретни случаи:

- отличен резултат! Несъответствието с по-точната стойност (), изчислена от първичните данни, е само 0,04.

Всъщност тук апроксимирахме интервалната серия с дискретна и тази апроксимация се оказа много ефективна. Тук обаче няма особена полза, т.к. със съвременния софтуер не е трудно да се изчисли точната стойност дори за много голям масив от първични данни. Но това е при условие, че са ни известни :)

С други централни индикатори всичко е по-интересно.

За да намерите мода, трябва да намерите модално разстояние (с максимална честота)- в този проблем това е интервал с честота 11 и използвайте следната грозна формула:
, Където:

е долната граница на модалния интервал;
е дължината на модалния интервал;
е честотата на модалния интервал;
– честота на предходния интервал;
– честота на следващия интервал.

По този начин:
бърлога единици - както можете да видите, "модерната" цена за обувки е забележимо различна от средната аритметична.

Без да навлизам в геометрията на формулата, просто ще дам хистограма на относителните честотии забележка:


откъдето ясно се вижда, че модата е изместена спрямо центъра на модалния интервал към левия интервал с по-висока честота. Логично.

За справка ще анализирам редки случаи:

– ако модалният интервал е екстремен, тогава или ;

- ако се открият 2 модални интервала, които са наблизо, например и , тогава разглеждаме модалния интервал , докато близките интервали (ляв и десен), ако е възможно, също се увеличават 2 пъти.

- ако има разстояние между модалните интервали, тогава прилагаме формулата към всеки интервал, като по този начин получаваме 2 или повече режима.

Ето такъв мод за изпращане :)

И медианата. Ако е дадена готова интервална серия, тогава медианата се изчислява с помощта на малко по-малко ужасна формула, но в началото е досадно (фройдистка печатна грешка :)) да се намери среден интервал - това е интервал, съдържащ вариант (или 2 варианта), който разделя вариационната серия на две равни части.

По-горе описах как да определя медианата, като се съсредоточавам върху относителни кумулативни честоти, тук е по-удобно да се изчислят "обикновените" натрупани честоти. Изчислителният алгоритъм е абсолютно същият - първата стойност се премахва отляво (червена стрелка), а всеки следващ се получава като сбор от предходния с текущата честота от лявата колона (зелени маркировки като пример):

Всички ли разбират значението на числата в дясната колона? - това е броят на опциите, които са успели да се "натрупат" на всички "преминали" интервали, включително текущия.

Тъй като имаме четен брой опции (30 броя), медианата ще бъде интервалът, който съдържа 30/2 = 15-та и 16-та опция. И фокусирайки се върху натрупаните честоти, е лесно да се стигне до извода, че тези опции се съдържат в интервала.

Формула на медианата:
, Където:
- обемът на статистическата съвкупност;
е долната граница на средния интервал;
е дължината на средния интервал;
честотасреден интервал;
кумулативна честота предишенинтервал.

По този начин:
бърлога единици – имайте предвид, че средната стойност, напротив, се оказа изместена надясно, т.к от дясната страна има значителен брой опции:


И за справка специални случаи.

Централната тенденция на данните може да се разглежда не само като стойност с нулево общо отклонение (средно аритметично) или максимална честота (режим), но също и като някакъв знак (стойност в популацията), който разделя класираните данни (сортирани във възходящ или низходящ ред ред) на две равни части. Половината от оригиналните данни са по-малко от този знак, а половината са повече. Това е, което е Медиана.

И така, в статистиката медианата е нивото на индикатора, което разделя набора от данни на две равни половини. Стойностите в едната половина са по-малки от, а в другата половина са по-големи от медианата. Като пример, разгледайте набор от произволни числа.

Очевидно при симетрично разпределение средата, разделяща съвкупността наполовина, ще бъде в самия център - на същото място като средното аритметично (и режим). Това е, така да се каже, идеална ситуация, когато модата, медианата и средната аритметична съвпадат и всичките им свойства попадат в една точка - максимална честота, бисекция, нулева сума на отклоненията - всичко на едно място. Животът обаче не е толкова симетричен, колкото нормалното разпределение.

Да предположим, че имаме работа с технически измервания на отклонения от очакваната стойност на нещо (съдържание на елементи, разстояние, ниво, маса и т.н. и т.н.). Ако всичко е наред, тогава отклоненията най-вероятно ще бъдат разпределени по закон, близък до нормалния, приблизително, както е на фигурата по-горе. Но ако има важен и неконтролируем фактор в процеса, тогава могат да се появят необичайни стойности, които значително ще повлияят на средното аритметично, но в същото време едва ли ще повлияят на медианата.

Извадковата медиана е алтернатива на средноаритметичната, т.к той е устойчив на аномални отклонения (отклонения).

математически медиен имоте, че сборът от абсолютните (по модул) отклонения от средната стойност дава минималната възможна стойност в сравнение с отклоненията от всяка друга стойност. Дори по-малко от средноаритметичното, о, как! Този факт намира своето приложение например при решаване на транспортни проблеми, когато е необходимо да се изчисли строителната площадка на съоръжения в близост до пътя по такъв начин, че общата дължина на полетите до него от различни места да е минимална (спирки, бензиностанции , складове и т.н., и т.н.).

Формула за медиана в статистиката за отделенданни донякъде напомня на модната формула. А именно фактът, че няма формула като такава. Средната стойност се избира от наличните данни и само ако това не е възможно, се извършва просто изчисление.

Първо, данните се класират (сортират се в низходящ ред). След това има два варианта. Ако броят на стойностите е нечетен, тогава медианата ще съответства на централната стойност на серията, чийто брой може да се определи по формулата:

Не, азе числото на стойността, съответстваща на медианата,

не броят на стойностите в набора от данни.

Тогава медианата се означава като

Това е първият случай, при който има една централна стойност в данните. Вторият вариант възниква, когато количеството данни е равномерно, т.е. вместо една има две централни стойности. Решението е просто: взема се средноаритметичната стойност на двете централни стойности:

IN интервални даннине е възможно да изберете конкретна стойност. Медианата се изчислява по определено правило.

Като начало (след класиране на данните) намерете среден интервал. Това е интервалът, през който преминава желаната средна стойност. Определя се с помощта на натрупаната част от класираните интервали. Там, където натрупаният дял за първи път надхвърля 50% от всички стойности, също има среден интервал.

Не знам кой е измислил медианната формула, но те очевидно изхождат от предположението, че разпределението на данните в медианния интервал е равномерно (т.е. 30% от ширината на интервала е 30% от стойностите, 80% от ширината е 80% от стойностите и т.н.) . Следователно, знаейки броя на стойностите от началото на средния интервал до 50% от всички стойности в популацията (разликата между половината от броя на всички стойности и натрупаната честота на предмедианния интервал) , можете да разберете какъв дял заемат в целия среден интервал. Този дял се пренася точно върху ширината на средния интервал, като се посочва конкретна стойност, по-късно наречена медиана.

Нека се обърнем към визуалната диаграма.

Оказа се малко тромаво, но сега, надявам се, всичко е ясно и разбираемо. За да не рисувате такава графика всеки път по време на изчислението, можете да използвате готовата формула. Формулата на медианата е:

Където x Аз- долната граница на средния интервал;

аз- средна ширина на интервала;

∑f/2- броят на всички стойности, разделен на 2 (две);

S (Me-1)- общият брой наблюдения, натрупани преди началото на средния интервал, т.е. акумулирана честота на премедианния интервал;

е аз- брой наблюдения в медианния интервал.

Както можете лесно да видите, формулата на медианата се състои от два члена: 1 - стойността на началото на медианния интервал и 2 - самата част, която е пропорционална на липсващия натрупан дял до 50%.

Например, нека изчислим медианата за следните данни.

Необходимо е да се намери средната цена, т.е. цената, която е по-евтина и по-скъпа от половината от количеството стоки. Като начало, нека направим спомагателни изчисления на натрупаната честота, натрупания дял, общия брой стоки.

Според последната колона „Натрупан дял“ определяме средния интервал - 300-400 рубли (натрупаният дял за първи път е повече от 50%). Ширина на интервала - 100 рубли. Сега остава да заместим данните в горната формула и да изчислим медианата.

Тоест, за половината от стоките цената е по-ниска от 350 рубли, за другата половина е по-висока. Всичко е просто. Средната аритметична стойност, изчислена от същите данни, е 355 рубли. Разликата не е съществена, но е.

Изчисляване на медианата в Excel

Медианата за числови данни е лесна за намиране с помощта на функцията на Excel, която се нарича като такава − МЕДИАНА. Друго нещо са интервалните данни. В Excel няма съответна функция. Следователно трябва да се използва горната формула. Какво можеш да направиш? Но това не е много трагично, тъй като изчисляването на медианата от интервални данни е рядък случай. Можете също да го изчислите на калкулатор.

И накрая, предлагам проблем. Има набор от данни. 15, 5, 20, 5, 10. Каква е средната стойност? Четири опции:

Режимът, медианата и средната стойност на извадката са различни начини за определяне на централната тенденция в извадка.



грешка:Съдържанието е защитено!!