В днешното урокче ще разгледаме статистическите функции в Google Sheets. Статистическите функции играят важна роля при анализ на данни, особено когато работиш с по-големи данни. В този контекст ще научим как да изчисляваме средни стойности, мерки за разпръскване и връзки между данните. Този наръчник ще те проведе през най-важните функции и ще ти помогне да развиеш основно разбиране за описателната статистика.
Най-важните изводи
- Ще научиш как да изчислиш средната аритметична стойност, модата и медианата в Google Sheets.
- Ще получиш представа как се изчисляват квантилите, стандартното отклонение и дисперсията.
- Ще разбереш как да анализираш статистически връзки между различни набори данни.
Чеклик за чеклик инструкции
Въведение в статистическите функции
Първо трябва да разгледаме различните статистически функции в Google Sheets подобаващо. В Google Sheets можеш да щракнеш върху раздела "Функции", за да видиш множество категории, включително и статистически функции. Тези функции са от съществено значение, когато работиш с обширни набори от данни, за да получиш бързи и ефективни прозрения.

Изчисляване на средната стойност
Започваме с т.нар. статистически средни стойности. Аритметичната средна стойност, също известна като средно аритметично, е една от основните статистически мерки. За изчисляване на средната стойност можеш да използваш формулата AVERAGE. Допуснете, че си компания за потребителски стоки и искаш да изчислиш средния оборот от различни продуктови категории като перила, паста за зъби и шампоан.
За целта можеш да използваш формулата =AVERAGE(B2:B4), като B2 до B4 са клетките, които съдържат данните за оборота.

Мода и медиана
Друга важна мярка е модата, която определя най-често срещаната стойност в набора данни. Това можеш да постигнеш чрез формулата MODE, която може да работи и с текстове. Например можеш да определиш оборота за различни продукти, като филтрираш най-честите обороти.
Медианата ти показва стойността, която точно е в средата на данните ти, когато ги подредиш във възходящ ред. За изчисляване на медианата можеш да използваш формулата MEDIAN, като например =MEDIAN(B2:B4).

Изчисляване на квантили
Квантилите ти помагат да разбереш по-добре разпределението на данните. Можеш да изчислиш първия (0,25) и третия (0,75) квартил с формулата QUARTILE. Това ти дава ценни прозрения за разпределението на данните ти. Например можеш да използваш =QUARTILE(B2:B4, 1) за първия квартил.

Анализ на разпръскването
Стандартното отклонение е важно мярка за разпръскването на данните ти. Можеш да изчислиш стандартното отклонение с формулите STDEVP или STDEV. Стандартното отклонение ти помага да разбереш колко силно данните разпръскват около средната стойност. Например можеш да използваш =STDEV(B2:B4), за да изчислиш стандартното отклонение на оборотите си.

За изчисляване на дисперсията можеш да използваш формулата VAR.P, която дава дисперсията на популацията, като квадратираш стандартното отклонение. Така не само получаваш количествена стойност за разпръскването, но и имаш връзка с други статистически анализни методи.

Връзка между наборите данни
След като изчислиш местоположението и разпръскването на данните си, също е важно да разбереш дали има връзка между различни набори данни. Един пример може да бъде изследването на връзката между оборотите на перила и пастата за зъби. Можеш да изчислиш корелационния коефициент на Пиърсън чрез формулат CORREL, за да провериш дали има статистическа връзка.
Например би използвал =CORREL(A2:A4, B2:B4), като A2 до A4 представляват оборотите на перила, а B2 до B4 представляват оборотите на пастата за зъби. Стойност близо до 1 показва силна положителна връзка, докато стойност близо до -1 показва силна отрицателна връзка.

Ако искаш да анализираш още връзки, например между перилния прах и шампоана, можеш да последваш подобно действие, за да изследваш корелацията между тези продуктови категории.

Обобщение
В този урок научихте различни статистически функции в Google Sheets. Изчисляването на средно аритметично, модус, медиана и квантили, както и анализът на разпръскването като стандартно отклонение и дисперсия са от съществено значение за всяко статистическо анализиране. Освен това сте запознати с изследването на връзката между различни набори от данни, което ви помага да получите по-дълбоки познания за вашите данни.